David Christoffel a reçu Bernard Lechevalier dans son émission Métaclassique
David Christoffel a reçu Bernard Lechevalier dans son émission Métaclassique
Métaclassique

Emission Métaclassique : Générer

par David Christoffel | le 8 avril 2020

Au milieu des années 1820, Henri Berton reprochait à Rossini de faire de la musique trop mécanique. Le travail à la chaîne n’avait pas encore été théorisé par les grands industriels américains, qu’on reprochait déjà au compositeur d’avoir des procédés huilés comme une usine capables de générer un opéra en trois semaines. Deux siècles plus tard, il suffit de mettre un paquet de partitions d’un Bach, d’un Mozart ou d’un Rossini pour générer automatiquement d’autres œuvres dans le style dudit compositeur. Pour enquêter sur ce que l’intelligence artificielle peut générer en musique, David Christoffel a interrogé Philippe Esling (maître de conférences à Sorbonne-Université et chercheur à l’Ircam en intelligence artificielle musicale) et Léopold Crestel (chercheur au Laboratoire Sony CSL).

 

 

Extraits de l’émission :

 

David Christoffel : Dans les années 1980, le chercheur américain David Cope a fait générer par un ordinateur de faux morceaux de Chopin. Philippe Esling, qui est David Cope, et pouvez-vous nous expliquer ce qu’il a fait ? 

Philippe Esling : David Cope est précurseur dans le domaine de la génération automatique de musique. La génération musicale consiste généralement à construire un modèle, et à l’aide d’outils mathématiques, à structurer une musique nouvelle à partir de l’observation d’exemples. Cette méthode prévaut actuellement dans l’intelligence artificielle, fondée sur l’apprentissage automatique. David Cope utilise les « chaînes de Markov ». On peut considérer la musique comme une chaîne d’événements, ou une chaîne d’états, chaque état pouvant engendrer l’état suivant. L’hypothèse « markovienne », c’est qu’un état donné n’est déterminé que par l’état précédent. L’ensemble des états par lesquels on est passé n’importe pas : c’est l’état courant qui détermine l’état suivant.

Détails d'un ordinateur © Pixabay

Détails d’un ordinateur © Pixabay

Cope fait fonctionner une intelligence artificielle pour repérer des récurrences. Mais sur quel type de récurrences se concentre-t-il ? Comment une « chaîne de Markov » peut-elle être sensible, en musique, à des phénomènes de modulation, de taille d’un thème, ou à tout ce qui fait le style de Chopin ?

Généralement, on applique d’abord un ensemble d’opérations de prétraitement. Par exemple, tout ramener à la même tonalité. On s’assure que l’on réduit les variations qui seraient difficiles à traiter, en uniformisant l’ensemble de départ. Cela permet à l’ordinateur de cibler des récurrences plus simples.

 

Des mélomanes avertis, à qui l’on ferait entendre le résultat de la génération automatique de musique, pourront remarquer des incohérences, concernant ce que n’aurait pas repéré cette chaîne de Markov ?

Aujourd’hui encore, dans l’apprentissage automatique et les réseaux de neurones, le gros problème, et ce qui choque à l’écoute, c’est la construction du discours à grande échelle. Localement, on est assez bluffé, mais il y a une difficulté à construire un discours musical cohérent.

 

Léopold Crestel, vous avez aussi généré des partitions automatiquement, fondées sur celles des grands romantiques. Pourquoi avoir choisi ces compositeurs ?

Léopold Crestel : En grande partie pour des raisons pratiques. Pour imiter le style d’un compositeur avec l’apprentissage automatique, il faut disposer d’un grand nombre de partitions modèles. Car cet apprentissage, c’est de l’inférence statistique. Plus vous avez un grand nombre d’exemples, plus vous pouvez modéliser de chemins différents, de solutions possibles.

En travaillant avec le répertoire classique on évite également les problèmes de copyright qui apparaissent dès que l’on aborde du répertoire contemporain.

 

Bach fait aussi partie des compositeurs qui ont été travaillés par David Cope, pourquoi ?

Bach est souvent utilisé en informatique musicale, pour une raison simple : sa musique repose sur des règles assez strictes. C’est très codifié, et la structure est très logique. Ses chorals, par exemple, avec leur harmonie à quatre voix, sont en un sens assez faciles à modéliser pour un algorithme.

 

Vous avez en particulier travaillé sur les partitions de Beethoven car Franz Liszt en a transcrit les symphonies pour piano. 

Comme je l’expliquais, on a besoin d’un grand nombre d’exemples pour inférer les règles sur lesquelles doit se baser l’algorithme. Le corpus des réductions pour piano de Liszt des symphonies de Beethoven est large et très cohérent stylistiquement. On peut ainsi faire apprendre la transformation inverse, à savoir l’orchestration d’une partition. Le but est ensuite de donner une partition pour piano à l’algorithme, pour qu’il en génère un arrangement pour orchestre.

Partition © Pixabay

Partition © Pixabay

Léopold Crestel, vous générez des partitions pour orchestre à partir de partitions pour piano. Mais vous, Philippe Esling, votre travail est de générer de l’audio à partir de fichiers audios existants. Vous êtes capable d’orchestrer des bruits ?

Philippe Esling : Effectivement, cette recherche est un peu l’opération inverse, l’opération d’induction. Le travail de Léopold est de l’orchestration projective : on a une grille harmonique, et l’on essaie de la projeter vers l’orchestre. Moi, j’essaye de faire l’inverse, c’est-à-dire de prendre un son, un timbre, et de le transformer en partition pour orchestre. Le but est d’obtenir une partition pour orchestre qui, si elle est jouée par des humains, produit le même son que le son d’origine.

 

Il faut donc obtenir des partitions qui soient, acoustiquement, cohérentes ?

C’est la grande problématique. Car on peut facilement transcrire un son en une partition, complètement injouable, pour différents instruments. Mais l’idée, c’est que cette partition soit, d’une part acoustiquement proche du son d’origine, d’autre part humainement jouable.

 

Vous avez fait cela avec le chant du coq, avec des gouttes de pluie… 

Avec les gouttes de pluie, c’est assez simple. Le système choisit naturellement de les transformer en pizzicati, ce qui est pour nous une forme de victoire, car il aurait pu mettre n’importe quoi de moins bon à la place. Le problème devient vraiment plus intéressant quand on choisit des timbres complexes, comme par exemple des cris ou des cloches, et qu’on demande au système de les reproduire avec des instruments de l’orchestre.

 

Léopold Crestel, quels sont les enjeux ou les potentiels industriels de toutes ces recherches ?

Léopold Crestel : Il y aurait beaucoup d’applications plus ou moins belles. Il y a beaucoup à faire, avec ces algorithmes de génération automatique, dans la musique de jeux vidéo, par exemple. On pourrait avoir des thèmes qui se développent à l’infini, qui se modifieraient sans cesse, en fonction de l’environnement dans lequel le joueur évoluerait. On peut aussi imaginer des applications pour les installations artistiques, avec l’idée d’une génération infinie de musiques. Il y aurait des choses plus mercantiles certainement, pour la musique de film. Cela permettrait peut-être de gagner du temps. Mais surtout, quand j’écoute les résultats de mes algorithmes, je me dis que finalement ça reste du pastiche de compositeurs et que, tel quel, leur intérêt artistique est très limité. En revanche, si des compositeurs s’en emparent, dans un usage plus expérimental, ils arriveront peut-être à en faire des choses inédites et intéressantes. C’est en détournant les technologies de synthèse instrumentale des années 1980-1990 que sont nées toutes sortes de musiques électroniques, comme l’acid, la house, etc.

 

 

Toutes les émissions Métaclassique sur Classicagenda

 

 




A propos de l'auteur

Ses derniers articles

Vos commentaires

[wpdevart_facebook_comment curent_url="http://www.classicagenda.fr/metaclassique-generer/" order_type="social" title_text="" title_text_color="#000000" title_text_font_size="22" title_text_font_famely="monospace" title_text_position="left" width="100%" bg_color="#ffffff" animation_effect="random" count_of_comments="5" ]

A voir aussi