On ne le dira jamais assez, mais nous ne sommes qu’aux prémices du potentiel réel de l’Intelligence Artificielle (IA). Selon les domaines, elle n’a pas le même avancement. Par exemple, on cherche beaucoup plus à la développer dans les domaines de la santé et des affaires, que dans l’éducation.

Le monde de l’acoustique n’est pas celui qui est le plus mis en avant dans l’actualité de la presse, mais l’IA a déjà commencé à montrer quelques possibilités prometteuses pour l’avenir, notamment via la détection automatique d’événements sonores.

Comment la détection automatique de sons fonctionne-t-elle ?

Dans un premier temps, l’acquisition des sons se fait par des capteurs acoustiques classiques comme le microphones ou hydrophones (pour les sons sous-marin) dont les caractéristiques dépendent de l’application.

détection-audio-intelligence-artificielle

Figure 1 – Exemple de système d’acquisition de données environnementales terrestres: l’AudioMoth

Figure 2 – Exemple de système d’acquisition de données environnementales aquatiques: l’hydrophone préamplifié Cetacean Research C75

Dans un second temps, les données sonores captées vont être analysées et stockées. Le coeur de la technologie est basée sur des réseaux de neurones, qui permettent d’apprendre à détecter et identifier des événements acoustiques dans un flux sonore. Pour cela, l’Intelligence artificielle va nécessité une phase d’apprentissage (machine learning) avec des exemples des données que l’on cherche à identifier. Ainsi, on va donner à l’IA une énorme base de données acoustiques en lui indiquant quel son correspond à quelle source. Par exemple, si on souhaite qu’une Intelligence Artificielle soit capable de reconnaître n’importe quel instrument de musique, on va d’abord lui donner des milliers de bande-sons pour chaque instrument. Ainsi, elle sera capable par la suite de reconnaître de manière fiable et autonome dès les premières notes, l’instrument qui joue et ce même dans un opéra. Les événements sonores ainsi détectés et identifiés sont alors stockés pour présentation ultérieure à l’utilisateur.

détection-et-stockage-de-son-IA

Figure 3 – Exemple de classification d’événements sonores en 3 classes: parole, musique ou autre par un réseau de neurones conventionnel.

Enfin, dans un troisième temps, la visualisation des données peut se présenter de 2 manières complémentaires :

  • via un système d’alerte : une notification est envoyée à l’utilisateur lorsqu’un événement sonore donné est détecté. Par exemple, s’il y a un bruit spécifique lié à une anomalie sur une machine en milieu industriel, une détection du chant d’une espèce d’oiseau dans un parc naturel, un bruit de bris de vitre en milieu urbain…
  • via un tableau de bord : les informations sonores sont présentées par des schémas spatio-temporelle et statistiques des données détectées pour visualiser l’information importante. Par exemple, la distribution géographique et/ou l’évolution du nombre d’individus d’une espèce d’oiseau au cours du temps, l’évaluation du trafic routier dans une rue et la gêne occasionnée…
chaîne de traitement des données- détection de son - IA

Quels domaines d’application pour une IA de détection automatique d’événements sonores ?

Les domaines d’applications possibles sont très variées dans les domaines de la musique, de l’audio-visuelle, de l’IT, de la sécurité, de l’environnement ou même pour les chercheurs de la Nasa. Voici 4 exemples concrets issus de l’actualité :

  • Un nouveau logiciel est capable de reconnaître des voix dans une foule, puis de les isoler1.

Avez-vous déjà passé un appel à un ami qui se trouvait dans un endroit bruyant ? Si oui, vous savez qu’il est parfois compliqué de comprendre son interlocuteur au milieu d’un brouhaha. Tout simplement parce qu’un microphone ne fait pas la distinction entre les différentes sources sonores (voix, musique, bruits parasites), et retransmet donc l’ensemble de ce qu’il capte.

Heureusement, Google a entraîné une IA grâce à une technique deep learning afin de pouvoir distinguer différentes sources acoustiques à partir d’un seul enregistrement. Le logiciel analyse une bande-son et la divise en autant de pistes audio que nécessaires. Cette Intelligence Artificielle est même capable d’observer les mouvements de bouche d’une personne pour lui attribuer la source du son et ainsi lui crée une piste associée que l’on peut couper. Imaginez l’utilité de cette option lors d’un débat télévisé !

détection de la source d'un son - intelligence artificielle - deep learning
  • Il faut aujourd’hui seulement 3,7 secondes d’audio afin de cloner votre voix 2

Cette prouesse technique a été réalisé par le géant chinois de l’IT, Baidu. Les capacités de l’intelligence artificielle permettent désormais une évolution technologique de plus en plus réaliste.

Les avancés de Google en la matière sont également impressionnants. Ils ont permis à l’Assistant Google de pouvoir imiter des voix de célébrités. La voix du chanteur John Legend est désormais une option utilisable sur tous les supports possédant l’Assistant Google.

  • Améliorer la sécurité des lieux publics par détection acoustique

Des chercheurs de l’Institut de recherche en informatique de Toulouse, en collaboration avec des chercheurs de la Maison des sciences de l’Homme et de la société de Toulouse, ont développé un système, appelé Audio Analytic Threat Detection (ATD), qui détecte automatiquement les événements sonores caractéristiques d’une situation dangereuse dans des lieux publics3.

Dans un aéroport, une station de métro ou un centre commercial, certains bruits (chocs, cris, détonations…) peuvent signaler une situation potentiellement critique, voire dangereuse. Pour créer un système d’analyse autonome de l’environnement sonore, les chercheurs se sont basés sur des compétences en ergonomie et psychoacoustique. Un projet interdisciplinaire qui a débouché sur un système capable d’identifier des bruits ou séquences de bruits et surtout de les interpréter en fonction du contexte sonore.

  • Et plus loin encore : une IA détecte des centaines de sons mystérieux dans l’espace

Les chercheurs du projet Breakthrough Listen, qui vise à scanner les étoiles en quête d’une forme de vie intelligente, ont mis au point un nouveau logiciel d’intelligence artificielle. Celui-ci a aidé les astronomes à découvrir 72 signaux mystérieux sons en provenance d’une galaxie lointaine3 à environ trois millions d’années-lumière de la Terre.

Rares et mystérieux, ces signaux sont connus sous l’appellation de “Fast Radio Bursts” ou FRB. Cependant, les scientifiques n’ont aucune certitude quant à l’origine de ces signaux qui sont tout de même capables d’émettre autant d’énergie en une seconde que le soleil en 10000 ans… Certains experts estiment qu’ils sont d’origine naturelle, causés par exemple par l’explosion d’une étoile. D’autres considèrent qu’il s’agit de signaux émis par des extraterrestres et volontairement envoyés en direction de la Terre. Sans certitudes, la question reste ouverte. Espérons que l’IA a détection automatique d’événements sonores sera capable de nous apporter la réponse.

Il est alors certain que l’Intelligence Artificielle a détection automatique d’événements sonores est promis à un bel avenir tant les possibilités d’application sont étendues, notamment dans la préservation de l’environnement grâce à :

  • l’inventaire et le suivi de la faune dans des zones d’intérêt écologique (ex. Parcs naturels) pour les scientifiques (ex. Étude de l’impact du réchauffement climatique sur les populations d’animaux);
  • une application mobile d’identification d’espèces d’oiseau (Shazam pour oiseau)
  • Station d’acquisition plug’n’play à poser chez les particuliers pour la détection des espèces présentes dans leur environnement local;
  • Détection de mammifères marins pour éviter les collisions avec les bateaux;
  • Détection de coup de feu pour détecter les braconniers dans les grands parcs africains.

Pour un article plus complet sur l’IA et l’environnement, vous pouvez consulter l’article “L’intelligence Artificielle pour un monde plus vert ?”

101net.com – Grâce à l’intelligence artificielle, Google peut complètement isoler une voix d’un brouhaha – 2018

2Forbes – L’intelligence Artificielle Permet Désormais D’Imiter Votre Voix : Quel Impact Pour L’Être Humain ? – Mai 2019

3Techno-science.com – Améliorer la sécurité des lieux publics par détection acoustique – Avril 2019

Le Big Data – Extraterrestres : une IA détecte des centaines de sons mystérieux dans l’espace – 2018

Aller au contenu principal