Deezer a construit une IA pour capter les paroles explicites que les censeurs humains manquent

0
195


Deezer a trouvé un nouveau moyen d’éradiquer le fléau de l’obscénité qui transforme des enfants innocents en voyous, toxicomanes, meurtriers – et pire encore.

Le service de streaming a développé une technique d’IA qui détecte automatiquement les paroles explicites – simplement en analysant l’audio.

Bien sûr, un humain pourrait faire le travail, mais cela peut représenter beaucoup de travail, comme l’a découvert le podcasteur Adam Buxton lorsqu’il a vaillamment tenté de censurer les délinquants en série NWA.

Un autre problème est que les maisons de disques ne sont pas toujours aussi diligentes que Buxton. Deezer affirme qu’on ne peut pas toujours compter sur elles pour ajouter une étiquette de « contenu explicite » aux chansons malveillantes qu’elles soumettent aux services de streaming.

« Quand aucune étiquette n’est fournie, cela peut signifier que la chanson convient à tous les publics, mais cela peut aussi signifier qu’aucune décision n’a été prise du côté du label concernant son caractère explicite », a écrit le chercheur de Deezer, Manuel Moussallam, dans un article de blog. « Une grande partie de notre catalogue appartient à cette catégorie ».

[Read: This AI wrote such emo lyrics that humans thought it was My Chemical Romance]

Les techniques existantes d’apprentissage machine permettent de trouver des paroles offensantes en recherchant dans les textes des mots qui ont été qualifiés d’offensants. Mais les transcriptions fiables des chansons sont parfois difficiles à trouver.

Une autre approche consiste à utiliser les réseaux neuronaux profonds, qui ont fait leurs preuves dans la classification des images, des textes, des vidéos et de la musique. Cependant, il peut être difficile d’expliquer comment ils prennent leurs décisions, car ces systèmes utilisent des fonctions de traitement complexes et difficiles à interpréter.

Ces questions ont conduit Deezer à essayer une nouvelle approche.

Recherche de paroles explicites

La société a utilisé un outil appelé Spleeter pour extraire les voix des chansons, puis a fait passer les paroles par un système de repérage de mots-clés qui signale les mots potentiellement offensants. Enfin, un classificateur binaire divise les paroles en deux catégories : les paroles vilaines et les paroles gentilles.

Lors des tests, le système a surpassé les modèles de boîte noire, prouvant que l’on ne doit pas toujours sacrifier l’explicabilité à la précision. Mais il n’a toujours pas été aussi performant que les humains.

Deezer estime néanmoins que l’outil pourrait aider la société à détecter les paroles offensantes. Comme le dirait le chanteur de comédie Kunt and the Gang, « merci [BLEEP] pour cela ».

Publié le 1er mai 2020 – 16:37 UTC