Comment l’apprentissage approfondi peut améliorer notre façon de mener la recherche scientifique

0
178


Que nous le prenions pour acquis ou non, les algorithmes d’apprentissage profond sont devenus une partie inséparable de notre vie quotidienne. Les flux personnalisés, la reconnaissance faciale et vocale, la recherche sur le web, les haut-parleurs intelligents, les assistants numériques, le courrier électronique et bien d’autres applications dont nous ne pouvons pas nous séparer utilisent des algorithmes d’apprentissage profond sous le capot.

Mais quelle est l’efficacité de l’apprentissage approfondi dans la recherche scientifique, où les problèmes sont souvent beaucoup plus complexes que la classification d’une image et où les exigences sont beaucoup plus sensibles que la recommandation de ce qu’il faut acheter ensuite ?

comment créer une société offshore?

Pour répondre à cette question, Eric Schmidt, ancien PDG de Google, et Maithra Raghu, chercheuse sur l’IA de Google, ont élaboré un guide complet sur les différentes techniques d’apprentissage approfondi et leur application à la recherche scientifique.

« La quantité de données collectées dans un large éventail de domaines scientifiques augmente de façon spectaculaire, tant en taille qu’en complexité », écrivent les auteurs, ajoutant qu’avec les progrès de l’apprentissage machine, ce riche corpus de données peut offrir « de nombreuses possibilités passionnantes pour des applications d’apprentissage approfondi dans des contextes scientifiques ».

Lisez : [How deep learning algorithms can be used to measure social distancing]

Intitulé « A Survey of Deep Learning for Scientific Discovery », leur guide fournit une vue d’ensemble très accessible de l’apprentissage approfondi et de la réseaux de neurones pour les scientifiques qui ne sont pas nécessairement versés dans le langage complexe des algorithmes d’intelligence artificielle.

Je vous recommande vivement de lire le document de 48 pages dans son intégralité et de consulter nombre de ses références. Mais voici quelques points clés à retenir.

Vous n’avez pas nécessairement besoin de faire un apprentissage approfondi

L’apprentissage profond étant à la mode, il est facile d’être tenté de l’appliquer à tout et à n’importe quoi. Après tout, la proposition de base est très attrayante : Il s’agit d’un modèle d’IA de bout en bout qui prend un tas de données, développe une représentation mathématique et effectue des tâches complexes de classification et de prédiction.

Les réseaux neuronaux profonds peuvent s’attaquer à des problèmes précédemment résolus par d’autres types d’algorithmes d’apprentissage machine, tels que la recommandation de contenu ou la détection de fraude. Ils peuvent également traiter des problèmes qui étaient traditionnellement difficiles à traiter avec d’autres techniques d’apprentissage automatique, notamment les vision par ordinateur et les tâches de traitement du langage naturel (TAL).

Cependant, Schmidt et Raghu avertissent que, lors de la formulation d’un problème, il est important de se demander si l’apprentissage approfondi fournit l’ensemble d’outils adéquat pour le résoudre. « Dans de nombreux contextes, l’apprentissage approfondi n’est pas forcément la meilleure technique pour commencer ou la mieux adaptée au problème », écrivent-ils.

Pour de nombreux problèmes, plus simple les algorithmes d’apprentissage machine fournissent souvent des solutions plus efficaces. Par exemple, si vous voulez trouver la plus pertinente des caractéristiques chimiques de différentes substances, il est préférable d’utiliser la « réduction de la dimensionnalité », une technique qui permet de trouver les caractéristiques qui contribuent le plus aux résultats.

En revanche, si vous disposez de données limitées ou si vos données ont été soigneusement classées sous forme de tableau, vous pouvez envisager d’essayer un modèle de régression avant d’utiliser les réseaux de neurones. Les réseaux neuronaux ont généralement (mais pas toujours) besoin de beaucoup de données. Ils sont également difficiles à interpréter. En revanche, les algorithmes de régression linéaire et logistique peuvent fournir des résultats plus précis lorsque les données sont rares, surtout si le problème est de nature linéaire. Les modèles de régression fournissent également une équation mathématique claire avec des coefficients qui expliquent la pertinence de chaque caractéristique dans l’ensemble de données.

Apprentissage approfondi pour les tâches scientifiques liées à l’image

Algorithme de détection du coronavirus Covid-net