Quelles différences entre le machine learning et le deep learning ?

jeudi 21 janvier 2021, par Bruno Benque

Machine Learning & Deep Learning sont devenus des notions incontournables dans l’environnement sanitaire, avec des applications de l’intelligence artificielle toujours plus nombreuses. Mais il n’est pas évident d’identifier précisément ce qui se cache derrière ces deux termes. Nous nous sommes inspiré d’un texte de Myriam Emilion pour vous expliquer leurs caractéristiques précises en les appliquant à des activités sanitaires.

Lorsque l’on parle d’intelligence artificielle (IA), on oppose la plupart du temps le machine learning et le deep learning. Mais quellles sont les caractéristiques qui différencient ces deux concepts ?

Le feature extraction dans le Machine Learning

Un logiciel de Machine Learning utilise des algorithmes qui traitent des données quantitatives et structurées, des valeurs numériques la plupart du temps. En Machine Learning classique, lorsque vous travaillez sur les workflows d’un service de soins d’urgences par exemple, le Data Scientist que vous êtes va faire un choix et extraire les données qui vont influer sur la prédiction : les variables, qui seront représentées ici par la pathologie présentée par le patient, ses antécédents, son âge, etc.

Ce sont ces éléments qui vous permettront d’anticiper la charge de travail que ce patient pourrait mobiliser, les moyens matériels qui seront consommer ou le temps de présence dans le service. En d’autres termes, c’est sur ces variables que le Data Scientist va entraîner son algorithme. C’est ce que l’on appelle le Feature Extraction.

Pas de feature extraction en Deep Learning

Un logiciel de Deep Learning utilise des algorithmes capables de mimer les actions du cerveau humain grâce à des réseaux de neurones d’où le terme d’Intelligence Artificielle.

En Deep Learning, souvent, il n’est pas nécessaire de faire du Feature Extraction. Car le Deep Learning traite souvent des données non-structurées comme des images, du son ou du texte notamment. Lorsque le radiologue voit une pneumopathie sur un scanner thoracique, il ne va pas pouvoir extraire l’élément qui va être prédicteur d’une origine tabagique, parasitaire ou COVID-19 : il est bien entendu impossible pour nous en tant qu’humain de sélectionner à la main tous les pixels de chaque image appartenant à chaque pathologie pour entrainer un algorithme. Celui-ci va être entrainé pour sortir lui même les éléments influents dans la prédiction que vous souhaitez réaliser.

On distingue, en Deep Learning, deux des types d’algorithmes : des réseaux de neurones convolutionnels, qui sont utilisés par exemple pour le traitement d’images, et des réseaux de neurones récursifs pour le traitement de texte. Dans les deux cas, il est nécessaire de mobiliser un volume important de données et nous touchons ici les problématiques Big Data. Reprenons notre exemple de scanner thoracique. Si vous souhaitez réaliser une classification des images par pathologie, vous pourrez ne prendre « que » 10000 images pour avoir un algorithme performant. Mais si vous souhaitez, non plus seulement catégoriser ces images, mais reconnaître dans ces images une pathologie spécifique, cela vous demandera beaucoup plus de données, ainsi qu’une puissance de calcul de votre hardware très importante.

Une explicabilité difficile à atteindre

Le Deep Learning est donc un sous-domaine du Machine Learning associé à la performance. De ce fait, il reste très complexe d’expliquer comment un algorithme arrive au résultat. S’il est assez simple d’expliquer comment fonctionnent des algorithmes de Machine Learning classique, il est très compliqué de savoir comment fonctionne exactement un algorithme de Deep Learning. C’est là tout le problème que doit résoudre le législateur lorsque l’on parle de consentement éclairé des patients pour le traitement de leurs données par l’IA. Dans certains domaines, la finance, la banque, et donc la Santé, les professionnels vont devoir informer le public sur le fonctionnement de l’algorithme. Cela fait partie d’une des questions éthiques liées à la démocratie sanitaire. Et elle est loin d’être tranchée...

Pour approfondir sur le thème du Big Data, santé publique et éthique, voir le N°112 d’Actualité et Dossier en santé publique.

Bruno Benque
Rédacteur en chef www.cadredesante.com
bruno.benque@cadredesante.com
@bbenk34
D’après le texte de Myriam Emilion
Marketing Manager edha Bootcamp


Partager cet article

Vous recrutez ?

Publiez vos annonces, et consultez la cvthèque du site EMPLOI Soignant : des milliers de profils de soignants partout en France.

En savoir plus