Pourquoi le machine learning est-il compliqué ?

Ce qu’on a retenu de Devoxx France 2022

Mai 5, 2022 | Business Development, Dev & Data Sciences

Scient s’est rendu à la 10e Edition de Devoxx France ! Nous vous proposons dans cet article un retour d’expérience sur les sujets qui nous ont marqués et ce que nous allons en retenir.

12-factor App : une excellente base de développement applicatif

Fév 14, 2022 | Dev & Data Sciences

Le “12 Factor app” est un manifeste proposant 12 bonnes pratiques concernant le développement d’applications Cloud.

La CDP, vraiment indispensable ?

Nov 9, 2021 | Dev & Data Sciences, Technologies

Si l’on s’en réfère à la définition donnée par Gartner, la CDP “est une technologie marketing qui permet d’unifier les données clients en provenance du marketing et de tous les autres canaux afin de construire des profils clients et d’optimiser le timing et le ciblage des messages et des offres ».
Il s’agit donc d’une plateforme qui permet :

– De réunir la donnée client en provenance de différentes sources (web, mobile, CRM, social media, e-commerce etc.)

Gouvernance data : centraliser ou décentraliser ?

Mar 19, 2021 | Dev & Data Sciences

La data est une ressource de plus en plus maîtrisée et exploitée par les entreprises. Le cloisonnement de la donnée tend à disparaître chez les organisations. Gouverner et structurer la data devient donc nécessaire à toute entreprise voulant s’adapter et se développer...

Impact Covid sur l’IT : entre digitalisation accélérée et baisse des coûts, qui gagne ?

Fév 2, 2021 | Design & UX, Ressources Humaines

Avec la crise sanitaire et les bouleversements qu’elle a impliqués, la tendance à la rationalisation des coûts IT s’est d’autant renforcée. Les entreprises se sont empressées de prendre des mesures, comme réduire les effectifs ou exploiter au maximum leurs actifs IT....

Quelle différence entre un codeur “standard” et un codeur en “machine learning” ?

Des progrès considérables ont pourtant été réalisés pour rendre le machine learning plus accessible. Des MOOCs et des manuels bien rédigés ont transformé des études et années de recherche dans un format plus facile à digérer. Il n’est même pas toujours nécessaire de comprendre les lignes de code déjà disponibles dans des bibliothèques. Une compréhension de base du fonctionnement de l’algorithme et du développement peuvent suffire.

Pourtant le machine learning reste relativement complexe.

La recherche pure ne suffit pas à améliorer les modèles. De la créativité, de l’expérimentation et de l’empirisme sont nécessaires.

Le point de blocage ne vient pas des mathématiques, car le niveau requis n’est pas très élevé. Il faut avant tout pouvoir juger du type d’outil à utiliser pour une problématique spécifique. Cela nécessite donc une connaissance des algorithmes et des modèles disponibles, ainsi que leurs avantages et inconvénients respectifs.

Cette compétence s’acquiert par l’exposition à ces modèles (cours, manuels et articles), mais surtout en les testant soi-même. Ce processus d’apprentissage empirique n’est pas propre au machine learning, mais concerne tous les développements informatiques.

La véritable difficulté du machine learning réside dans la complexité à débugger le code.

Soit votre algorithme ne fonctionne pas, soit il n’est pas assez performant. Il est à la fois plus compliqué de comprendre ce qui ne fonctionne pas dans une algorithme de machine learning, et le délai d’impact du correctif est aussi plus long. Au lieu de quelques heures, les corrections peuvent mettre plusieurs jours.

Cela peut bien-sûr provenir du dataset en entrée. Les bugs dans les données engendrent souvent du bruit, des erreurs de prétraitement, ou reflètent aussi un manque de données. Les bogues dans le modèle peuvent impliquer des limitations réelles dans les capacités de modélisation.

Cookie	Durée	Description
_ga	2 ans	Ce cookie est installé par Google Analytics. Ce cookie est utilisé pour calculer les données relatives aux visiteurs, aux sessions et aux campagnes et pour suivre l'utilisation du site pour le rapport d'analyse du site. Les cookies stockent les informations de manière anonyme et attribuent un numéro généré de manière aléatoire pour identifier les visiteurs uniques.
_gat_gtag_UA_146969774_1	1 minute	Ce cookie est placé par Google et est utilisé pour distinguer les utilisateurs.
_gid	1 jour	Ce cookie est installé par Google Analytics. Ce cookie est utilisé pour stocker des informations sur la façon dont les visiteurs utilisent un site Web et aide à créer un rapport d'analyse sur l'état du site Web. Les données recueillies comprennent le nombre de visiteurs, la source d'où ils viennent et les pages visitées sous une forme anonyme.

Cookie	Durée	Description
cookielawinfo-checkbox-functional	1 an	Le cookie est défini par le consentement aux cookies GDPR pour enregistrer le consentement de l'utilisateur pour les cookies de la catégorie "Fonctionnel".
cookielawinfo-checkbox-others	1 an	Aucune description

Ce qu’on a retenu de Devoxx France 2022

12-factor App : une excellente base de développement applicatif

La CDP, vraiment indispensable ?

Gouvernance data : centraliser ou décentraliser ?

Impact Covid sur l’IT : entre digitalisation accélérée et baisse des coûts, qui gagne ?

Pourquoi le machine learning est-il compliqué ?

Comprendre les enjeux liés aux développements Machine Learning

Quelle différence entre un codeur “standard” et un codeur en “machine learning” ?

Pourtant le machine learning reste relativement complexe.

La véritable difficulté du machine learning réside dans la complexité à débugger le code.

Comment améliorer ses compétences en machine learning ?

CONTACTEZ-NOUS

BUREAUX

Paris

Aix-en-Provence