Pourquoi les mathématiques sont importantes en science des données ?

En science des données et en machine learning, les mathématiques ne sont pas un luxe théorique : elles sont le cœur même des modèles.

Quand nous entraînons un modèle, nous cherchons à ajuster ses paramètres pour que l’erreur soit la plus petite possible.

TIP

On peut imaginer cela comme une randonnée en montagne :

Chaque point du paysage représente une combinaison de paramètres
L’altitude du point correspond à la quantité d’erreur
Notre objectif est d’atteindre la vallée la plus basse : le point où l’erreur est minimale

Un randonneur qui veut descendre dans la vallée a besoin de trois outils :

Les vecteurs : ce sont ses pas. Ils indiquent la direction et la distance de chaque déplacement dans ce paysage
Le calcul différentiel : c’est la pente sous ses pieds. Elle lui montre dans quelle direction descendre pour arriver le plus vite possible vers le bas (le gradient)
L’algèbre linéaire : c’est la carte invisible qui décrit la montagne quand elle devient trop complexe à visualiser. En science des données, ce paysage n’a pas seulement 2 ou 3 dimensions mais parfois des milliers. L’algèbre linéaire fournit le langage et les outils pour manipuler efficacement ces espaces

TIP

Sans mathématiques, le randonneur avance à l’aveugle dans une montagne infinie. Avec elles, il a une boussole (le calcul différentiel), des pas mesurés (les vecteurs) et une carte multidimensionnelle (l’algèbre linéaire). C’est ainsi que les modèles de machine learning trouvent leur chemin vers la meilleure solution.

Résumé

En ajustant les paramètres d’un modèle, nous cherchons le point où l’erreur est minimale.

Vecteurs = déplacements dans cet espace.
Calcul différentiel = outil pour trouver la meilleure direction.
Algèbre linéaire = langage qui permet de représenter ces opérations efficacement.

Pourquoi les mathématiques sont importantes en science des données ? ​

Pourquoi les mathématiques sont importantes en science des données ?