Pourquoi les mathématiques sont importantes en science des données ?
En science des données et en machine learning, les mathématiques ne sont pas un luxe théorique : elles sont le cœur même des modèles.
Quand nous entraînons un modèle, nous cherchons à ajuster ses paramètres pour que l’erreur soit la plus petite possible.
TIP
On peut imaginer cela comme une randonnée en montagne :
- Chaque point du paysage représente une combinaison de paramètres
- L’altitude du point correspond à la quantité d’erreur
- Notre objectif est d’atteindre la vallée la plus basse : le point où l’erreur est minimale
Un randonneur qui veut descendre dans la vallée a besoin de trois outils :
Les vecteurs: ce sont ses pas. Ils indiquent la direction et la distance de chaque déplacement dans ce paysageLe calcul différentiel: c’est la pente sous ses pieds. Elle lui montre dans quelle direction descendre pour arriver le plus vite possible vers le bas (le gradient)L’algèbre linéaire: c’est la carte invisible qui décrit la montagne quand elle devient trop complexe à visualiser. En science des données, ce paysage n’a pas seulement 2 ou 3 dimensions mais parfois des milliers. L’algèbre linéaire fournit le langage et les outils pour manipuler efficacement ces espaces
TIP
Sans mathématiques, le randonneur avance à l’aveugle dans une montagne infinie. Avec elles, il a une boussole (le calcul différentiel), des pas mesurés (les vecteurs) et une carte multidimensionnelle (l’algèbre linéaire). C’est ainsi que les modèles de machine learning trouvent leur chemin vers la meilleure solution.
Résumé
En ajustant les paramètres d’un modèle, nous cherchons le point où l’erreur est minimale.
- Vecteurs = déplacements dans cet espace.
- Calcul différentiel = outil pour trouver la meilleure direction.
- Algèbre linéaire = langage qui permet de représenter ces opérations efficacement.
