Introduction à Seaborn
Seaborn, une bibliothèque Python construite au-dessus de Matplotlib dédiée à la visualisation statistique des données, est conçue pour fonctionner nativement avec les DataFrames Pandas et permet de produire rapidement des graphiques statistiques clairs, esthétiques et informatifs.
Elle a pour objectif de :
- simplifier la création de graphiques statistiques
- réduire la quantité de code nécessaire
- fournir des visualisations par défaut esthétiques et cohérentes
📌 Seaborn est particulièrement adaptée à l’exploration de données (EDA).
Seaborn & Pandas
Seaborn est pensée pour interagir directement avec les DataFrames Pandas.
- Les données sont passées via l’argument data
- Les variables sont référencées par leurs noms de colonnes
- Les graphiques sont automatiquement adaptés aux types de données
➡️
Contrairement à Matplotlib, on ne manipule pas directement les tableaux NumPy dans la majorité des cas.
Philosophie de Seaborn
Une syntaxe simple et expressive
La majorité des graphiques Seaborn peuvent être créés en une seule ligne de code.
Exemple : nuage de points (scatter plot)
import seaborn as sns
sns.scatterplot(x="age", y="salary", data=df)xetysont des chaînes de caractères- Elles correspondent aux colonnes du DataFrame
datacontient la source des données
➡️ Le graphique est généré automatiquement, sans configuration supplémentaire.
Une abstraction au-dessus de Matplotlib
Seaborn utilise exactement les mêmes objets que Matplotlib : Figure & Axes. Cela signifie que :
- Seaborn crée le graphique
- Matplotlib peut ensuite être utilisé pour le personnaliser
Exemple
import matplotlib.pyplot as plt
sns.scatterplot(x="age", y="salary", data=df)
plt.title("Salaire en fonction de l'âge")
plt.xlabel("Âge")
plt.ylabel("Salaire")➡️ Seaborn = simplicité ➡️ Matplotlib = personnalisation fine
Les deux bibliothèques sont complémentaires, pas concurrentes.
Types de graphiques disponibles
- Diagrammes de dispersion
- Diagrammes de distribution
- Diagrammes catégoriels
- Diagrammes de comparaison
- Grilles Seaborn (Grids)
- Diagrammes matriciels
quand et pourquoi utiliser chaque type de graphique ?
La réponse dépend :
- du type de variables (numérique, catégorielle)
- de la relation que vous cherchez à analyser
- de la question que vous vous posez
Important :
👉 Toutes les questions ne nécessitent pas un graphique. Parfois, une simple statistique descriptive suffit.
