📄️ Introduction au Machine Learning
Le Machine Learning (ou apprentissage automatique) est une branche de l'intelligence artificielle. Il permet à une machine d’apprendre à partir de données pour effectuer des prédictions ou prendre des décisions, sans être explicitement programmée pour chaque tâche.
📄️ Outils et environnement de travail
Pour travailler efficacement sur des projets de Machine Learning, nous allons utiliser un ensemble d’outils adaptés à la programmation en Python et à la gestion d’environnements scientifiques.
📄️ Introduction à NumPy
NumPy est une bibliothèque Python essentielle pour le calcul scientifique. Elle permet de travailler efficacement avec des tableaux de données numériques (appelés arrays), bien plus rapidement qu’avec les listes Python classiques.
📄️ Introduction à pandas
pandas est une bibliothèque Python spécialisée dans la manipulation et l’analyse de données tabulaires. Elle est indispensable pour tout projet de data science ou de machine learning.
📄️ Introduction à matplotlib
matplotlib est une bibliothèque Python utilisée pour créer des graphiques. C’est l’outil de base pour visualiser des données en Python.
📄️ Les Graphs
Comprendre Eta² (Eta Squared)
📄️ Introduction à Seaborn
Seaborn est une bibliothèque Python de visualisation de données basée sur matplotlib.
📄️ Introduction à Scikit-learn
Scikit-learn est une bibliothèque Python incontournable pour le Machine Learning classique (hors deep learning).
📄️ Évaluation Modèles
Évaluer un modèle, c’est comme vérifier si un élève a bien compris sa leçon : on compare ses réponses (prédictions) à la correction (les vraies valeurs).
📄️ Méthodes de validation
Lorsque l’on entraîne un modèle, on veut savoir s’il sera bon sur des données qu’il ne connaît pas.
📄️ Surentraînement d’un modèle
Quand on entraîne un modèle d’intelligence artificielle, on veut qu’il apprenne à généraliser — c’est-à-dire bien prédire sur de nouvelles données qu’il n’a jamais vues.
📄️ Hallucination en IA
L’hallucination en IA, ce n’est pas un bug ou un délire,
📄️ Les modeles dans Scikit-learn
Introduction
📄️ Transfomer/Clean
Comment convertir une colonne textuelle en index numérique sans utiliser de binaire (one-hot).
📄️ Les types données
Données qualitatives vs données quantitatives