Les 7 packages Python à connaître pour le Machine Learning

Поділитися
Вставка
  • Опубліковано 19 жов 2024
  • 📝 AMELIOREZ VOS COMPETENCES EN DATA SCIENCE : damienchambon....
    Les 7 packages Python à connaître pour le Machine Learning
    Quand on parle des meilleurs packages Python pour faire du Machine Learning, on mentionne souvent pandas, TensorFlow, scikit-learn… Il existe plein d’autres librairies utiles pour faire du Machine Learning en Python, et c’est le sujet de cette vidéo en français.
    00:33 Les packages Python "requests" et "scrapy"
    03:10 Le package Python "pillow"
    04:43 Les packages Python "XGBoost", "LightGBM" et "PyTorch"
    08:32 Le package Python "ELI5"
    Pour la collecte de données, 2 packages peuvent vous faciliter la vie. Le premier, c’est requests. Grâce à lui, vous pouvez utiliser des API en seulement quelques lignes. En fait, une seule ligne de code suffit à appeler une API. La réponse retournée est sous la forme de JSON, qui est un modèle facile à manipuler. Lorsque vous n’avez pas la possibilité d’utiliser des API, le package scrapy tombe à point nommé. En utilisant ses « araignées », vous pouvez facilement récolter le contenu de nombreuses pages web. Cependant, ceci nécessite quelques connaissances en HTML.
    Documentation requests : requests.readt...
    Documentation scrapy : docs.scrapy.or...
    Lors du nettoyage de données, le package scikit-learn est très utile et donc il n’existe pas d’autres librairies qui soient aussi efficaces pour préparer vos données aux algorithmes. Par contre, lorsque vous utilisez des images, je vous recommande d’utiliser le package pillow qui vous permet de facilement transformer des images. Après les avoir converti les bits en valeur de 0 à 256, pillow peut vous aider à augmenter la taille de votre dataset. C’est une étape très utile lors de la classification d’images. Ainsi, pillow vous offre des fonctions toutes prêtes pour transposer, faire des rotations ou encore changer les couleurs de vos images.
    Documentation pillow : pillow.readthe...
    Pour entraîner des modèles, ceux de scikit-learn sont performants, mais lorsque le nombre de données croît grandement, ceux-ci peuvent perdre en performance. Les packages XGBoost et LightGBM sont conçus pour accélérer et optimiser au maximum l’étape du gradient descent, chère à de nombreux algorithmes. Construits en particulier pour les méthodes ensemblistes telles que les Random Forests, XGBoost et LightGBM vous permettront de procéder à des classifications très rapides et précises. En effet, le CERN recommande ces packages-là après qu’ils les aient utilisés dans leur recherche. Un autre package très utile en particulier pour le Deep Learning est PyTorch. Ce package créé par Facebook est en train de fortement concurrencer Tensorflow et Keras car il est plus facile à utiliser, très modulable et offre de nombreuses options pour entrainer des réseaux neuronaux. Je vous le recommande, d’autant plus que de plus en plus d’entreprises l’utilisent.
    Documentation XGBoost : xgboost.readth...
    Documentation LightGBM : lightgbm.readt...
    Documentation PyTorch : pytorch.org/tu...
    Une fois les modèles entrainés, il est utile de savoir interpréter leurs prédictions et de comprendre comment ils en sont arrivés là. Le package ELI5 peut vous aider à accomplir cette mission. Il offre des représentations visuelles des différentes features et comment elles ont mené à la prédiction annoncé. Grâce aux couleurs vert et rouge, il est très facile de comprendre les coulisses de ces « boites noires ». Ce package permet donc également un déboggage plus facile pour comprendre des mauvaises prédictions. Il est compatible avec certains modèles de scikit-learn mais aussi XGBoost et LightGBM. ELI5 vous sera très utile dans le monde de l’entreprise puisqu’il permettra de rassurer certains managers, sceptiques face au Machine Learning.
    Documentation ELI5 : eli5.readthedo...
    👋🏼 Qui suis-je ?
    Je m'appelle Damien et je suis Data Scientist. Au cours de mes expériences professionnelles, j'ai découvert comment la Data Science et le Machine Learning peuvent résoudre des problématiques business et sociétales.
    J'ai formé des dizaines d'étudiants à la Data Science et au Machine Learning en français pour leur permettre de découvrir ces domaines fascinants et les appliquer dans leur vie professionnelle.
    💻 Mon site : damienchambon....
    Crédits musique : Roots - Kupla

КОМЕНТАРІ • 1

  • @latelierdata
    @latelierdata  3 роки тому +1

    📝 Améliorez vos compétences en Machine Learning : damienchambon.podia.com