Merci pour ce rappel. Pour résoudre ce déséquilibre, je pense qu’on pourrait utiliser l’une des deux méthodes suivantes : Oversampling et Undersampling
Bjr Natacha !! Je me demandais juste quels modèles on pourrait utiliser pour prédire une variable catégorielle à 5 modalités par exemple, vu que la regression logistique ne nous permet pas de faire cela, au vu de l'hypothèse1 présentée dans la vidéo.
Si vous avez une variable catégorielle avec cinq modalités et que la régression logistique ne convient pas , vous pourriez envisager d'utiliser la régression multinomiale ou la régression polytomique ordonnée. Ces deux méthodes sont adaptées pour prédire une variable catégorielle avec plusieurs modalités, tout en tenant compte de l'ordre ou de l'absence d'ordre entre ces modalités
Question : Comment peut-on traiter le déséquilibre des données dans un modèle de régression logistique ? Réponse : La régression logistique doit disposer de suffisamment de données dans les 2 groupes pour être généralisable. Nous avons les méthodes d'oversampling ou d'undersampling pour augmenter artificiellement les données afin de rendre le modèle de régression logistique cohérent.
Merci pour ce rappel. Pour résoudre ce déséquilibre, je pense qu’on pourrait utiliser l’une des deux méthodes suivantes : Oversampling et Undersampling
Well done :)
Merci beaucoup madame !
Avec plaisir
Super. Merci
Avec plaisir
Bjr Natacha !! Je me demandais juste quels modèles on pourrait utiliser pour prédire une variable catégorielle à 5 modalités par exemple, vu que la regression logistique ne nous permet pas de faire cela, au vu de l'hypothèse1 présentée dans la vidéo.
Si vous avez une variable catégorielle avec cinq modalités et que la régression logistique ne convient pas , vous pourriez envisager d'utiliser la régression multinomiale ou la régression polytomique ordonnée. Ces deux méthodes sont adaptées pour prédire une variable catégorielle avec plusieurs modalités, tout en tenant compte de l'ordre ou de l'absence d'ordre entre ces modalités
Pour remedier a ce probleme de déséquilibre on utilisera le technique de SMOTE
pour régler le déséquilibre, il faut augmenter artificiellement le jeu de données
C'est une solution, mais dans la pratique, on n'a pas toujours l'occasion d'augmenter la taille de l'échantillon.
Question :
Comment peut-on traiter le déséquilibre des données dans un modèle de régression logistique ?
Réponse :
La régression logistique doit disposer de suffisamment de données dans les 2 groupes pour être généralisable.
Nous avons les méthodes d'oversampling ou d'undersampling pour augmenter artificiellement les données afin de
rendre le modèle de régression logistique cohérent.
Well done Warys