Découvrez les 6 Hypothèses De La Régression Logistique | 100JoursDeML - Jour 45

Поділитися
Вставка
  • Опубліковано 1 лис 2024

КОМЕНТАРІ • 13

  • @lionelnbassebahan2165
    @lionelnbassebahan2165 Рік тому +1

    Merci pour ce rappel. Pour résoudre ce déséquilibre, je pense qu’on pourrait utiliser l’une des deux méthodes suivantes : Oversampling et Undersampling

  • @MarlandLynval
    @MarlandLynval Рік тому

    Merci beaucoup madame !

  • @Proarmelo
    @Proarmelo Рік тому

    Super. Merci

  • @sounnaMHD
    @sounnaMHD 7 місяців тому +1

    Bjr Natacha !! Je me demandais juste quels modèles on pourrait utiliser pour prédire une variable catégorielle à 5 modalités par exemple, vu que la regression logistique ne nous permet pas de faire cela, au vu de l'hypothèse1 présentée dans la vidéo.

    • @LeCoinStat
      @LeCoinStat  6 місяців тому

      Si vous avez une variable catégorielle avec cinq modalités et que la régression logistique ne convient pas , vous pourriez envisager d'utiliser la régression multinomiale ou la régression polytomique ordonnée. Ces deux méthodes sont adaptées pour prédire une variable catégorielle avec plusieurs modalités, tout en tenant compte de l'ordre ou de l'absence d'ordre entre ces modalités

  • @yarakouadio1725
    @yarakouadio1725 5 місяців тому

    Pour remedier a ce probleme de déséquilibre on utilisera le technique de SMOTE

  • @gilleskette6521
    @gilleskette6521 11 місяців тому

    pour régler le déséquilibre, il faut augmenter artificiellement le jeu de données

    • @LeCoinStat
      @LeCoinStat  10 місяців тому

      C'est une solution, mais dans la pratique, on n'a pas toujours l'occasion d'augmenter la taille de l'échantillon.

  • @warysmadia9074
    @warysmadia9074 Рік тому

    Question :
    Comment peut-on traiter le déséquilibre des données dans un modèle de régression logistique ?
    Réponse :
    La régression logistique doit disposer de suffisamment de données dans les 2 groupes pour être généralisable.
    Nous avons les méthodes d'oversampling ou d'undersampling pour augmenter artificiellement les données afin de
    rendre le modèle de régression logistique cohérent.