2 GLM conteos

Поділитися
Вставка
  • Опубліковано 18 жов 2024
  • Análisis de una variable de respuesta (conteos) en función de variables explicativas numérica y/o categórica. Uso de la distribución Poisson y la función de enlace log. Estimación de parámetros e interpretación. Sobre-dispersión en GLM de conteos: causas, soluciones y consecuencias. Uso de la distribución binomial negativa. Análisis de residuos para validar GLM de conteos.

КОМЕНТАРІ • 31

  • @davidmontano6540
    @davidmontano6540 Рік тому +2

    ¡Sus explicaciones son brutalmente buenas! En ningún otro canal, mucho menos de habla hispana, he encontrado tanta calidad en las explicaciones de temas así de complejos. Muchas gracias y por favor, no deje de subir contenido.

  • @claudiapatriciamoraaguirre8591
    @claudiapatriciamoraaguirre8591 2 роки тому

    Hola Pablo, soy Estadística vivo en Colombia, me encanto tu video, gracias

  • @diecolo26
    @diecolo26 Рік тому

    Hola Pablo, tanto tiempo dandole a esto y me aclaraste muchos fundamentos que no tenia muy claros, muy buenos tus videos.

  • @Calamarydeniro
    @Calamarydeniro Рік тому

    Muy bien Pablo, francamente bien explicado.

  • @rodrigonieva1441
    @rodrigonieva1441 2 роки тому

    Excelente explicación Pablo! Justo encontré este video con lo que me recomendaste. Me vino de diez!

  • @urielaldavapardave3313
    @urielaldavapardave3313 9 місяців тому

    Saludos. Excelente explicación. Existe alguna forma de realizar comparaciones múltiples luego de un ANOVA con GLM, por ejemplo luego de un anova con binomial negativa?.

    • @PabloIEstadistica
      @PabloIEstadistica  8 місяців тому

      Hola, vuelvo a mi oficina luego de un mes de vacaciones. La respuesta a tu pregunta es sí y se hace por las mismas razones que con un ANOVa cuando Y~Normal: para minimizar el riesgo de un detectar como significativa una comparación que no lo es. Puedes hacer esas comparaciones usando por ejemplo el paquete multcomp, o también emmeans. Saludos

  • @christianveliz9419
    @christianveliz9419 3 роки тому

    Gracias, hay veces que uno decide chocar con las puertas solo. estaba tratando de hacer un GLM para cada especie de ostrácodos (24) y tengo una variable día-noche que la convertí a 1 y 2, salinidad, oxigeno y otras tantas todo era mas sencillo... gracias nuevamente

    • @PabloIEstadistica
      @PabloIEstadistica  3 роки тому +1

      Si interpreto bien tu mensaje, tendrías abundancias de 24 especies y una serie de variables explicativas. Antes de hacer 24 GLM, sugeriría que hicieras un grafico de covariación entre las 24 conteos y calcularas sus correlaciones, solo para examinar el problema. Una opción a hacer 24 GLMs, es hacer un GLM mixto con especie como efectos aleatorio (hay videos al respecto). Así obtendrías las relaciones entre la abundancia del ostracodo "promedio o típico" y las variables explicativas como efectos fijo, y además cuanto se desvía cada especie de estas relaciones típicas. Sería posible incluir las relaciones filogenéticas en un modelo (pues las especies no son realmente "independientes" como se asume en los modelos mixtos) en un analisis un poco más complejo. Pero hacer un GLM mixto ya sería un avance considerable y en la dirección correcta.

    • @christianveliz9419
      @christianveliz9419 3 роки тому

      @@PabloIEstadistica gracias por su sugerencia

  • @karlamariacarrerabarojas3099
    @karlamariacarrerabarojas3099 2 роки тому

    Hola! Muchas gracias por tu video, me ha sido de gran utilidad para mis análisis, ya que mis modelos tienen sobredispersión. En mi caso mi variable de respuesta es la abundancia de peces (conteos) en dos sistemas de canales diferentes y esto en función de variables ambientales como oxígeno, temperatura, pH y salinidad. Tengo duda en si debo hacer un glm para cada sistema de calaes, es decir, dos modelos o es correcto hacer sólo uno. Te agradezco tu respuesta

    • @PabloIEstadistica
      @PabloIEstadistica  2 роки тому

      Hola. Me alegro que haya sido de utilidad.
      Si quieres evaluar si el efecto de las vars explicativas sobre los conteos de peces difiere según el canal, deberías hacer un solo modelo con interacciones canal*var explicativa para aquellas variables explicativas para las que sea a priori relevante hacer la evaluación. Para decidir "relevante", yo me basaría en a) lo que se conoce del sistema bajo estudio b) como eventualmente explicarías por el que el efecto del O2 sobre los conteos es difrente entre canales c) un analisis exploratorio de datos. Además, puedes solamente inlcluir canal como variable explicativa categorica en un modelo estadisticso sin interacciones, y ello evaluaría si la la media de los conteos difiere entre canales.
      Espero esto te que ayude.
      Saludos

  • @carlaocano6660
    @carlaocano6660 2 роки тому

    Hola, primero agradecerle por sus videos me han sido de gran utilidad. Le consulto no deberíamos quitar los diferenciales de pendiente que no resulten significativos? o Para el caso de un GLM que tenga coeficientes del modelo final, no significativo. De nuevo muchas gracias

    • @PabloIEstadistica
      @PabloIEstadistica  2 роки тому

      Hola
      La respuesta es NO (así, con mayúsculas). El objetivo del ajuste de modelos estadísticos NO es obtener efectos estadísticamente significativos en el modelo final. Si haces una selección de modelos empleando diferencias de AIC o el test de cocientes de verosimilitudes (test de Wilks) para simplificar un modelo inicial, en el modelo final perfectamente pueden quedar términos o efectos cuyo p-valor sea >0.05. Esto NO es un error o una deficiencia del proceso de selección de modelos. De paso, saber cuales efectos no fueron retenidos en el modelo final o resultaron ser estadísticamente significativos (que no es lo mismo!) es tan importante como saber cuáles lo son.
      Me alegro que los videos te hayan sido de utilidad.
      Saludos.

  • @elylezama239
    @elylezama239 3 роки тому

    Me encanto su video, usted explica muy bien. Buscando como hacer un modelo lineal generalizado tuve la fortuna de encontrar esta explicación. Quiero aprovechar este mensaje para consultarle si puedo realizar un GLM con una variable de respuesta (conteos) en función de dos variables categóricas??

    • @PabloIEstadistica
      @PabloIEstadistica  3 роки тому

      Gracias por tu comentario. Si tienes una var de respuesta que es un conteo, lo primero que tienes que hacer es decidir si la modeals con la distr Poisson o Binomial Negativa usandio por ej el paquete fitdistrplus comparando la distrib acumuladas y los qqplots. Por supuesto que se pueden ajustar modelos con más de una variable explciativa categórica o numérica. En el 1er caso, lo que tienes que decidir es si las vars categóricas A y B tienen efectos aditivos (A+B) o interactivos A*B (que es lo mismo que escribir A+B+A:B) sobre la media de la var de respuesta. Utiliza tu conocimiento de los antecedentes del problema en cuestión para decidir si tiene sentido (y, eventualmente, cómo explicarías) una interacción entre los efectos de las vars explicativas.

    • @elylezama239
      @elylezama239 3 роки тому

      @@PabloIEstadistica Muchas gracias por su pronta respuesta :). Si usted me permite le contaré sobre los antecedentes del problema. Quiero analizar si existe un efecto del sexo, población y año, y la interacción entre estos sobre la producción de frutos. Esta es una especie de árbol donde hay hembras y hermafroditas (sexo) donde medí el número de frutos por árbol para 5 poblaciones y 3 años.

  • @wendycanto696
    @wendycanto696 Рік тому

    buenas noches, una pregunta ¿qué familia de GLM puedo usar si tengo datos continuos y una distribución con sesgo negativo?

    • @PabloIEstadistica
      @PabloIEstadistica  Рік тому

      Hola.
      Si interpreto bien lo que indicas, tu pregunta no tiene una respuesta trivial. Sesgo negativo quiere decir que tienes una mayor frecuencia de valores altos (mayores que la media) que de valores bajos (menores que la media). No conozco ninguna distr de probabilidades de uso corriente (y esto no quiere decir que no exista) que permita modelar adecuadamente este tipo de variables. Ciertamente ninguna de las distr que forman parte de la familia exponencial (que son la basse de los GLM) puede hacerlo. Asi que sugiero primero verifiques si realmente la distr de tu var de respuesta tiene una marcada asiemetria como la que describes. Segundo, sugiero que verifiques si no hay marcados errores evidentes en la toma de estos datos, pues al menos son inusuales, lo que no quiere decir que sean incorrectos. Si el grado de asimetria es menor, acaso puedas modelar estos datos con una distr Normal, y probablemente tengas que modelar la heterogeneidad de varianzas, ya que un GLM con distr Normal asume que hay una varianza común e identica para todos los Y. Otra opcion a explorar seria transformar esta variable de respuesta con alguna función matematica (acaso exp?) que haga a la distriibucion un poco m{as cercana a simétrica. Nunca he tenido que enfrentar un analisis con este tipo de variable de respuesta.
      Espero que esto ayude,
      Saludos

  • @sebastiangenero
    @sebastiangenero 2 роки тому

    @Pablo Inchausti Estadistica quiero decirte que desde que encontré este canal abandoné Netflix y los Simpsons y ahora hago maratones de fin de semana con tus videos de GLM! Gracias Pablo por tu generosidad! Por favor podrias mencionar cual es la base de datos que estás usando en este video (invertebrados en 9 playas de Holanda) la busqué por todos lados y no la encuentro (encontre una RIKZ, pero no es esta)

    • @PabloIEstadistica
      @PabloIEstadistica  2 роки тому +1

      Hola,
      Pues haces muy mal ya que los Simpson es en mi opinion uno de los mejores programas de Tv de los útimos 25 años. El set de datos empleado en el ejemplo de los GLM conteos es efectivamente RIKZ sde uno de los libros de Zuur et al (2006, creo), al que arbitrariamente le añadí una variable categorica tipo de playa ya que necesitaba explicar la situación de una var explicativa numérica (NAP: nivel mdeio de la marea) y una categórica (type: inventada por mi).
      Igual puse en mi sitio web (sites.google.com/view/pablo-inchausti/) los scripts y datos de los ejemplos resueltos en mi curso de posgrado.
      Saludos

    • @sebastiangenero
      @sebastiangenero 2 роки тому

      @@PabloIEstadistica muchisimas gracias Pablo!

    • @davidmontano6540
      @davidmontano6540 Рік тому

      @@PabloIEstadistica Disculpe, para poder ver su material nos pide acceso.

  • @kroche24
    @kroche24 3 роки тому

    Hola buenas tardes, cuales son las especicificaciones contenidas en my.theme? porque cuando coloco esto en R me dice error, objeto my.theme no encontrado. Gracias!

    • @PabloIEstadistica
      @PabloIEstadistica  3 роки тому

      Yo puse: my.theme=theme(axis.title=element_text(size=rel(3)),
      axis.text= element_text(size = rel(2)),
      panel.border=element_rect(fill=NA,size=2,color="black")), pero en realidad puedes poner lo que quieras. size=rel(3) quiere decir tamaño relativo 3 veces mayor que el tamaño por defecto; pouedes poner size= 18 o lo que quieras.

    • @kroche24
      @kroche24 3 роки тому

      @@PabloIEstadistica Chévere, muchas gracias!