Será que el Anosim en Vegan permite obtener el R y p valores entre pares de factores? Ya que cuando se trabaja con solo dos hábitats de muestreo es fácil obtener el resultado. Pero cuando hay tres o más hábitats y la prueba anosim sugiere diferencias significativas ¿qué código seguir para encontrar los R y p valores entre pares de hábitats? En PAST si se pueden obtener esos valores, será que en R no se puede? Le agradecería mucho si me colabora con esta cuestión
Lo mismo que en PAST, se realiza una prueba ANOSIM para cada comparación. que se quiera verficar, si la p general es menor que el alfa de referencia. Si son comparaciones múltiples para usarlas como a posteriori se debería corregir las probabilidades obtenidas por Bonferroni
Excelente explicación, muy sencillo de entender con tu video. Solo me gustaría saber cómo podría representar los datos obtenidos con ANOSIM. Muchas gracias!
Lo mejor sería usar un nMDS con los objetos con color según el nivel del factor analizado en el ANOSIM. En este video se muestra ejemplo de nMDS y PCA: ua-cam.com/video/foXTXSTt114/v-deo.html
Hola! Muchas gracias por el video. Tengo una duda: si quiero comparar variables del uso del microhábitat (temperatura, humedad, % cobertura, tipo de sustrato...) entre 4 especies. ¿Esto se podría hacer usando ANOSIM y NMDS? Porque en los ejemplos que he visto, solo utilizan datos de abundancia de las especies en diferentes tipos de ecosistema. En dado caso que sea posible: ¿cómo debería estructurarse la base de datos? ¿se usaría otro índice diferente al de Bray-Curtis?. Gracias de nuevo!
Hola, se puede usar ANOSIM y MDS. Las columnas serían las variables ambientales. las filas serían las réplicas. Las celdas de la matriz sería el valor de la variable para esa réplica. Tiene que tener un columna en otra matriz que tenga a que especie corresponde cada réplica. Ese sería su factor fijo a comparar. Con eso puede hacer el ANOSIM y usarlo para etiquetar o dar color a los objetos en el MDS. OJO, debe normalizar (transformar) las variables y estandarizarlas (promedio=0 y variancia=1) antes de correr los análisis. El MDS y ANOSIM para variables cuantitativas tal vez sea mejor con distancia Euclidiana. Otra opción que podría ser más común para ese tipo de datos es hacer un PCA y un PERMANOVA de esa matriz normalizada y estandarizada.
Logaritmo de la abundancia hace que los datos de abundancia muy diferentes en magnitud se presenten en una escala menos amplia. La forma de calculo del logaritmo natural sería el área bajo la curva 1/n respecto al cambio en n o dn, con n igual al número de individuos iniciando con n=1 (entonces aunque cambie el número de abundancia de los datos "crudos", en realidad siempre nos estamos refiriendo a la abundancia aunque transformemos los datos). Muchas veces se logra o se acerca mucho la normalidad la distribución de estos datos transformados y eso mejora la estimación que realizan muchas de las pruebas estadísticas. En el caso de las pruebas mutivariables que se basan en distancias o indices de similitud, se evita el efecto de herradura de caballo, que es por diferencias grandes en la magnitud de los datos hacer que extremos diferentes de un gradiente (o factor con varios niveles) se presenten con una mayor similitud que la real. Con la transformación se evita esto y los gradientes se presentan de forma correcta. Existen otras transformaciones aplicables comúnmente a la abundancia yendo de la menos extrema como raíz cuadrada, pasando por logaritmo natural, hasta la más extrema que es raíz cuarta (entre las más usadas). Se menciona que transformar a raiz cuarta es muy cercano a usar datos de presencia - ausencia
Hola Jeff, muchas gracias por la información. He visto en algunos paper que utilizan también el permanova para variables respuestas como riqueza y biomasa. Estoy buscando ese tipo de información pero no he tenido éxito, mi pregunta va a como se debería crear este tipo de matriz para riqueza y biomasa. Saludos.
Si la matriz es filas las muestras, columnas las especies y el valor de cada celda es la biomasa, se hace similar (puede usarse bray, pero se suele recomendar morisita para biomas). Posiblemente tenga que transformar los datos si son muy diferentes en magnitud. En este video hay un ejemplo de la matriz de abundancia que use para el anosim y permanova: ua-cam.com/video/foXTXSTt114/v-deo.html Si la matriz es para riqueza de especies, me parece que se refiere a presencia-ausencia de cada especie en las muestras, si es así, entonces las filas con muestras, las columnas con especies y las celdas tendría valor 1 para especie presente y 0 para especie ausente. Se puede usar bray de distancia que con 1 y 0 se convierte en el indice de Sorensen, o bien usar jaccard en el comando de anosim. Si es un solo vector como respuesta con la cantidad de especies por muestra, no sería esta la prueba apropiada, sino más bien un anova o un kruskal-Wallis.
Hola, en el ejemplo que diste se encontraron diferencias en cada factor y en la interacción . Cómo puedo hacer una prueba post hoc como pairwise en este caso, para complementar y ver exactamente entre quienes se da diferencia significativa. Gracias.
Gracias por la información. Al correr el adonis me sale el siguiente resultado. Porqué no da el resultado de R2, F y P? Df SumOfSqs R2 F Pr(>F) Model 4 1.7373 1 Residual 0 0.0000 0 Total 4 1.7373 1
Parece que tienes muy pocas muestras, debes tener replicas dentro de cada nivel del factor. Se recomiendan 5 al menos dentro de cada nivel para tener suficientes permutaciones . Otra situación es que tengas valores sin variación dentro de los niveles de factor.
Sí, no hay problema, pero al menos debe tener 5 réplicas por grupo para que las permutaciones no sean redundantes. Es bueno hacer alguna medición de dispersión entre las muestras con el comando betadisper para diferenciar si el cambio entre niveles del factor se debe a aumento de la variabilidad interna de algún grupo.
Hola, la forma de ordenarla es en las columnas las especies (atributos) y en las filas las muestras (objetos), otro vector aparte sería el factor con los niveles. En RStudio puede verla en el minuto 15:16 del video para Cluster en ua-cam.com/video/2Sf5lA-hNhk/v-deo.html
Muito bom, excelente explicação. Obrigado.
Será que el Anosim en Vegan permite obtener el R y p valores entre pares de factores? Ya que cuando se trabaja con solo dos hábitats de muestreo es fácil obtener el resultado. Pero cuando hay tres o más hábitats y la prueba anosim sugiere diferencias significativas ¿qué código seguir para encontrar los R y p valores entre pares de hábitats? En PAST si se pueden obtener esos valores, será que en R no se puede? Le agradecería mucho si me colabora con esta cuestión
Lo mismo que en PAST, se realiza una prueba ANOSIM para cada comparación. que se quiera verficar, si la p general es menor que el alfa de referencia. Si son comparaciones múltiples para usarlas como a posteriori se debería corregir las probabilidades obtenidas por Bonferroni
Excelente explicación, muy sencillo de entender con tu video. Solo me gustaría saber cómo podría representar los datos obtenidos con ANOSIM.
Muchas gracias!
Lo mejor sería usar un nMDS con los objetos con color según el nivel del factor analizado en el ANOSIM. En este video se muestra ejemplo de nMDS y PCA: ua-cam.com/video/foXTXSTt114/v-deo.html
Hola! Muchas gracias por el video. Tengo una duda: si quiero comparar variables del uso del microhábitat (temperatura, humedad, % cobertura, tipo de sustrato...) entre 4 especies. ¿Esto se podría hacer usando ANOSIM y NMDS? Porque en los ejemplos que he visto, solo utilizan datos de abundancia de las especies en diferentes tipos de ecosistema. En dado caso que sea posible: ¿cómo debería estructurarse la base de datos? ¿se usaría otro índice diferente al de Bray-Curtis?. Gracias de nuevo!
Hola, se puede usar ANOSIM y MDS. Las columnas serían las variables ambientales. las filas serían las réplicas. Las celdas de la matriz sería el valor de la variable para esa réplica. Tiene que tener un columna en otra matriz que tenga a que especie corresponde cada réplica. Ese sería su factor fijo a comparar. Con eso puede hacer el ANOSIM y usarlo para etiquetar o dar color a los objetos en el MDS. OJO, debe normalizar (transformar) las variables y estandarizarlas (promedio=0 y variancia=1) antes de correr los análisis. El MDS y ANOSIM para variables cuantitativas tal vez sea mejor con distancia Euclidiana. Otra opción que podría ser más común para ese tipo de datos es hacer un PCA y un PERMANOVA de esa matriz normalizada y estandarizada.
Gracias por el video!! Tengo una pregunta por qué se recomienda log transform los datos de abundancia de especies?
Logaritmo de la abundancia hace que los datos de abundancia muy diferentes en magnitud se presenten en una escala menos amplia. La forma de calculo del logaritmo natural sería el área bajo la curva 1/n respecto al cambio en n o dn, con n igual al número de individuos iniciando con n=1 (entonces aunque cambie el número de abundancia de los datos "crudos", en realidad siempre nos estamos refiriendo a la abundancia aunque transformemos los datos). Muchas veces se logra o se acerca mucho la normalidad la distribución de estos datos transformados y eso mejora la estimación que realizan muchas de las pruebas estadísticas. En el caso de las pruebas mutivariables que se basan en distancias o indices de similitud, se evita el efecto de herradura de caballo, que es por diferencias grandes en la magnitud de los datos hacer que extremos diferentes de un gradiente (o factor con varios niveles) se presenten con una mayor similitud que la real. Con la transformación se evita esto y los gradientes se presentan de forma correcta. Existen otras transformaciones aplicables comúnmente a la abundancia yendo de la menos extrema como raíz cuadrada, pasando por logaritmo natural, hasta la más extrema que es raíz cuarta (entre las más usadas). Se menciona que transformar a raiz cuarta es muy cercano a usar datos de presencia - ausencia
Hola Jeff, muchas gracias por la información.
He visto en algunos paper que utilizan también el permanova para variables respuestas como riqueza y biomasa. Estoy buscando ese tipo de información pero no he tenido éxito, mi pregunta va a como se debería crear este tipo de matriz para riqueza y biomasa.
Saludos.
Si la matriz es filas las muestras, columnas las especies y el valor de cada celda es la biomasa, se hace similar (puede usarse bray, pero se suele recomendar morisita para biomas). Posiblemente tenga que transformar los datos si son muy diferentes en magnitud. En este video hay un ejemplo de la matriz de abundancia que use para el anosim y permanova: ua-cam.com/video/foXTXSTt114/v-deo.html
Si la matriz es para riqueza de especies, me parece que se refiere a presencia-ausencia de cada especie en las muestras, si es así, entonces las filas con muestras, las columnas con especies y las celdas tendría valor 1 para especie presente y 0 para especie ausente. Se puede usar bray de distancia que con 1 y 0 se convierte en el indice de Sorensen, o bien usar jaccard en el comando de anosim.
Si es un solo vector como respuesta con la cantidad de especies por muestra, no sería esta la prueba apropiada, sino más bien un anova o un kruskal-Wallis.
Hola, en el ejemplo que diste se encontraron diferencias en cada factor y en la interacción . Cómo puedo hacer una prueba post hoc como pairwise en este caso, para complementar y ver exactamente entre quienes se da diferencia significativa. Gracias.
Hola lo que puede hacer es una vez con un p
Gracias por la información. Al correr el adonis me sale el siguiente resultado. Porqué no da el resultado de R2, F y P?
Df SumOfSqs R2 F Pr(>F)
Model 4 1.7373 1
Residual 0 0.0000 0
Total 4 1.7373 1
Parece que tienes muy pocas muestras, debes tener replicas dentro de cada nivel del factor. Se recomiendan 5 al menos dentro de cada nivel para tener suficientes permutaciones . Otra situación es que tengas valores sin variación dentro de los niveles de factor.
Hola. En otro video explicas como hacer el PCA que muestras aqui?
ua-cam.com/video/foXTXSTt114/v-deo.html
permanova es robusto a diseños no balanceados?
Sí, no hay problema, pero al menos debe tener 5 réplicas por grupo para que las permutaciones no sean redundantes. Es bueno hacer alguna medición de dispersión entre las muestras con el comando betadisper para diferenciar si el cambio entre niveles del factor se debe a aumento de la variabilidad interna de algún grupo.
Como se debe organizar la matriz?
Hola, la forma de ordenarla es en las columnas las especies (atributos) y en las filas las muestras (objetos), otro vector aparte sería el factor con los niveles. En RStudio puede verla en el minuto 15:16 del video para Cluster en ua-cam.com/video/2Sf5lA-hNhk/v-deo.html