Quizá no he entendido bien la pregunta. Si te refieres a cómo poner el nombre de cada variable (a, b o c) en el título del gráfico correspondiente, y siguiendo con el ejemplo mostrado, bastaría con usar "main", algo tal que ésto: clastosatr
El objetivo del diagrama de cajas es comparar estadísticos descriptivos básicos entre muestras. Dichos estadísticos incluyen los cuartiles y la mediana, así como valores máximos, mínimos, outliers (valores atípicos) y rangos intercuartílicos (RIC). En el gráfico del minuto 3:33, las muestras CPU4, CPU6 y CPU7 comparten medianas del eje **a** (largo) de sus clastos, que es la línea negra ubicada dentro de cada caja (con estadística inferencial se podría evaluar si existe homogeneidad entre medianas), y algo parecido ocurre entre CPU2, CPU3 y CPU5. Adicionalmente, CPU4 y CPU6 parecen tener rangos intercuartílico similares (la anchura de la caja). Las muestras 1, 2, 4 y 7 tienen outliers, lo que significa que algunos clastos superan el valor máximo, definido como Cuartil 3 + 1.5*RIC
Alguien sabe cuál es el paquete que debo descargar para la función "clastosatr", por favor. Me salta un mensaje que dice: object 'clastosatr' not found
Estas líneas, que no aparecen en el vídeo, pero que están en el gist de GitHub, deben colocarse al inicio (ver aquí: gist.github.com/geofis/0d6d6426e4bc2ef6768f1c0d87e962f2): #Making a boxplot in R #Set working directory # setwd() #Choose a folder that you can locate setwd(tempdir()) #Let R set a folder for you. Locate it with getwd() getwd() #Show folder #Read the data urldatos
La idea del vídeo era mostrar cómo hacer el diagrama en R, sin entrar en los conceptos subyacentes o las técnicas de cómo hacerlo. No sé si entendí la pregunta/petición, pero me parece que te refieres a que no explico cómo se hace de manera general. Si es esto último, el diagrama de cajas se hace de la siguiente manera: utilizando una variable cuantitativa, se organizarían los datos ascendentemente, se calcularían los cuartiles (cuartil, mediana, cuartil), el rango intercuartílico o RIC (tercer cuartil menos primer cuartil, es decir, Q3-Q1), y los valores máximo y mínimo (propios del diagrama, no los absolutos), que son los bigotes, con los que luego se obtienen los valores extremos o atípicos. Los valores Q1 y Q3 se usan para los límites de la caja, y la mediana para dibujar la línea dentro de la caja. El máximo se obtiene sumando al tercer cuartil el RIC por 1.5 y el mínimo restando RIC*1.5 al primer cuartil. Dichos valores máximo y mínimo se usarán para dibujar los bigotes. Todos los valores que queden fuera de los bigotes serán considerados valores extremos, y se dibujan normalmente como círculos, asteriscos u otra simbología puntual.
@@pelempito1 holaaa, gracias por tu respuesta... yo entiendo cómo hacer el diagrama teóricamente, pero necesito armar un boxplot en R con 2 grupos. Y así comparar las cajas. Soy nuevo en R, y si no me equivoco, parece que no se puede hacer esto haciendo clicks, al parecer debo escribir el código. Es correcto?? Te agradezco nuevamente por tu respuesta. Saludos
Ah, ahora entiendo. En R prácticamente todo lo harás con código. Sin embargo, hay muchísimo código de ejemplo en foros de ayuda y páginas de tutoriales, y de hecho el código de este vídeo imagino que lo habrás localizado en la descripción. Hay un paquete de R llamado R Commander (Rcmdr) que ofrece una especie de interfaz gráfica, aunque no estoy familiarizado con él; de todas formas, no recomiendo salir del entorno de programación, porque escribiendo código consigues mayor versatilidad. Por otra parte, comentar que hay aplicaciones de interfaz gráfica, como Gnumeric, que ofrecen boxplots a golpe de clics.
Estas líneas, que no aparecen en el vídeo, pero que están en el gist de GitHub, deben colocarse al inicio (ver aquí: gist.github.com/geofis/0d6d6426e4bc2ef6768f1c0d87e962f2): #Making a boxplot in R #Set working directory # setwd() #Choose a folder that you can locate setwd(tempdir()) #Let R set a folder for you. Locate it with getwd() getwd() #Show folder #Read the data urldatos
Recordando los viejos (dolorosos) tiempos
Como hace para cambiar los nombres por la de cada variable en cada gráfico?
Quizá no he entendido bien la pregunta. Si te refieres a cómo poner el nombre de cada variable (a, b o c) en el título del gráfico correspondiente, y siguiendo con el ejemplo mostrado, bastaría con usar "main", algo tal que ésto:
clastosatr
como hago para cambiar el get(z). haces en el video un boxplot de varias columnas, quiero poner un nombre a cada Y, como puedo hacerlo.
Podría ser ésta una solución:
clastosatr %
gather(eje, valor, -`código de lugar`) %>%
ggplot() +
aes(x = `código de lugar`, y = valor) +
geom_boxplot() +
facet_grid(~ eje) +
theme_bw()
@@pelempito1 voy a intentarlo, ya te cuento. Gracias
SI a eso le llamas explicar!?, mostraste un código no mas, no lo explicaste
es todo lo que necesitamos xd
Hola buenas tardes, muchas gracias por el vídeo. Cuál sería un poco la interpretación de todos los diagramas juntos, para poder compararlos...
El objetivo del diagrama de cajas es comparar estadísticos descriptivos básicos entre muestras. Dichos estadísticos incluyen los cuartiles y la mediana, así como valores máximos, mínimos, outliers (valores atípicos) y rangos intercuartílicos (RIC). En el gráfico del minuto 3:33, las muestras CPU4, CPU6 y CPU7 comparten medianas del eje **a** (largo) de sus clastos, que es la línea negra ubicada dentro de cada caja (con estadística inferencial se podría evaluar si existe homogeneidad entre medianas), y algo parecido ocurre entre CPU2, CPU3 y CPU5. Adicionalmente, CPU4 y CPU6 parecen tener rangos intercuartílico similares (la anchura de la caja). Las muestras 1, 2, 4 y 7 tienen outliers, lo que significa que algunos clastos superan el valor máximo, definido como Cuartil 3 + 1.5*RIC
@@pelempito1 muchas gracias!!!
Alguien sabe cuál es el paquete que debo descargar para la función "clastosatr", por favor. Me salta un mensaje que dice: object 'clastosatr' not found
Estas líneas, que no aparecen en el vídeo, pero que están en el gist de GitHub, deben colocarse al inicio (ver aquí: gist.github.com/geofis/0d6d6426e4bc2ef6768f1c0d87e962f2):
#Making a boxplot in R
#Set working directory
# setwd() #Choose a folder that you can locate
setwd(tempdir()) #Let R set a folder for you. Locate it with getwd()
getwd() #Show folder
#Read the data
urldatos
@@pelempito1 obrigado :)
Gracias me sirvió mucho.
nice vid
Hola, Agradezco tu video, pero no entendí nada, el video muestra solo lo que hace, pero no, como se hace?
La idea del vídeo era mostrar cómo hacer el diagrama en R, sin entrar en los conceptos subyacentes o las técnicas de cómo hacerlo. No sé si entendí la pregunta/petición, pero me parece que te refieres a que no explico cómo se hace de manera general. Si es esto último, el diagrama de cajas se hace de la siguiente manera: utilizando una variable cuantitativa, se organizarían los datos ascendentemente, se calcularían los cuartiles (cuartil, mediana, cuartil), el rango intercuartílico o RIC (tercer cuartil menos primer cuartil, es decir, Q3-Q1), y los valores máximo y mínimo (propios del diagrama, no los absolutos), que son los bigotes, con los que luego se obtienen los valores extremos o atípicos. Los valores Q1 y Q3 se usan para los límites de la caja, y la mediana para dibujar la línea dentro de la caja. El máximo se obtiene sumando al tercer cuartil el RIC por 1.5 y el mínimo restando RIC*1.5 al primer cuartil. Dichos valores máximo y mínimo se usarán para dibujar los bigotes. Todos los valores que queden fuera de los bigotes serán considerados valores extremos, y se dibujan normalmente como círculos, asteriscos u otra simbología puntual.
@@pelempito1 holaaa, gracias por tu respuesta... yo entiendo cómo hacer el diagrama teóricamente, pero necesito armar un boxplot en R con 2 grupos. Y así comparar las cajas. Soy nuevo en R, y si no me equivoco, parece que no se puede hacer esto haciendo clicks, al parecer debo escribir el código. Es correcto?? Te agradezco nuevamente por tu respuesta. Saludos
Ah, ahora entiendo.
En R prácticamente todo lo harás con código. Sin embargo, hay muchísimo código de ejemplo en foros de ayuda y páginas de tutoriales, y de hecho el código de este vídeo imagino que lo habrás localizado en la descripción. Hay un paquete de R llamado R Commander (Rcmdr) que ofrece una especie de interfaz gráfica, aunque no estoy familiarizado con él; de todas formas, no recomiendo salir del entorno de programación, porque escribiendo código consigues mayor versatilidad.
Por otra parte, comentar que hay aplicaciones de interfaz gráfica, como Gnumeric, que ofrecen boxplots a golpe de clics.
Estas líneas, que no aparecen en el vídeo, pero que están en el gist de GitHub, deben colocarse al inicio (ver aquí: gist.github.com/geofis/0d6d6426e4bc2ef6768f1c0d87e962f2):
#Making a boxplot in R
#Set working directory
# setwd() #Choose a folder that you can locate
setwd(tempdir()) #Let R set a folder for you. Locate it with getwd()
getwd() #Show folder
#Read the data
urldatos
pésima explicación y un acento muy feo!