Cómo hacer un diagrama de cajas (Boxplot) con R

Поділитися
Вставка
  • Опубліковано 3 гру 2024

КОМЕНТАРІ • 22

  • @naox1411
    @naox1411 5 років тому +6

    Recordando los viejos (dolorosos) tiempos

  • @mariamaldonado9285
    @mariamaldonado9285 4 роки тому +1

    Como hace para cambiar los nombres por la de cada variable en cada gráfico?

    • @pelempito1
      @pelempito1  4 роки тому

      Quizá no he entendido bien la pregunta. Si te refieres a cómo poner el nombre de cada variable (a, b o c) en el título del gráfico correspondiente, y siguiendo con el ejemplo mostrado, bastaría con usar "main", algo tal que ésto:
      clastosatr

  • @no-bl6pu
    @no-bl6pu 4 роки тому

    como hago para cambiar el get(z). haces en el video un boxplot de varias columnas, quiero poner un nombre a cada Y, como puedo hacerlo.

    • @pelempito1
      @pelempito1  4 роки тому

      Podría ser ésta una solución:
      clastosatr %
      gather(eje, valor, -`código de lugar`) %>%
      ggplot() +
      aes(x = `código de lugar`, y = valor) +
      geom_boxplot() +
      facet_grid(~ eje) +
      theme_bw()

    • @no-bl6pu
      @no-bl6pu 4 роки тому

      @@pelempito1 voy a intentarlo, ya te cuento. Gracias

  • @jorgecaicedo3727
    @jorgecaicedo3727 4 роки тому +8

    SI a eso le llamas explicar!?, mostraste un código no mas, no lo explicaste

  • @marinalopez7420
    @marinalopez7420 4 роки тому

    Hola buenas tardes, muchas gracias por el vídeo. Cuál sería un poco la interpretación de todos los diagramas juntos, para poder compararlos...

    • @pelempito1
      @pelempito1  4 роки тому +6

      El objetivo del diagrama de cajas es comparar estadísticos descriptivos básicos entre muestras. Dichos estadísticos incluyen los cuartiles y la mediana, así como valores máximos, mínimos, outliers (valores atípicos) y rangos intercuartílicos (RIC). En el gráfico del minuto 3:33, las muestras CPU4, CPU6 y CPU7 comparten medianas del eje **a** (largo) de sus clastos, que es la línea negra ubicada dentro de cada caja (con estadística inferencial se podría evaluar si existe homogeneidad entre medianas), y algo parecido ocurre entre CPU2, CPU3 y CPU5. Adicionalmente, CPU4 y CPU6 parecen tener rangos intercuartílico similares (la anchura de la caja). Las muestras 1, 2, 4 y 7 tienen outliers, lo que significa que algunos clastos superan el valor máximo, definido como Cuartil 3 + 1.5*RIC

    • @marinalopez7420
      @marinalopez7420 4 роки тому

      @@pelempito1 muchas gracias!!!

  • @jeanpierrerodriguezmirano5317
    @jeanpierrerodriguezmirano5317 3 роки тому

    Alguien sabe cuál es el paquete que debo descargar para la función "clastosatr", por favor. Me salta un mensaje que dice: object 'clastosatr' not found

    • @pelempito1
      @pelempito1  3 роки тому +1

      Estas líneas, que no aparecen en el vídeo, pero que están en el gist de GitHub, deben colocarse al inicio (ver aquí: gist.github.com/geofis/0d6d6426e4bc2ef6768f1c0d87e962f2):
      #Making a boxplot in R
      #Set working directory
      # setwd() #Choose a folder that you can locate
      setwd(tempdir()) #Let R set a folder for you. Locate it with getwd()
      getwd() #Show folder
      #Read the data
      urldatos

    • @jeanpierrerodriguezmirano5317
      @jeanpierrerodriguezmirano5317 3 роки тому

      @@pelempito1 obrigado :)

  • @jorgeh.s2188
    @jorgeh.s2188 4 роки тому

    Gracias me sirvió mucho.

  • @littlekato5762
    @littlekato5762 3 роки тому

    nice vid

  • @marcelvalerysoulodrevailla8986
    @marcelvalerysoulodrevailla8986 3 роки тому

    Hola, Agradezco tu video, pero no entendí nada, el video muestra solo lo que hace, pero no, como se hace?

    • @pelempito1
      @pelempito1  3 роки тому +1

      La idea del vídeo era mostrar cómo hacer el diagrama en R, sin entrar en los conceptos subyacentes o las técnicas de cómo hacerlo. No sé si entendí la pregunta/petición, pero me parece que te refieres a que no explico cómo se hace de manera general. Si es esto último, el diagrama de cajas se hace de la siguiente manera: utilizando una variable cuantitativa, se organizarían los datos ascendentemente, se calcularían los cuartiles (cuartil, mediana, cuartil), el rango intercuartílico o RIC (tercer cuartil menos primer cuartil, es decir, Q3-Q1), y los valores máximo y mínimo (propios del diagrama, no los absolutos), que son los bigotes, con los que luego se obtienen los valores extremos o atípicos. Los valores Q1 y Q3 se usan para los límites de la caja, y la mediana para dibujar la línea dentro de la caja. El máximo se obtiene sumando al tercer cuartil el RIC por 1.5 y el mínimo restando RIC*1.5 al primer cuartil. Dichos valores máximo y mínimo se usarán para dibujar los bigotes. Todos los valores que queden fuera de los bigotes serán considerados valores extremos, y se dibujan normalmente como círculos, asteriscos u otra simbología puntual.

    • @marcelvalerysoulodrevailla8986
      @marcelvalerysoulodrevailla8986 3 роки тому

      @@pelempito1 holaaa, gracias por tu respuesta... yo entiendo cómo hacer el diagrama teóricamente, pero necesito armar un boxplot en R con 2 grupos. Y así comparar las cajas. Soy nuevo en R, y si no me equivoco, parece que no se puede hacer esto haciendo clicks, al parecer debo escribir el código. Es correcto?? Te agradezco nuevamente por tu respuesta. Saludos

    • @pelempito1
      @pelempito1  3 роки тому

      Ah, ahora entiendo.
      En R prácticamente todo lo harás con código. Sin embargo, hay muchísimo código de ejemplo en foros de ayuda y páginas de tutoriales, y de hecho el código de este vídeo imagino que lo habrás localizado en la descripción. Hay un paquete de R llamado R Commander (Rcmdr) que ofrece una especie de interfaz gráfica, aunque no estoy familiarizado con él; de todas formas, no recomiendo salir del entorno de programación, porque escribiendo código consigues mayor versatilidad.
      Por otra parte, comentar que hay aplicaciones de interfaz gráfica, como Gnumeric, que ofrecen boxplots a golpe de clics.

  • @pelempito1
    @pelempito1  3 роки тому

    Estas líneas, que no aparecen en el vídeo, pero que están en el gist de GitHub, deben colocarse al inicio (ver aquí: gist.github.com/geofis/0d6d6426e4bc2ef6768f1c0d87e962f2):
    #Making a boxplot in R
    #Set working directory
    # setwd() #Choose a folder that you can locate
    setwd(tempdir()) #Let R set a folder for you. Locate it with getwd()
    getwd() #Show folder
    #Read the data
    urldatos

  • @Janthonysilvajim
    @Janthonysilvajim 2 роки тому

    pésima explicación y un acento muy feo!