Lo bien que esto que haces me hubiera venido para mi aún inacabada tesis. Aquello me parece de pedales ahora... Serás estadístico, profesor, investigador, editor y todo eso, pero comunicando eres de lo mejor... How well you do this would have suited me for my still unfinished thesis. That past seems bicycle pedals to me now ... You will be a statistician, professor, researcher, editor and all that, but communicating you are the best ...
Holaaaa, síii. La verdad es que la estadística actual no tiene nada que ver con lo que nos habían enseñado. El poder computacional es brutal, pero no es nada con lo que se viene ;)
@@PabloVallejoMedina Hola pablo disculpe las molestia, estuve analizando unos datos que tengo y los corri con este scrip pero no pude correr la parte donde se genera un resumen dentro de cada cluster. A que paquete pertenece la funcion mutate? me sale este error Error in mutate(., Cluster = pam3$clustering) : could not find function "mutate"
Pablo, muchas gracias por realizar chupitos de altísima calidad. Tengo 2 dudas que quisiera aclarar con ud caso sea posible: 1. Que hacer cuando aparece este mensaje ggrepel: 20 unlabeled data points (too many overlaps). Consider increasing max.overlaps 2 Qué significa o Dim1 e o DIm2 que aparece en los ejes del gráfico de los clusters? MUchas gracias
Hola Luz, 1: tienes demasiadas observaciones para tener encendido el REPEL = TRUE, mejor apágalo. 2. Son las dimensiones en las que se distribuye el AFC, que al ser 2D siempre serán 2.
Hola, Pablo Muy buen video, tengo una pregunta: ¿cómo haces para que R o la función correspondiente te acepte la columa no numerica en el objeto "df" y así mantenga el nombre de las ciudades, por ejemplo, en el momento de hacer el dendrograma? En mi caso sólo acepta columnas numericas, no estoy trabjando con la bases de datos que tu trabajas en este video.
Estimado, no usa variables cualitativas para estimar cantidad de cluster. Si tiro la "funcion fviz_nbclust(df, pam, method = "wss")" me da error por no ser 100% numeric?
Hola sí. Simplemente tienes que explorar la función fviz ;) sería algo así: fviz_cluster(k3, geom = "point", data = tudataframe[-1]) salvo que du data frame este organizado raro eso te debería servir.
@@hugoalbert4695 Al ponerle este argumento: index = "alllong" creo que le queda muy pesado para tus datos, ves de uno en uno o saca solo los que te interesen.
Hola Pablo, amé el video enserio ya comprendo mucho mejor todo, sin embargo cuando quiero aplicar mutate(cluster= pam.res$cluster), para poder ver un summary en tabla de las variables por clusters no me deja, sale que la función mutate no es encontrada ... debo instalar algo primero?
Muchas gracias. Hay otro video donde explico un poco lo de mutate (se llama de long format a wide) o algo así ;). Tienes que instalar antes dplyr y llamaro ;). Un saludo y genial que te haya gustado.
Hola Pablo, estoy haciendo un análisis aplicando este método. Tengo algunas dudas acerca de emplear el método kendall u otro, ya que mis datos son de tipo ordinal en una escala de 1 a 5. ¿Usarías otro para este tipo de datos? Muchas gracias por la info, no sabes lo que estoy aprendiendo :)
Estimado Pablo, excelente chupito, gracias por la explicación , tengo una duda, ¿si yo tengo un objeto hclust, podría convertirlo a data frame para graficarlo con ggplot y sacarle más jugo que solo el dendograma?
Sucede que pam es limitado en datos, exactamente en 65536, deberías trabajar con clara en vez de pam, ya que clara acepta cantidades de datos mas grandes.
Hola, tengo una dudade como cambiar la ruta de rstudio general para que me busque los paquetes dado que al intentar activar algun paquete me sale el siguiente error, de antemano gracias (quiero cambiarlo a "C:/") Error: package or namespace load failed for ‘readxl’ in get(Info[i, 1], envir = env): no fue posible abrir el archivo 'C:/Users/lOlguÃn/Documents/R/win-library/4.0/Rcpp/R/Rcpp.rdb': No such file or directory
@@PabloVallejoMedina gracias pero no es ese mi problema, a ver como me explico quiero redirigir donde r busque los paquetes y librerias porque esta buscando en documentos y el mombre de carpeta de usuario tiene tilde y quiero llevarlo a la base del disco c y se que hay una formula para ello
Hola Pablo! Muchas gracias por el video! Tengo un problema y creo que tiene que ver con que no puedo bajar la base de datos como un data frame. Y la primera columna es de texto... entonces no la normaliza... Probé algo que sugeriste en otro video pero no me funcionó era esto, dfitems
Muchas gracias por el video, pero tengo problemas al correr la línea 70, me arroja esto "Warning: Ignoring unknown parameters: fun" y luego me tira todos los valores iguales a cero, sería de mucha ayuda si sabes la respuesta. Saludos!
@@gorditaau Mhh no sé. Aquí parece que pueda haber una función que te ayude, pero no sé que puede estar pasando... www.r-bloggers.com/simplifying-ggplot2-code-by-doing-nothing/
Lo bien que esto que haces me hubiera venido para mi aún inacabada tesis. Aquello me parece de pedales ahora... Serás estadístico, profesor, investigador, editor y todo eso, pero comunicando eres de lo mejor... How well you do this would have suited me for my still unfinished thesis. That past seems bicycle pedals to me now ... You will be a statistician, professor, researcher, editor and all that, but communicating you are the best ...
Holaaaa, síii. La verdad es que la estadística actual no tiene nada que ver con lo que nos habían enseñado. El poder computacional es brutal, pero no es nada con lo que se viene ;)
Muchas gracias es lo que estaba buscando desde hace mucho tiempo. Exc canal con contenido muy bien explicado
Muchas gracias @Marlon. Me alegra te guste el contenido ;)
@@PabloVallejoMedina Hola pablo disculpe las molestia, estuve analizando unos datos que tengo y los corri con este scrip pero no pude correr la parte donde se genera un resumen dentro de cada cluster. A que paquete pertenece la funcion mutate? me sale este error Error in mutate(., Cluster = pam3$clustering) :
could not find function "mutate"
@@marlonguerrerocastro9673 dplyr
Excelente vídeo, muchas gracias.
De nada, un saludo ;)
Gracias por hacer entendible un tema complicado.
A ti.
Buen video. Me va a servir bastante.
Genial, me alegra ;)
Excelente explicaciòn
Muchas gracias ;)
Gracias por hacer estos videos carnal, explicas mucho mejor que mi maestra jaja
Cada maestrillo tiene su librillo ;). Me alegra te guste.
Pablo, muchas gracias por realizar chupitos de altísima calidad. Tengo 2 dudas que quisiera aclarar con ud caso sea posible: 1. Que hacer cuando aparece este mensaje ggrepel: 20 unlabeled data points (too many overlaps). Consider increasing max.overlaps
2 Qué significa o Dim1 e o DIm2 que aparece en los ejes del gráfico de los clusters?
MUchas gracias
Hola Luz,
1: tienes demasiadas observaciones para tener encendido el REPEL = TRUE, mejor apágalo.
2. Son las dimensiones en las que se distribuye el AFC, que al ser 2D siempre serán 2.
Hola, Pablo
Muy buen video, tengo una pregunta: ¿cómo haces para que R o la función correspondiente te acepte la columa no numerica en el objeto "df" y así mantenga el nombre de las ciudades, por ejemplo, en el momento de hacer el dendrograma?
En mi caso sólo acepta columnas numericas, no estoy trabjando con la bases de datos que tu trabajas en este video.
Hola, si tu error ya lo viví personalmente. Es que estados no es una variables, son los nombres de las filas. TIenes que utilizar este código:
df
@@PabloVallejoMedina !Muchas gracias!, el código ha funcionado con éxito. He podido hacer el dendrograma con los nombres de las localidades.
@@carlosm.galvancisneros5620 Súper, me alegro ;)
@@PabloVallejoMedina Muchas gracias, yo tenía la misma duda.
@@fernandomurillo7959 ¨De nada, tengo un video reciente sobre kmeans en super heroes donde lo soluciono ;)
Estimado, no usa variables cualitativas para estimar cantidad de cluster. Si tiro la "funcion fviz_nbclust(df, pam, method = "wss")" me da error por no ser 100% numeric?
Hola, no te entiendo bien.
Hoola si tengo variables tipo escalar de likerts del 1 al 7 ocuparia que metodo para clasificar
Hola, yo creo que este mismo podría servir. A ver cómo te va.
Muchas Gracias. Me sirvió de mucho. Solo una duda, hay forma de ocultar los labels y solo mostrar los puntos? Saludos.
Hola sí. Simplemente tienes que explorar la función fviz ;) sería algo así:
fviz_cluster(k3, geom = "point", data = tudataframe[-1]) salvo que du data frame este organizado raro eso te debería servir.
buenas noches... Pablo. Una pregunta.... ¿es posible incluir variables cuantitativas discretas o categóricas en esa rutina?
En principio sí, luego revisa si te está agrupando con cierta lógica. ;)
Buenas Pablo!
Al intentar ejecutar la línea: 'resnumclust
Muéstrame el error entero please ;)
@@PabloVallejoMedina Error in diag(var(Xuse)) : vector is too large
@@hugoalbert4695 Al ponerle este argumento: index = "alllong" creo que le queda muy pesado para tus datos, ves de uno en uno o saca solo los que te interesen.
Puedes hacer un fuzzy c medias? Y explicar eso del vector de pesos?
No sé se me vaya por ahí ahora mismo. De momento voy a dejar los clústeres. EN el futuro quizá lo añada ;)
Hola Pablo, amé el video enserio ya comprendo mucho mejor todo, sin embargo cuando quiero aplicar mutate(cluster= pam.res$cluster), para poder ver un summary en tabla de las variables por clusters no me deja, sale que la función mutate no es encontrada ... debo instalar algo primero?
Muchas gracias. Hay otro video donde explico un poco lo de mutate (se llama de long format a wide) o algo así ;). Tienes que instalar antes dplyr y llamaro ;). Un saludo y genial que te haya gustado.
¿Pablo para cuando organizas un botellón sobre R (curso)?. Es hora de juntarnos en un chupinazo!
Había pensando hacer un directo un día de estos, pero no suelo tener calma ahora mismo para hacerlo.
Hola Pablo, estoy haciendo un análisis aplicando este método. Tengo algunas dudas acerca de emplear el método kendall u otro, ya que mis datos son de tipo ordinal en una escala de 1 a 5. ¿Usarías otro para este tipo de datos?
Muchas gracias por la info, no sabes lo que estoy aprendiendo :)
Uff no lo sé. Iría probando a ver qué tal funciona. Pero a priori no le veo mucho problema a Kendall ;)
@@PabloVallejoMedina Muchas gracias
Estimado Pablo, excelente chupito, gracias por la explicación , tengo una duda, ¿si yo tengo un objeto hclust, podría convertirlo a data frame para graficarlo con ggplot y sacarle más jugo que solo el dendograma?
Hola Samir, eso no es lo que hago al final del vídeo?
@@PabloVallejoMedina lo revisaré con detenimiento, gracias !
@@samirricardoneme-chaves9086 clarooo-!!
@@PabloVallejoMedina Lo he conseguido, gracias !
@@samirricardoneme-chaves9086 Genial, te veo on fire!!
Hola Pablo, que hacer cuando quiero aplicar PAM sobre un dataset que tiene millones de registros y aparece este mensaje:
> pam9
Bufff, ni idea. Ese big data me queda grande
Sucede que pam es limitado en datos, exactamente en 65536, deberías trabajar con clara en vez de pam, ya que clara acepta cantidades de datos mas grandes.
@@fernandomurillo7959 Sí, yo no suelo trabajar en big data, pero sería una opción más eficiente para data sets tan grandes.
Qué recomiendas para clusterizar a partir de variables categóricas y continuas?
Saludos !
Y como determinas cuales y cuantaas variables utilizar para clusterizar?
Puede ser Kmodes, Kamila no sé si servirá.. Depende un poco.
@@bastianelgueta7318 Creo que mientras esté teóricamente justificado no hay lio.
Hola, tengo una dudade como cambiar la ruta de rstudio general para que me busque los paquetes dado que al intentar activar algun paquete me sale el siguiente error, de antemano gracias (quiero cambiarlo a "C:/")
Error: package or namespace load failed for ‘readxl’ in get(Info[i, 1], envir = env):
no fue posible abrir el archivo 'C:/Users/lOlguÃn/Documents/R/win-library/4.0/Rcpp/R/Rcpp.rdb': No such file or directory
simplemente escribe file.choose()
y ejecuta, se te abrirá una ventana, eliges tu archivo y en la consola te escupe la ruta ;)
@@PabloVallejoMedina gracias pero no es ese mi problema, a ver como me explico quiero redirigir donde r busque los paquetes y librerias porque esta buscando en documentos y el mombre de carpeta de usuario tiene tilde y quiero llevarlo a la base del disco c y se que hay una formula para ello
@@PabloVallejoMedina ya encontre mi respuesta, use .libPhats para redirigir la instalacion y busqueda de paquetes.
Muchas gracias
@@jolguinsito Ahhh genial, no te entendí. No conocía esa forma ;)
Hola Pablo! Muchas gracias por el video! Tengo un problema y creo que tiene que ver con que no puedo bajar la base de datos como un data frame. Y la primera columna es de texto... entonces no la normaliza... Probé algo que sugeriste en otro video pero no me funcionó era esto, dfitems
prueba primero df
@@PabloVallejoMedina Muchas gracias!. Te mando un saludo gigante !!!
Muchas gracias por el video, pero tengo problemas al correr la línea 70, me arroja esto "Warning: Ignoring unknown parameters: fun" y luego me tira todos los valores iguales a cero, sería de mucha ayuda si sabes la respuesta. Saludos!
Hola paula, me puedes enviar el código del ggplot que estás poniendo?
ggplot(data_long, aes(as.factor(x = variable), y = valor,group=cluster, colour = cluster)) +
stat_summary(fun=mean, geom="pointrange", size = 1, aes(shape = cluster))+
stat_summary(geom="line")
Le hice cambios, adhoc a mi código. Gracias de antemano
@@gorditaau Mhh no sé. Aquí parece que pueda haber una función que te ayude, pero no sé que puede estar pasando... www.r-bloggers.com/simplifying-ggplot2-code-by-doing-nothing/
Gracias!