Ejemplo sencillo del algoritmo K-means sobre la base de datos de una compañia aseguradora de vehículos. Código: drive.google.c... insurance.csv: drive.google.c...
Explicas extremadamente bien. Llevo varios días viendo información de diferentes medios en varios idiomas y tus videos sobre SVM y K-means son los que me han aclarado completamente el funcionamiento. Ojala sigas haciendo videos. Un saludo.
Una pregunta,¿Cuando se hacen los clusters todas las variables esas tienen la misma importancia? Quiero decir lo mismo una variable como el número de siniestros es mucho más relevante a la hora de tomar decisiones que pongamos la antiguedad en la compañía.¿hay alguna forma de asignar mayor peso a variables o todas tienen el mismo?
Hola buenas noches, le hago una consulta, tengo un ejercicio en el que los clusters estan dados por el "lugar" de donde fue sacada la muestra. Tenemos una muestra que perdio la etiqueta de origen y quisiera usar k-means para estimar a cual de los dos grupos pertenece. Es posible?
Gracias Cristian. Sí, tienes videos de aprendizaje supervisado en el canal, en concreto tienes de regresión lineal, árboles de decisión y de SVM. Aunque no son videos, por si te interesa en forraxa.github.io/Rcaride/index.html estoy poniendo algún ejemplo más. Un saludo.
hola disculpa una duda que sucede cuando aparece Error in as.matrix(x) : object 'KMEANS.scale' not found estoy tratando con un archivo distinto y no le lee pese a que ya escale los datos
buenas noches, como realizo el mismo ejemplo pero con una base de datos que contiene imagines o fotos es decir tengo un proyecto en la U donde tengo una base de datos forestal y por medio de una foto o imagen se reconozca a que tipo de especie se refiere mediante el aprendizaje no supervisado, me podrías explicar por favor gracias
Hola Jeremy, Un par de detalles, cuando clasificas por Kmeans es el algoritmo el que intenta establecer semejanzas entre las variables que se le aportan, no hay una variable dependiente indicada al algoritmo que estés buscando. Es verdad que podemos previamente categorizar/clasificar nuestras muestras por algún concepto por ejemplo "tipo de planta", "raza del animal".... y ver si los grupos conseguidos nos pueden servir, pero te puedes encontrar con que las clasifique por el tamaño, el color o cualquier otra cosa diferente a lo que buscas. Una opción muy utilizada para la clasificación de fotografías pudiera ser a partir de los histogramas, canales de color... pero esto funcionaría mejor si la perspectiva de las fotos es siempre las mismas, pongamos por ejemplo analizar radiografías de alguna parte del cuerpo humano. Si lo que quieres es analizar fotografías con variablilidad quizás te convenga mirar las redes neuronales convolucionales. Un saludo.
@@robertocaride3915 GRACIAS POR RESPONDER tan pronto, he visto que algunos almacenes que mencionan que se puede tomar la foto de un producto y lo pase por la app, y si hay coincidencia aparece la foto del producto con sus características, en mi ignorancia creí que se podría aplicar a mi proyecto, me podrias ayudar a como iniciar o por donde comenzar a aprender GRACIAS pdt estaba mirando el aprendizaje no supervisado pero con imagenes si es que se puede
Solo una duda. Existirían variaciones significativas del establecimiento de los grupos cuando se establecen diferentes clusters iniciales ? Dicho de otra forma, si los centroides iniciales que se establecen a partir del parámetro seed darían resultados diferentes. No se utilizar R, utilizado Python. He hecho pruebas con Python y la librería SK-learn, señalando los puntos iniciales como "random" y el resultado ha sido el mismo en todos los casos, sin embargo aún así tengo mis dudas. Saludos.
No existirían variaciones en el resultado final pero sí en el coste computacional de su cálculo, te imaginas por ejemplo que coinciden los cuatro puntos aleatorios iniciales en la esquina superior izquierda, esto generaría un número de iteraciones muy superior a que los puntos estuvieran uno en cada esquina. Para minimizar este problema se puede acudir a algunos procesos antes de aplicar kmean, estos procesos están relacionados con la entropía para por ejemplo establecer una distancia mínima entre los puntos o muestras iniciales. Un saludo y gracias por comentar.
excelente video, me ayudó mucho. Pero ahora necesito trabajar con variables tanto cuantitativas como cualitativas, se que con una distancia MAHALANOBIS en vez de una euclidiana puedo eliminar ese problema, pero como puedo implementarlo al kmeans??? Por favor y gracias. Manita arriba :)
hola tengo una duda con la función scale, cuando das la instrucción [, 5:9] entiendo que 5 es el numero de la columna a la que quieres escalar, pero el valor 9 no lo entiendo. por favor, espero su respuesta amigazo. saludos
Hola vladimir. [,5:9] indica todas las filas de un rango determinado de columnas, esto escalaría todas las filas de las columnas 5,6,7,8 y 9. Un saludo.
No sé si es muy tarde, pero entre estos corchetes [ ], uno indica posición de la tabla: se lee [row, col], al dejar el "row" sin especificación, esta entiende que es para toda la base de datos. Si pusieras [c(1:3), c(5:9)], solo seleccionaría las 3 primeras filas (o renglones) y las columnas de la 5 a la 9.
sumb=kmeans(results,center=1)$betweenss for( i in 2:4) sumb[i]=kmeans(results,center=i)betweenss$ esta parte no me sale el video no tiene un abuena resolucion .. podrian ayudarme alguien q le salio bien el codigo
Deberias editar el comentario de la publicacion original para agregar ahi la direccion donde descargar el archivo insurance.csv drive.google.com/file/d/0B21nDwg3DpmWNHU0TC1uOXlGV3c/view
muchas gracias roberto por compartirme el archivo para practicar. un abrazo grande y gracias por el video!
Que gran material, presentación y explicación. Muy agradecido por lo que usted a hecho
Recién acaba de tomar éste módulo te agradecería si me pudieras compartir nuevo subcristor, saludos desde Costa Rica 😊
que explicacion mas buena, mirare los otros videos, espero que pronto haya mas! excelente material
Explicas extremadamente bien. Llevo varios días viendo información de diferentes medios en varios idiomas y tus videos sobre SVM y K-means son los que me han aclarado completamente el funcionamiento. Ojala sigas haciendo videos. Un saludo.
Me acabo de suscribir, qué excelente vídeo, saludos desde Perú, muy agradecido.!
Roberto!!! muy buena explicación...muchas gracias!!
Excelente Video. Muy buena explicación sobre el tema. Gracias
Como siempre Roberto, muy buenos tus videos, quedo altamente agradecido..
i guess I'm kinda off topic but do anybody know of a good site to stream new tv shows online?
@Graysen Casey I use Flixzone. You can find it by googling :)
un excelente video, felicidades y gracias por el aporte
Muchas Gracias por la explicacion
Felicitaciones y que siga creciendo el canal
Muchas gracias Mario.
Muchas gracias! esta muy bien explicado... realmente útil!!!
fue de mucha ayuda! gracias!
Muchas gracias excelente tu explicación
Excelente explicación.
Excelente 👌
Un capo maestro
Me salvó tu video! Muchas gracias :)
Me alegro :-)
¡MUCHAS GRACIAS!
muy bien explicado, gracias
Gracias por el apoyo.
Muy buen video , disculpe para comprobar cuantos clusters puedo usar se podría aplicar el metodo del codo?
Muy bueno, gracias !
Muy buena explicación,.. Una pregunta. ¿Qué pasa si tengo utliers? ¿Como los puedo desaparecer?
Muy bueno. Lo que no me queda claro es si, si o si le tengo q pasar el data set entero o le puedo mencionar cada columna?
muchas gracias!
Cuales son las librerías que utilizas?
Maravillosa tu forma de enseñar, ¿tienes algún curso que dictes o recomiences?
Una pregunta,¿Cuando se hacen los clusters todas las variables esas tienen la misma importancia? Quiero decir lo mismo una variable como el número de siniestros es mucho más relevante a la hora de tomar decisiones que pongamos la antiguedad en la compañía.¿hay alguna forma de asignar mayor peso a variables o todas tienen el mismo?
gracias!!
¡Muy bueno!
Hola buenas noches, le hago una consulta, tengo un ejercicio en el que los clusters estan dados por el "lugar" de donde fue sacada la muestra. Tenemos una muestra que perdio la etiqueta de origen y quisiera usar k-means para estimar a cual de los dos grupos pertenece. Es posible?
buen vídeo amigo de pronto tal vez no tienes algun ejemplo con algoritmos de aprendizaje supervisado
Gracias Cristian. Sí, tienes videos de aprendizaje supervisado en el canal, en concreto tienes de regresión lineal, árboles de decisión y de SVM. Aunque no son videos, por si te interesa en forraxa.github.io/Rcaride/index.html estoy poniendo algún ejemplo más. Un saludo.
Hola. Existe la posibilidad de definir los centroides???
hola disculpa una duda que sucede cuando aparece
Error in as.matrix(x) : object 'KMEANS.scale' not found
estoy tratando con un archivo distinto y no le lee pese a que ya escale los datos
Crack
buenas noches, como realizo el mismo ejemplo pero con una base de datos que contiene imagines o fotos
es decir tengo un proyecto en la U donde tengo una base de datos forestal y por medio de una foto o imagen se reconozca a que tipo de especie se refiere mediante el aprendizaje no supervisado, me podrías explicar por favor gracias
Hola Jeremy, Un par de detalles, cuando clasificas por Kmeans es el algoritmo el que intenta establecer semejanzas entre las variables que se le aportan, no hay una variable dependiente indicada al algoritmo que estés buscando. Es verdad que podemos previamente categorizar/clasificar nuestras muestras por algún concepto por ejemplo "tipo de planta", "raza del animal".... y ver si los grupos conseguidos nos pueden servir, pero te puedes encontrar con que las clasifique por el tamaño, el color o cualquier otra cosa diferente a lo que buscas.
Una opción muy utilizada para la clasificación de fotografías pudiera ser a partir de los histogramas, canales de color... pero esto funcionaría mejor si la perspectiva de las fotos es siempre las mismas, pongamos por ejemplo analizar radiografías de alguna parte del cuerpo humano. Si lo que quieres es analizar fotografías con variablilidad quizás te convenga mirar las redes neuronales convolucionales. Un saludo.
@@robertocaride3915 GRACIAS POR RESPONDER tan pronto, he visto que algunos almacenes que mencionan que se puede tomar la foto de un producto y lo pase por la app, y si hay coincidencia aparece la foto del producto con sus características, en mi ignorancia creí que se podría aplicar a mi proyecto, me podrias ayudar a como iniciar o por donde comenzar a aprender GRACIAS pdt estaba mirando el aprendizaje no supervisado pero con imagenes si es que se puede
buenos Dias
Para costruir el algoritmo en como se llama el programa en el que se escribe el codigo
pregunta: porque el 0.5 cuando escalás?
Hola Sonia, en insurance[,5:9] ese ,5 no significa un 0,5 significa insurance["todas las filas","columnas de la 5 a la 9"]. Un saludo
Muy explicativo pero no te limites a leer las diapositivas
Solo una duda. Existirían variaciones significativas del establecimiento de los grupos cuando se establecen diferentes clusters iniciales ? Dicho de otra forma, si los centroides iniciales que se establecen a partir del parámetro seed darían resultados diferentes.
No se utilizar R, utilizado Python. He hecho pruebas con Python y la librería SK-learn, señalando los puntos iniciales como "random" y el resultado ha sido el mismo en todos los casos, sin embargo aún así tengo mis dudas.
Saludos.
No existirían variaciones en el resultado final pero sí en el coste computacional de su cálculo, te imaginas por ejemplo que coinciden los cuatro puntos aleatorios iniciales en la esquina superior izquierda, esto generaría un número de iteraciones muy superior a que los puntos estuvieran uno en cada esquina.
Para minimizar este problema se puede acudir a algunos procesos antes de aplicar kmean, estos procesos están relacionados con la entropía para por ejemplo establecer una distancia mínima entre los puntos o muestras iniciales.
Un saludo y gracias por comentar.
Gracias !
Una consulta, porque la semilla tiene valor de 80?
Por nada en especial, podría haber sido cualquier otro número pero para reproducir el mismo resultado se ha de respetar al semilla
@@robertocaride3915 Excelente vídeo es muy claro. Una pregunta ¿se puede fijar más de una semilla? de ser posible ¿como se realizaría?
excelente video, me ayudó mucho. Pero ahora necesito trabajar con variables tanto cuantitativas como cualitativas, se que con una distancia MAHALANOBIS en vez de una euclidiana puedo eliminar ese problema, pero como puedo implementarlo al kmeans??? Por favor y gracias. Manita arriba :)
una consulta tienes el codigo q trascribiste?? no veo bien el video..falta mejorar la resolucion
hola
tengo una duda con la función scale, cuando das la instrucción [, 5:9] entiendo que 5 es el numero de la columna a la que quieres escalar, pero el valor 9 no lo entiendo.
por favor, espero su respuesta amigazo.
saludos
Hola vladimir.
[,5:9] indica todas las filas de un rango determinado de columnas, esto escalaría todas las filas de las columnas 5,6,7,8 y 9.
Un saludo.
si muchas gracias!!
Disculpa, qué quiere decir la , antes del 5 en [,5:9]? gracias.
No sé si es muy tarde, pero entre estos corchetes [ ], uno indica posición de la tabla: se lee [row, col], al dejar el "row" sin especificación, esta entiende que es para toda la base de datos.
Si pusieras [c(1:3), c(5:9)], solo seleccionaría las 3 primeras filas (o renglones) y las columnas de la 5 a la 9.
Me parece genial tu explicación a que correo te puedo contactar? gracias
Gracias, betweendata.com@gmail punto com, un saludo.
Excelente video, puedes compartir el script de rstudio? Por favor
Gracias Rodrigo. He puesto un enlace en la descripción del vídeo. Un saludo.
Sir, can you send me dataset in English.
sumb=kmeans(results,center=1)$betweenss
for( i in 2:4)
sumb[i]=kmeans(results,center=i)betweenss$
esta parte no me sale el video no tiene un abuena resolucion .. podrian ayudarme alguien q le salio bien el codigo
Hola Julio, aquí tienes el código del vídeo drive.google.com/open?id=1oA9r2ml0Fk1WDSHITtoS4rtBrbcFyaje
gracias..
Deberias editar el comentario de la publicacion original para agregar ahi la direccion donde descargar el archivo insurance.csv
drive.google.com/file/d/0B21nDwg3DpmWNHU0TC1uOXlGV3c/view
Gracias por el aporte, un saludo.
Gracias justo eso andaba buscando!!