Explicas extremadamente bien. Llevo varios días viendo información de diferentes medios en varios idiomas y tus videos sobre SVM y K-means son los que me han aclarado completamente el funcionamiento. Ojala sigas haciendo videos. Un saludo.
Una pregunta,¿Cuando se hacen los clusters todas las variables esas tienen la misma importancia? Quiero decir lo mismo una variable como el número de siniestros es mucho más relevante a la hora de tomar decisiones que pongamos la antiguedad en la compañía.¿hay alguna forma de asignar mayor peso a variables o todas tienen el mismo?
Hola buenas noches, le hago una consulta, tengo un ejercicio en el que los clusters estan dados por el "lugar" de donde fue sacada la muestra. Tenemos una muestra que perdio la etiqueta de origen y quisiera usar k-means para estimar a cual de los dos grupos pertenece. Es posible?
Gracias Cristian. Sí, tienes videos de aprendizaje supervisado en el canal, en concreto tienes de regresión lineal, árboles de decisión y de SVM. Aunque no son videos, por si te interesa en forraxa.github.io/Rcaride/index.html estoy poniendo algún ejemplo más. Un saludo.
Solo una duda. Existirían variaciones significativas del establecimiento de los grupos cuando se establecen diferentes clusters iniciales ? Dicho de otra forma, si los centroides iniciales que se establecen a partir del parámetro seed darían resultados diferentes. No se utilizar R, utilizado Python. He hecho pruebas con Python y la librería SK-learn, señalando los puntos iniciales como "random" y el resultado ha sido el mismo en todos los casos, sin embargo aún así tengo mis dudas. Saludos.
No existirían variaciones en el resultado final pero sí en el coste computacional de su cálculo, te imaginas por ejemplo que coinciden los cuatro puntos aleatorios iniciales en la esquina superior izquierda, esto generaría un número de iteraciones muy superior a que los puntos estuvieran uno en cada esquina. Para minimizar este problema se puede acudir a algunos procesos antes de aplicar kmean, estos procesos están relacionados con la entropía para por ejemplo establecer una distancia mínima entre los puntos o muestras iniciales. Un saludo y gracias por comentar.
buenas noches, como realizo el mismo ejemplo pero con una base de datos que contiene imagines o fotos es decir tengo un proyecto en la U donde tengo una base de datos forestal y por medio de una foto o imagen se reconozca a que tipo de especie se refiere mediante el aprendizaje no supervisado, me podrías explicar por favor gracias
Hola Jeremy, Un par de detalles, cuando clasificas por Kmeans es el algoritmo el que intenta establecer semejanzas entre las variables que se le aportan, no hay una variable dependiente indicada al algoritmo que estés buscando. Es verdad que podemos previamente categorizar/clasificar nuestras muestras por algún concepto por ejemplo "tipo de planta", "raza del animal".... y ver si los grupos conseguidos nos pueden servir, pero te puedes encontrar con que las clasifique por el tamaño, el color o cualquier otra cosa diferente a lo que buscas. Una opción muy utilizada para la clasificación de fotografías pudiera ser a partir de los histogramas, canales de color... pero esto funcionaría mejor si la perspectiva de las fotos es siempre las mismas, pongamos por ejemplo analizar radiografías de alguna parte del cuerpo humano. Si lo que quieres es analizar fotografías con variablilidad quizás te convenga mirar las redes neuronales convolucionales. Un saludo.
@@robertocaride3915 GRACIAS POR RESPONDER tan pronto, he visto que algunos almacenes que mencionan que se puede tomar la foto de un producto y lo pase por la app, y si hay coincidencia aparece la foto del producto con sus características, en mi ignorancia creí que se podría aplicar a mi proyecto, me podrias ayudar a como iniciar o por donde comenzar a aprender GRACIAS pdt estaba mirando el aprendizaje no supervisado pero con imagenes si es que se puede
hola disculpa una duda que sucede cuando aparece Error in as.matrix(x) : object 'KMEANS.scale' not found estoy tratando con un archivo distinto y no le lee pese a que ya escale los datos
excelente video, me ayudó mucho. Pero ahora necesito trabajar con variables tanto cuantitativas como cualitativas, se que con una distancia MAHALANOBIS en vez de una euclidiana puedo eliminar ese problema, pero como puedo implementarlo al kmeans??? Por favor y gracias. Manita arriba :)
hola tengo una duda con la función scale, cuando das la instrucción [, 5:9] entiendo que 5 es el numero de la columna a la que quieres escalar, pero el valor 9 no lo entiendo. por favor, espero su respuesta amigazo. saludos
Hola vladimir. [,5:9] indica todas las filas de un rango determinado de columnas, esto escalaría todas las filas de las columnas 5,6,7,8 y 9. Un saludo.
No sé si es muy tarde, pero entre estos corchetes [ ], uno indica posición de la tabla: se lee [row, col], al dejar el "row" sin especificación, esta entiende que es para toda la base de datos. Si pusieras [c(1:3), c(5:9)], solo seleccionaría las 3 primeras filas (o renglones) y las columnas de la 5 a la 9.
Deberias editar el comentario de la publicacion original para agregar ahi la direccion donde descargar el archivo insurance.csv drive.google.com/file/d/0B21nDwg3DpmWNHU0TC1uOXlGV3c/view
sumb=kmeans(results,center=1)$betweenss for( i in 2:4) sumb[i]=kmeans(results,center=i)betweenss$ esta parte no me sale el video no tiene un abuena resolucion .. podrian ayudarme alguien q le salio bien el codigo
muchas gracias roberto por compartirme el archivo para practicar. un abrazo grande y gracias por el video!
Que gran material, presentación y explicación. Muy agradecido por lo que usted a hecho
que explicacion mas buena, mirare los otros videos, espero que pronto haya mas! excelente material
Explicas extremadamente bien. Llevo varios días viendo información de diferentes medios en varios idiomas y tus videos sobre SVM y K-means son los que me han aclarado completamente el funcionamiento. Ojala sigas haciendo videos. Un saludo.
Me acabo de suscribir, qué excelente vídeo, saludos desde Perú, muy agradecido.!
Excelente Video. Muy buena explicación sobre el tema. Gracias
Roberto!!! muy buena explicación...muchas gracias!!
un excelente video, felicidades y gracias por el aporte
Como siempre Roberto, muy buenos tus videos, quedo altamente agradecido..
i guess I'm kinda off topic but do anybody know of a good site to stream new tv shows online?
@Graysen Casey I use Flixzone. You can find it by googling :)
Muchas Gracias por la explicacion
fue de mucha ayuda! gracias!
Muchas gracias! esta muy bien explicado... realmente útil!!!
Muy buen video , disculpe para comprobar cuantos clusters puedo usar se podría aplicar el metodo del codo?
Muy bueno. Lo que no me queda claro es si, si o si le tengo q pasar el data set entero o le puedo mencionar cada columna?
Excelente 👌
Un capo maestro
Muchas gracias excelente tu explicación
Felicitaciones y que siga creciendo el canal
Muchas gracias Mario.
Muy buena explicación,.. Una pregunta. ¿Qué pasa si tengo utliers? ¿Como los puedo desaparecer?
Maravillosa tu forma de enseñar, ¿tienes algún curso que dictes o recomiences?
Excelente explicación.
Una pregunta,¿Cuando se hacen los clusters todas las variables esas tienen la misma importancia? Quiero decir lo mismo una variable como el número de siniestros es mucho más relevante a la hora de tomar decisiones que pongamos la antiguedad en la compañía.¿hay alguna forma de asignar mayor peso a variables o todas tienen el mismo?
¡MUCHAS GRACIAS!
Me salvó tu video! Muchas gracias :)
Me alegro :-)
Muy bueno, gracias !
muy bien explicado, gracias
Gracias por el apoyo.
Cuales son las librerías que utilizas?
Hola buenas noches, le hago una consulta, tengo un ejercicio en el que los clusters estan dados por el "lugar" de donde fue sacada la muestra. Tenemos una muestra que perdio la etiqueta de origen y quisiera usar k-means para estimar a cual de los dos grupos pertenece. Es posible?
muchas gracias!
buen vídeo amigo de pronto tal vez no tienes algun ejemplo con algoritmos de aprendizaje supervisado
Gracias Cristian. Sí, tienes videos de aprendizaje supervisado en el canal, en concreto tienes de regresión lineal, árboles de decisión y de SVM. Aunque no son videos, por si te interesa en forraxa.github.io/Rcaride/index.html estoy poniendo algún ejemplo más. Un saludo.
Solo una duda. Existirían variaciones significativas del establecimiento de los grupos cuando se establecen diferentes clusters iniciales ? Dicho de otra forma, si los centroides iniciales que se establecen a partir del parámetro seed darían resultados diferentes.
No se utilizar R, utilizado Python. He hecho pruebas con Python y la librería SK-learn, señalando los puntos iniciales como "random" y el resultado ha sido el mismo en todos los casos, sin embargo aún así tengo mis dudas.
Saludos.
No existirían variaciones en el resultado final pero sí en el coste computacional de su cálculo, te imaginas por ejemplo que coinciden los cuatro puntos aleatorios iniciales en la esquina superior izquierda, esto generaría un número de iteraciones muy superior a que los puntos estuvieran uno en cada esquina.
Para minimizar este problema se puede acudir a algunos procesos antes de aplicar kmean, estos procesos están relacionados con la entropía para por ejemplo establecer una distancia mínima entre los puntos o muestras iniciales.
Un saludo y gracias por comentar.
Gracias !
gracias!!
buenas noches, como realizo el mismo ejemplo pero con una base de datos que contiene imagines o fotos
es decir tengo un proyecto en la U donde tengo una base de datos forestal y por medio de una foto o imagen se reconozca a que tipo de especie se refiere mediante el aprendizaje no supervisado, me podrías explicar por favor gracias
Hola Jeremy, Un par de detalles, cuando clasificas por Kmeans es el algoritmo el que intenta establecer semejanzas entre las variables que se le aportan, no hay una variable dependiente indicada al algoritmo que estés buscando. Es verdad que podemos previamente categorizar/clasificar nuestras muestras por algún concepto por ejemplo "tipo de planta", "raza del animal".... y ver si los grupos conseguidos nos pueden servir, pero te puedes encontrar con que las clasifique por el tamaño, el color o cualquier otra cosa diferente a lo que buscas.
Una opción muy utilizada para la clasificación de fotografías pudiera ser a partir de los histogramas, canales de color... pero esto funcionaría mejor si la perspectiva de las fotos es siempre las mismas, pongamos por ejemplo analizar radiografías de alguna parte del cuerpo humano. Si lo que quieres es analizar fotografías con variablilidad quizás te convenga mirar las redes neuronales convolucionales. Un saludo.
@@robertocaride3915 GRACIAS POR RESPONDER tan pronto, he visto que algunos almacenes que mencionan que se puede tomar la foto de un producto y lo pase por la app, y si hay coincidencia aparece la foto del producto con sus características, en mi ignorancia creí que se podría aplicar a mi proyecto, me podrias ayudar a como iniciar o por donde comenzar a aprender GRACIAS pdt estaba mirando el aprendizaje no supervisado pero con imagenes si es que se puede
hola disculpa una duda que sucede cuando aparece
Error in as.matrix(x) : object 'KMEANS.scale' not found
estoy tratando con un archivo distinto y no le lee pese a que ya escale los datos
Hola. Existe la posibilidad de definir los centroides???
¡Muy bueno!
pregunta: porque el 0.5 cuando escalás?
Hola Sonia, en insurance[,5:9] ese ,5 no significa un 0,5 significa insurance["todas las filas","columnas de la 5 a la 9"]. Un saludo
excelente video, me ayudó mucho. Pero ahora necesito trabajar con variables tanto cuantitativas como cualitativas, se que con una distancia MAHALANOBIS en vez de una euclidiana puedo eliminar ese problema, pero como puedo implementarlo al kmeans??? Por favor y gracias. Manita arriba :)
una consulta tienes el codigo q trascribiste?? no veo bien el video..falta mejorar la resolucion
hola
tengo una duda con la función scale, cuando das la instrucción [, 5:9] entiendo que 5 es el numero de la columna a la que quieres escalar, pero el valor 9 no lo entiendo.
por favor, espero su respuesta amigazo.
saludos
Hola vladimir.
[,5:9] indica todas las filas de un rango determinado de columnas, esto escalaría todas las filas de las columnas 5,6,7,8 y 9.
Un saludo.
si muchas gracias!!
Disculpa, qué quiere decir la , antes del 5 en [,5:9]? gracias.
No sé si es muy tarde, pero entre estos corchetes [ ], uno indica posición de la tabla: se lee [row, col], al dejar el "row" sin especificación, esta entiende que es para toda la base de datos.
Si pusieras [c(1:3), c(5:9)], solo seleccionaría las 3 primeras filas (o renglones) y las columnas de la 5 a la 9.
buenos Dias
Para costruir el algoritmo en como se llama el programa en el que se escribe el codigo
Crack
Me parece genial tu explicación a que correo te puedo contactar? gracias
Gracias, betweendata.com@gmail punto com, un saludo.
Una consulta, porque la semilla tiene valor de 80?
Por nada en especial, podría haber sido cualquier otro número pero para reproducir el mismo resultado se ha de respetar al semilla
@@robertocaride3915 Excelente vídeo es muy claro. Una pregunta ¿se puede fijar más de una semilla? de ser posible ¿como se realizaría?
Muy explicativo pero no te limites a leer las diapositivas
Excelente video, puedes compartir el script de rstudio? Por favor
Gracias Rodrigo. He puesto un enlace en la descripción del vídeo. Un saludo.
Deberias editar el comentario de la publicacion original para agregar ahi la direccion donde descargar el archivo insurance.csv
drive.google.com/file/d/0B21nDwg3DpmWNHU0TC1uOXlGV3c/view
Gracias por el aporte, un saludo.
Gracias justo eso andaba buscando!!
sumb=kmeans(results,center=1)$betweenss
for( i in 2:4)
sumb[i]=kmeans(results,center=i)betweenss$
esta parte no me sale el video no tiene un abuena resolucion .. podrian ayudarme alguien q le salio bien el codigo
Hola Julio, aquí tienes el código del vídeo drive.google.com/open?id=1oA9r2ml0Fk1WDSHITtoS4rtBrbcFyaje
gracias..
Sir, can you send me dataset in English.