Ejemplo básico algoritmo K-means con R studio

Поділитися
Вставка
  • Опубліковано 3 гру 2024
  • Ejemplo sencillo del algoritmo K-means sobre la base de datos de una compañia aseguradora de vehículos.
    Código:
    drive.google.c...
    insurance.csv:
    drive.google.c...

КОМЕНТАРІ • 77

  • @ivannn4367
    @ivannn4367 Рік тому

    muchas gracias roberto por compartirme el archivo para practicar. un abrazo grande y gracias por el video!

  • @bryan1995ism
    @bryan1995ism 3 роки тому

    Que gran material, presentación y explicación. Muy agradecido por lo que usted a hecho

  • @mariodelgado165
    @mariodelgado165 27 днів тому

    Recién acaba de tomar éste módulo te agradecería si me pudieras compartir nuevo subcristor, saludos desde Costa Rica 😊

  •  4 роки тому

    que explicacion mas buena, mirare los otros videos, espero que pronto haya mas! excelente material

  • @ivangutierrez4135
    @ivangutierrez4135 7 років тому

    Explicas extremadamente bien. Llevo varios días viendo información de diferentes medios en varios idiomas y tus videos sobre SVM y K-means son los que me han aclarado completamente el funcionamiento. Ojala sigas haciendo videos. Un saludo.

  • @erikjamesonmendozapena7918
    @erikjamesonmendozapena7918 5 років тому

    Me acabo de suscribir, qué excelente vídeo, saludos desde Perú, muy agradecido.!

  • @carlossandoval5116
    @carlossandoval5116 5 років тому +1

    Roberto!!! muy buena explicación...muchas gracias!!

  • @carloshelichica4269
    @carloshelichica4269 5 років тому

    Excelente Video. Muy buena explicación sobre el tema. Gracias

  • @juandavidlozadacalderon1356
    @juandavidlozadacalderon1356 6 років тому +1

    Como siempre Roberto, muy buenos tus videos, quedo altamente agradecido..

    • @graysencasey301
      @graysencasey301 3 роки тому

      i guess I'm kinda off topic but do anybody know of a good site to stream new tv shows online?

    • @bentleeremy2070
      @bentleeremy2070 3 роки тому

      @Graysen Casey I use Flixzone. You can find it by googling :)

  • @jcp3891
    @jcp3891 6 років тому +2

    un excelente video, felicidades y gracias por el aporte

  • @josejaviermarticamarasa5744
    @josejaviermarticamarasa5744 4 роки тому

    Muchas Gracias por la explicacion

  • @mariovillalobos8616
    @mariovillalobos8616 7 років тому

    Felicitaciones y que siga creciendo el canal

  • @NorbertoVeraReatigaNVR
    @NorbertoVeraReatigaNVR 7 років тому

    Muchas gracias! esta muy bien explicado... realmente útil!!!

  • @simonlimon6633
    @simonlimon6633 4 роки тому

    fue de mucha ayuda! gracias!

  • @oscarriojas
    @oscarriojas 6 років тому

    Muchas gracias excelente tu explicación

  • @jdpinod
    @jdpinod 5 років тому

    Excelente explicación.

  • @zoryacevedo6198
    @zoryacevedo6198 9 місяців тому

    Excelente 👌

  • @javiercustodioore778
    @javiercustodioore778 5 років тому

    Un capo maestro

  • @JaimeNavarro85
    @JaimeNavarro85 7 років тому

    Me salvó tu video! Muchas gracias :)

  • @SusanGomezP
    @SusanGomezP 5 років тому +1

    ¡MUCHAS GRACIAS!

  • @Lordlalo98mirinda
    @Lordlalo98mirinda 6 років тому

    muy bien explicado, gracias

  • @josephdavidninaquispeflore2802
    @josephdavidninaquispeflore2802 5 років тому

    Muy buen video , disculpe para comprobar cuantos clusters puedo usar se podría aplicar el metodo del codo?

  • @rbarragan1234
    @rbarragan1234 4 роки тому

    Muy bueno, gracias !

  • @BRUJMA
    @BRUJMA 4 роки тому

    Muy buena explicación,.. Una pregunta. ¿Qué pasa si tengo utliers? ¿Como los puedo desaparecer?

  • @waltercontacto8732
    @waltercontacto8732 4 роки тому

    Muy bueno. Lo que no me queda claro es si, si o si le tengo q pasar el data set entero o le puedo mencionar cada columna?

  • @ernestoparedespinos3810
    @ernestoparedespinos3810 4 роки тому

    muchas gracias!

  • @keviinzz3585
    @keviinzz3585 Рік тому

    Cuales son las librerías que utilizas?

  • @cristianivanvaldezsolis5160
    @cristianivanvaldezsolis5160 3 роки тому

    Maravillosa tu forma de enseñar, ¿tienes algún curso que dictes o recomiences?

  • @Javigarcia222
    @Javigarcia222 4 роки тому

    Una pregunta,¿Cuando se hacen los clusters todas las variables esas tienen la misma importancia? Quiero decir lo mismo una variable como el número de siniestros es mucho más relevante a la hora de tomar decisiones que pongamos la antiguedad en la compañía.¿hay alguna forma de asignar mayor peso a variables o todas tienen el mismo?

  • @FrauEva89
    @FrauEva89 6 років тому +1

    gracias!!

  • @Dataholic
    @Dataholic 5 років тому

    ¡Muy bueno!

  • @anabellamassa2571
    @anabellamassa2571 4 роки тому

    Hola buenas noches, le hago una consulta, tengo un ejercicio en el que los clusters estan dados por el "lugar" de donde fue sacada la muestra. Tenemos una muestra que perdio la etiqueta de origen y quisiera usar k-means para estimar a cual de los dos grupos pertenece. Es posible?

  • @cjtinitanaaa
    @cjtinitanaaa 6 років тому

    buen vídeo amigo de pronto tal vez no tienes algun ejemplo con algoritmos de aprendizaje supervisado

    • @robertocaride3915
      @robertocaride3915  6 років тому

      Gracias Cristian. Sí, tienes videos de aprendizaje supervisado en el canal, en concreto tienes de regresión lineal, árboles de decisión y de SVM. Aunque no son videos, por si te interesa en forraxa.github.io/Rcaride/index.html estoy poniendo algún ejemplo más. Un saludo.

  • @waltercontacto8732
    @waltercontacto8732 6 років тому

    Hola. Existe la posibilidad de definir los centroides???

  • @alejobravo8070
    @alejobravo8070 6 років тому

    hola disculpa una duda que sucede cuando aparece
    Error in as.matrix(x) : object 'KMEANS.scale' not found
    estoy tratando con un archivo distinto y no le lee pese a que ya escale los datos

  • @juancarlossalcedo9609
    @juancarlossalcedo9609 5 років тому

    Crack

  • @JeremyGumo
    @JeremyGumo 4 роки тому

    buenas noches, como realizo el mismo ejemplo pero con una base de datos que contiene imagines o fotos
    es decir tengo un proyecto en la U donde tengo una base de datos forestal y por medio de una foto o imagen se reconozca a que tipo de especie se refiere mediante el aprendizaje no supervisado, me podrías explicar por favor gracias

    • @robertocaride3915
      @robertocaride3915  4 роки тому

      Hola Jeremy, Un par de detalles, cuando clasificas por Kmeans es el algoritmo el que intenta establecer semejanzas entre las variables que se le aportan, no hay una variable dependiente indicada al algoritmo que estés buscando. Es verdad que podemos previamente categorizar/clasificar nuestras muestras por algún concepto por ejemplo "tipo de planta", "raza del animal".... y ver si los grupos conseguidos nos pueden servir, pero te puedes encontrar con que las clasifique por el tamaño, el color o cualquier otra cosa diferente a lo que buscas.
      Una opción muy utilizada para la clasificación de fotografías pudiera ser a partir de los histogramas, canales de color... pero esto funcionaría mejor si la perspectiva de las fotos es siempre las mismas, pongamos por ejemplo analizar radiografías de alguna parte del cuerpo humano. Si lo que quieres es analizar fotografías con variablilidad quizás te convenga mirar las redes neuronales convolucionales. Un saludo.

    • @JeremyGumo
      @JeremyGumo 4 роки тому

      @@robertocaride3915 GRACIAS POR RESPONDER tan pronto, he visto que algunos almacenes que mencionan que se puede tomar la foto de un producto y lo pase por la app, y si hay coincidencia aparece la foto del producto con sus características, en mi ignorancia creí que se podría aplicar a mi proyecto, me podrias ayudar a como iniciar o por donde comenzar a aprender GRACIAS pdt estaba mirando el aprendizaje no supervisado pero con imagenes si es que se puede

  • @eilerIvanAndradePinto
    @eilerIvanAndradePinto 5 років тому

    buenos Dias
    Para costruir el algoritmo en como se llama el programa en el que se escribe el codigo

  • @soniarominaniezwida4644
    @soniarominaniezwida4644 2 роки тому

    pregunta: porque el 0.5 cuando escalás?

    • @robertocaride3915
      @robertocaride3915  2 роки тому

      Hola Sonia, en insurance[,5:9] ese ,5 no significa un 0,5 significa insurance["todas las filas","columnas de la 5 a la 9"]. Un saludo

  • @kikeekik
    @kikeekik 4 роки тому

    Muy explicativo pero no te limites a leer las diapositivas

  • @ivangutierrez4135
    @ivangutierrez4135 7 років тому

    Solo una duda. Existirían variaciones significativas del establecimiento de los grupos cuando se establecen diferentes clusters iniciales ? Dicho de otra forma, si los centroides iniciales que se establecen a partir del parámetro seed darían resultados diferentes.
    No se utilizar R, utilizado Python. He hecho pruebas con Python y la librería SK-learn, señalando los puntos iniciales como "random" y el resultado ha sido el mismo en todos los casos, sin embargo aún así tengo mis dudas.
    Saludos.

    • @robertocaride3915
      @robertocaride3915  7 років тому

      No existirían variaciones en el resultado final pero sí en el coste computacional de su cálculo, te imaginas por ejemplo que coinciden los cuatro puntos aleatorios iniciales en la esquina superior izquierda, esto generaría un número de iteraciones muy superior a que los puntos estuvieran uno en cada esquina.
      Para minimizar este problema se puede acudir a algunos procesos antes de aplicar kmean, estos procesos están relacionados con la entropía para por ejemplo establecer una distancia mínima entre los puntos o muestras iniciales.
      Un saludo y gracias por comentar.

    • @ivangutierrez4135
      @ivangutierrez4135 7 років тому

      Gracias !

  • @EliasManoloBucardo
    @EliasManoloBucardo 6 років тому

    Una consulta, porque la semilla tiene valor de 80?

    • @robertocaride3915
      @robertocaride3915  6 років тому +1

      Por nada en especial, podría haber sido cualquier otro número pero para reproducir el mismo resultado se ha de respetar al semilla

    •  4 роки тому

      @@robertocaride3915 Excelente vídeo es muy claro. Una pregunta ¿se puede fijar más de una semilla? de ser posible ¿como se realizaría?

  • @wazudrakon
    @wazudrakon 6 років тому

    excelente video, me ayudó mucho. Pero ahora necesito trabajar con variables tanto cuantitativas como cualitativas, se que con una distancia MAHALANOBIS en vez de una euclidiana puedo eliminar ese problema, pero como puedo implementarlo al kmeans??? Por favor y gracias. Manita arriba :)

    • @juliocesaralvarez9580
      @juliocesaralvarez9580 6 років тому

      una consulta tienes el codigo q trascribiste?? no veo bien el video..falta mejorar la resolucion

  • @Vladhok
    @Vladhok 7 років тому

    hola
    tengo una duda con la función scale, cuando das la instrucción [, 5:9] entiendo que 5 es el numero de la columna a la que quieres escalar, pero el valor 9 no lo entiendo.
    por favor, espero su respuesta amigazo.
    saludos

    • @robertocaride3915
      @robertocaride3915  7 років тому

      Hola vladimir.
      [,5:9] indica todas las filas de un rango determinado de columnas, esto escalaría todas las filas de las columnas 5,6,7,8 y 9.
      Un saludo.

    • @Vladhok
      @Vladhok 7 років тому

      si muchas gracias!!

    • @davidricardoguzmanmora8198
      @davidricardoguzmanmora8198 6 років тому

      Disculpa, qué quiere decir la , antes del 5 en [,5:9]? gracias.

    • @katherineduarte3679
      @katherineduarte3679 6 років тому +3

      No sé si es muy tarde, pero entre estos corchetes [ ], uno indica posición de la tabla: se lee [row, col], al dejar el "row" sin especificación, esta entiende que es para toda la base de datos.
      Si pusieras [c(1:3), c(5:9)], solo seleccionaría las 3 primeras filas (o renglones) y las columnas de la 5 a la 9.

  • @jorgealbertoagudelopaez4973
    @jorgealbertoagudelopaez4973 6 років тому

    Me parece genial tu explicación a que correo te puedo contactar? gracias

    • @robertocaride3915
      @robertocaride3915  6 років тому

      Gracias, betweendata.com@gmail punto com, un saludo.

  • @infodriveglobal
    @infodriveglobal 6 років тому

    Excelente video, puedes compartir el script de rstudio? Por favor

    • @robertocaride3915
      @robertocaride3915  6 років тому

      Gracias Rodrigo. He puesto un enlace en la descripción del vídeo. Un saludo.

  • @rohitsaini8079
    @rohitsaini8079 6 років тому +2

    Sir, can you send me dataset in English.

  • @juliocesaralvarez9580
    @juliocesaralvarez9580 6 років тому

    sumb=kmeans(results,center=1)$betweenss
    for( i in 2:4)
    sumb[i]=kmeans(results,center=i)betweenss$
    esta parte no me sale el video no tiene un abuena resolucion .. podrian ayudarme alguien q le salio bien el codigo

  • @chrisduque2051
    @chrisduque2051 6 років тому +1

    Deberias editar el comentario de la publicacion original para agregar ahi la direccion donde descargar el archivo insurance.csv
    drive.google.com/file/d/0B21nDwg3DpmWNHU0TC1uOXlGV3c/view

    • @robertocaride3915
      @robertocaride3915  6 років тому

      Gracias por el aporte, un saludo.

    •  5 років тому

      Gracias justo eso andaba buscando!!