Natural Language Processing R / Rstudio Data Text Analysis Most Repeted Words Stop TidyText

Поділитися
Вставка
  • Опубліковано 22 жов 2024

КОМЕНТАРІ • 17

  • @santiago-9074
    @santiago-9074 9 місяців тому

    que diferencia hay con usar consultas sql y crear tablas nuevas para analizar?

  • @areatecnicacolinagro4975
    @areatecnicacolinagro4975 2 роки тому +1

    Para contar palabras o grupos de palabras por celda en una tabla?

    • @rvstats_ES
      @rvstats_ES  Рік тому

      Hola !! claro, de ello se trata el uso de NLP. Tomamos la información de cada celda y separamos para saber que palabras contiene.

  • @CristinaRestrepoArango
    @CristinaRestrepoArango 2 роки тому

    ¿En qué versión de RStudio se deben correr estos programas? Tengo varios meses de intentar aplicar estos códigos, pero la versión que tengo no encuentra funciones que usa usted y otros investigadores.

    • @rvstats_ES
      @rvstats_ES  2 роки тому

      Hola Cristina. Tal vez no sea la Versión de Rstudio si no que las diferentes bibliotecas que habrá que actualizar. Trata de re instalar los paquetes ahí usados.

  • @morrismoreno545
    @morrismoreno545 Рік тому +1

    Si yo estoy trabajando un texto en español y quiero excluir los conectores ("en", "y", "la", etc. Las stop words pero en español), ¿Cómo puedo hacerlo?

    • @rvstats_ES
      @rvstats_ES  Рік тому +1

      Hola Morris. Gracias por tu comentario. Leete esta página web donde se añade un paquete tm y listo jvera.rbind.io/post/2017/10/16/spanish-stopwords-for-tidytext-package/

  • @juandiegobedoyagutierrez2594
    @juandiegobedoyagutierrez2594 2 роки тому

    Hola, y como importó el vector de texto o el párrafo para poderlo analizar?, Cómo llego el texto allá para el análisis?

    • @rvstats_ES
      @rvstats_ES  2 роки тому +1

      Hola Juan Diego. Gracias por su comentario. Hay varias maneras de poder leer el texto o hacerlo llegar a R. Una por supuesto seria copiar directamente como yo lo hice y otra es utilizando read.table("su_archivo.txt") si es un archivo de texto. En el segundo ejemplo se puede ver que usé una columna de un csv para poder captar las palabras mas usadas en la descripcion de un producto. (que puede ser igual comentarios de personas sobre un alimento o pelicula).

    • @juandiegobedoyagutierrez2594
      @juandiegobedoyagutierrez2594 2 роки тому

      @@rvstats_ES Muchas gracias, otra pregunta señor Raúl. con que versión de Rstudio trabaja? ya que tengo el R4.1.2 y hay muchas librerías que no reconoce. Gracias

  • @alessandro9786
    @alessandro9786 Рік тому

    Una aplicación exacta en el trabajo en el cual se utiliza esto?
    Cual sería?

    • @spartan9771
      @spartan9771 Рік тому +1

      Ejemplo practico de esto podría ser un análisis de datos que no tenga una estructura definida. EJ : Comentarios de redes sociales o de algún formulario.

    • @alessandro9786
      @alessandro9786 Рік тому +1

      @@spartan9771 hola, lo que pasa es que yo trabajo con encuestas y las respuestas abiertas hay que agruparlas , y eso toma mucho tiempo. Quería saber exactamente con que técnica se puede trabajar eso de tal manera que me dé un tabla de frecuencias con las categorías con más frecuencias.

    • @rvstats_ES
      @rvstats_ES  Рік тому

      Hola Alessandro. Gracias por tu pregunta. Aquí spartan ya ha dado un buen ejemplo. saludos.

    • @rvstats_ES
      @rvstats_ES  Рік тому

      Por supuesto que se puede aplicar NLP para entender cuales son las palabras más repetidas según una columna por ejemplo.

  • @CristinaRestrepoArango
    @CristinaRestrepoArango 2 роки тому

    Tengo un error con que no se encuentra la función %>%

    • @rvstats_ES
      @rvstats_ES  2 роки тому +1

      Hola Cristina. Se debe llamar a la Biblioteca dplyr o también a tidyverse:
      Library(dplyr)