¿Qué es RAG Retrieval-Augmented Generation? Introducción a la Generación Aumentada por Recuperación

Поділитися
Вставка
  • Опубліковано 21 січ 2025

КОМЕНТАРІ • 10

  • @llmmaster_
    @llmmaster_  8 місяців тому

    Curso RAG paso a paso, con todos los pasos explicados -> www.skool.com/llm-master-3225/

  • @drycfullmetall
    @drycfullmetall 11 місяців тому +1

    Me estoy enamorando soy varón me gusta mucho la ciencia informática gracias bro.

  • @carlosbedoya8793
    @carlosbedoya8793 8 місяців тому +8

    Estoy trabajando en un RAG para extraer información de algunos pdf, pero veo algunas deficiencias al tener que someter la información a segmentación.
    El proceso que uso es segmentar el pdf en chunks, crear los embeddings, vectorizarlos; y para obtener la información hacer una búsqueda por similaridad.
    Algunas deficiencias que he detectado:
    Al consultar los autores del documento me brinda cualquier otra información.
    Esto se debe, asumo, a que tanto el título, como el nombre de los autores no son apropiadas para presentar un alto porcentaje de similaridad con la pregunta.
    2. En párrafos grandes los chunks pierden bastante información.
    3. En párrafos pequeños o títulos la información se puede asociar con el párrafo que lo antecede y por lo tanto la respuesta puede quedar mal.
    4. Obtener resúmenes de los documentos resulta imposible.
    Creo que gran parte de estos problemas podrías asociarse con el modelo utilizado. Tal vez cuando podamos entrenar nuestros propios modelos. El RAG resulte más eficiente.
    Eso apreciación, no se si en su experiencia esto ya ha sido resuelto.
    Gracias por el video.

    • @code1866
      @code1866 7 місяців тому +1

      Se podría decir que no es muy eficiente o confiable por ahora la información que te da?? Estaba pensando en implementar un RAG pero esto que comentas me parece muy interesante.

    • @carlosbedoya8793
      @carlosbedoya8793 7 місяців тому

      ​@@code1866 La tecnología es muy eficiente y rápida y en muchas consultas me ha parecido genial, pero creo que hay que hacer un tunning a los embeddings que devuelve la consulta.
      Estoy trabajando en: una vez recibidos los chunks más similares analizarlos para ver si contienen la idea completa. Si no inicia con mayúscula lo uno con el chunk anterior, si no termina con punto lo complemento con el chunk posterior.
      El problema que tengo es que no encuentro cómo consultar por chunk. Espero resolverlo pronto.

  • @leopoldomolina1763
    @leopoldomolina1763 3 місяці тому

    Recuerdo cuando OpenAI dijo que ahora podíamos adjuntar archivos pdf en la conversación con ChatGPT. Pero nunca nos dijo que se llamaba RAG. Lo que me hace pensar que estamos usando RAG sin saberlo (o sin conocerlo por ese nombre) desde hace tiempo. Desafortunadamente muchos creadores de contenido no han mostrado esto del RAG de forma muy clara

  • @edwightdelgado2939
    @edwightdelgado2939 11 місяців тому

    Excelente video. Me gustaría ver la forma de configurar los rag para obtener resultados mas optimizados con llama Index

  • @arepaforever3981
    @arepaforever3981 10 місяців тому +1

    Ojalá alguien haga un video titulado "Cómo crear una IA con tus propios datos, para super novatos explicado pasito a pasito". Tengo mucha información en vídeo, texto y audio sobre un proceso judicial muy complejo, y sería fabuloso poder crear una propia IA con estos datos y poder preguntarle cosas, en vez de perder horas y horas buscando la información entre miles de documentos de todo tipo.

    • @llmmaster_
      @llmmaster_  10 місяців тому +1

      estoy preparando justo ese video, estará en unas semanas

    • @MamiCheya
      @MamiCheya 2 місяці тому

      ​@@llmmaster_ lo hiciste?