RAG + LLAMA 3

Поділитися
Вставка
  • Опубліковано 13 січ 2025

КОМЕНТАРІ • 24

  • @freddyramirez4207
    @freddyramirez4207 Місяць тому

    Eres un maestro, Gracias por el video.

  • @pablobandeira5461
    @pablobandeira5461 8 місяців тому +9

    Me corrió todo a la perfección!!
    Utilicé un pdf en español por lo que cambié a un modelo embeddding multilingüe, modificando el siguiente codigo:
    embedding = FastEmbedEmbeddings(model_name="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")
    Por si alguno le sirve, saludos!

    • @pacashanaya
      @pacashanaya 4 місяці тому

      Ese modelo que tal es para los embedding?

    • @pablobandeira5461
      @pablobandeira5461 4 місяці тому

      @@pacashanaya va bien!

    • @pacashanaya
      @pacashanaya 4 місяці тому

      @@pablobandeira5461 , amigo lo he probado y te dire que tienes toda la razón corre de maravilla y con archivos pesados, en mi caso uso LlamaIndex:
      gemma = Ollama(model="gemma2:2b", request_timeout=360.0, temperature=1)
      Settings.llm = gemma
      Settings.chunk_size = 1024
      Settings.chunk_overlap = 100
      Settings.embed_model=FastEmbedEmbedding(
      model_name="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2"
      )

    • @pacashanaya
      @pacashanaya 4 місяці тому

      @@pablobandeira5461 , aunque solo hay un pequeño problema, que cuando recibe nueva información, ya se olvido la otra información que subi.

    • @pablobandeira5461
      @pablobandeira5461 4 місяці тому

      @@pacashanaya eso te va a pasar con cualquier modelo que subas, no es un error. Lo que deberías hacer es ir sumando memoria al prompt con las preguntas y respuestas pasadas. Saludos.

  • @eldersarmientodev
    @eldersarmientodev 8 місяців тому +1

    lo acabo de terminar y todo perfecto, mil gracias por el ejercicio practico

    • @davidbu8248
      @davidbu8248  8 місяців тому

      Gracias Elder espero te sirva. Saludos

  • @jaimemunoz3025
    @jaimemunoz3025 4 місяці тому +1

    felicitaciones por el video, saludos desde chile

    • @davidbu8248
      @davidbu8248  4 місяці тому

      Muchas gracias Jaime un saludo

  • @metadonapalatropa139
    @metadonapalatropa139 8 місяців тому +1

    Gracias!!! Buen trabajo!!!

    • @metadonapalatropa139
      @metadonapalatropa139 8 місяців тому +1

      Hay un error en el enlance del punto 1, dentro de "pasos.md". Redirecciona, pero da error 404.

    • @davidbu8248
      @davidbu8248  8 місяців тому

      @@metadonapalatropa139 muchas gracias, ya lo corregí, espero te sirva

  • @pablobandeira5461
    @pablobandeira5461 8 місяців тому +1

    Gracias David!

    • @davidbu8248
      @davidbu8248  8 місяців тому

      No hay de que Pablo espero te sirva

  • @jreyes-tech
    @jreyes-tech 5 місяців тому +1

    He comparado tu trabajo con otros de la web y me sorprende la exactitud de las respuestas en relación a otros ejemplos similares. Pudieras agregar algún ejemplo utilizando una interfaz con streamlit.
    De antemano, gracias por tu contenido.

    • @davidbu8248
      @davidbu8248  5 місяців тому

      Hola espero estés bien. Dale genial espero te sirva. Respecto a lo de agregar streamlit claro lo tengo presente para un próximo video. Saludos!

  • @alejandrobrun
    @alejandrobrun 8 місяців тому +1

    Cuales son los req de hard mínimos para que el rag corra con una performance parecida a la del video?

    • @davidbu8248
      @davidbu8248  8 місяців тому

      Hola Alejandro en el video estoy usando una maquina con 16GB en GPU y 20 GB de RAM y el procesador Ryzen 9. Espero te sirva

    • @alejandrobrun
      @alejandrobrun 8 місяців тому

      @@davidbu8248 super útil. Muchas gracias

  • @ariel7904
    @ariel7904 6 місяців тому +1

    Magnifico video
    En mi caso tengo ollama con una api corriendo en un chatbot en wp ¿como podria hacer para configurar que las respuestas sean de este modelo con RAG? ¿Podria cambiar solo el enlace al que apunta la API?

    • @davidbu8248
      @davidbu8248  6 місяців тому +1

      Hola Ariel espero estés bien en ese caso habría que tener la base de datos vectorial y las operaciones se comparación. Por lo demás el modelo podría ser ese u otro