Como Consultar Arquivos, Documentos e PDFs com I.A. Usando RAG

Inteligência Mil Grau

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 28 січ 2025

КОМЕНТАРІ • 82

@rafadgkurt 6 місяців тому ⁺²¹
Muito bom. Um dos melhores canais do UA-cam brasileiro sobre implementação de LLM, sem marketing furado e sensacionalismo apenas o conteúdo técnico e informativo.
@eliascarvalhooo 6 місяців тому ⁺¹
Concordo
@inteligenciamilgrau 6 місяців тому ⁺¹
Valeuuuuuuuuuuuuuuu!!
@PEDROMARCOSLOCATELLI 6 місяців тому ⁺⁶
Ótimo, Bob. Suas explicações são as mais claras e de fácil compreensão dentre os canais semelhantes no UA-cam. Força!!!
@inteligenciamilgrau 6 місяців тому ⁺¹
Valeuuuuuuuuuuuu Pedro!!
@t.t.o.p 15 днів тому
acabei de maratonar alguns videos sobre o assunto e o seu foi o melhor do youtube e a explicação ficou extremamente clara e concisa, valeu!
@ramon58453 6 місяців тому
Valeu!
@inteligenciamilgrau 6 місяців тому ⁺²
Valeuuuuuuuuuu!! Eu que agradeço!!! Foi o primeiro superthanks da história do canal! Uhuuuuuuuuuuu!!
@jonathanestefani6755 4 місяці тому ⁺¹
Parabéns pelo conteúdo, muito bem demonstrado com exemplos práticos.
@inteligenciamilgrau 4 місяці тому
Valeuuuuu Jonathan!! Obrigadãoooo!!
@marcelocosta2612 6 місяців тому ⁺¹
Muito boa a aula, Bob! Ficou bem claro como funciona essa técnica do RAG... Valeu demais!
@inteligenciamilgrau 6 місяців тому ⁺²
Valeuuuuuuuu Marcelo!!!!
@marcelocosta2612 5 місяців тому
@@inteligenciamilgrau valeu, mestre! Tamo junto!
@HellitonSoaresMesquita 6 місяців тому ⁺¹
Rapaz conteúdo de alto nível.
@inteligenciamilgrau 6 місяців тому
Uhuuuuuuuuu, valeuuuuuuuuuuu!!
@VivianeFranco 5 місяців тому
Eu sou apaixonada pelos seus vídeos. Vc é extremamente didático. Eu sou de Letras e consigo entender tudo o que você fala. Obrigada demais pelo seu conteúdo!
@inteligenciamilgrau 5 місяців тому
Boaaaa Viviane!! Fico feliz em ler isso!! A IA está numa etapa de democratização e certeza vai fazer parte do dia a dia de todas as áreas!! E a linguagem é onde a IA moderna está mais conectada!! Valeuuuuu
@sem.mais.delongas 5 місяців тому
Sensacional seu video... assim vou virar membro hein !... vou assistir mais alguns videos pra me convencer 100% de que tú realmente é o cara !!! 😃
@inteligenciamilgrau 5 місяців тому
Aeeee MM! Obrigadão pela força!! Valeuuuuuuuuuuuuuuuuuuuuuuu
@acciolimoda3390 5 місяців тому
Que conteúdo foda. Obrigado!
@inteligenciamilgrau 5 місяців тому
Faaaaala Accioli!! Eu que agradeço!! Valeuuuuuuuuuuuuuuuuuu
@julio.moreira 5 місяців тому
Sensacional 👏
@inteligenciamilgrau 5 місяців тому
Valeuuuuuuu Júlio!!
@brunobraga83 6 місяців тому ⁺¹
Estou testando dois projetos RAG um e o AnythingLLm e o Quivr, tive problemas cm o Anything trabalhando com documentos tecnicos e o Quivr possue muitos problemas com a implementaçao mas consegui fazer funcionar e estou testando, a minha ideia e transformar isso e um auxialiar tecnico em diversas areas como eletronica por exemplo.
@inteligenciamilgrau 6 місяців тому ⁺¹
Faaaaala Bruno! O rag mais simples de usar de plataformas prontas que vc consegue inclusive configurar os chunks é o dify!! Testa ele e diz o que achou!! Valeuuuuuuuuu
@dutodiboa 4 місяці тому
Cara tenta fazer no open webui. Na minha opinião, o melhor que testei até agora usando o llama 3.1 8b e gemini 2b.
@phdcosta 6 місяців тому ⁺²
E aí Bob? tudo certo? parabéns pelo canal. Tenho pesquisado sobre RAG, contudo achei os resultados decepcionantes quando trabalhamos com textos mais complexos como de filosofia, por exemplo. Parece tudo muito bom para perguntas/respostas ou coisas tipo um estudo dirigido (o que acho fraco semanticamente). Quando os conceitos estão dispersos em um texto longo a similaridade entre a pergunta e os textos com as respostas é muito distante. Você teria alguma dica de como abordarmos esses textos? Tenta aí com um livrão de psicologia prá ver o resultado. Abraço e continue com sua vibe bacana e didática simples e objetiva.
@inteligenciamilgrau 6 місяців тому ⁺⁵
Faaala Paulo! Pensa que todo texto que envolve uma semântica mais interpretativa vão ser mais difíceis! Sobretudo quando usam palavras fora do uso comum das que estão nos dados que o modelo foi treinado! Quando o conteúdo é mais complexo, vai ser necessário debruçar um pouco mais de esforço mesmo! Uma coisa que em geral se faz se chama rerank, quem é fazer a busca, ao invés de 4, escolher as 20 melhores, e pedir pra LLM reclassificar a ordem dessas 20 melhores! E tem estratégias de busca, você não precisa passar o texto todo para o RAG, pode criar resumos que apontam para um trecho e por aí vai! Mas por exemplo, pensadores muito famosos estilo Kant, que tem diversos dicionários inclusive para ler a obra dele, isso vai ser um trabalho mais àrduo eu vale mais fazer um fine tuning que RAG! Esses casos seriam difíceis até para uma pessoa comum, essa é a questão! rsrs Valeuuuuuuuu
@ElaraArale 6 місяців тому ⁺²
Agora entendi, o porque as instruções do meu bot não gastam tokens, eles fazem parte de um banco de dados, tinham me dito isso, mas agora deu para entender melhor.
@inteligenciamilgrau 6 місяців тому
Ele em geral vai gastar só o token to texto que enviou e da resposta, mas não vai processar o texto todo! Então reduz bem!! Uhuuuuuu!
@RafaelOliveira-st3ih 6 місяців тому ⁺²
Marcando presença
@inteligenciamilgrau 6 місяців тому ⁺²
Uhuuuuuu, aeeeeeee Rafael!! Valeuuuuuuuuuuuuuuuu
@asanchezz 3 місяці тому ⁺¹
Amigo, tenho cerca de 1000 documentos PDF com instruções normativas da empresa, qual a melhor técnica "ensinar" uma LLM a responder sobre esses assuntos? RAG ou Fine tuning?
@inteligenciamilgrau 3 місяці тому
Faaaala Anderson!! Neste caso específico vai precisar olhar com atenção os detalhes e as nuances dos documentos, o grau de criticidade de cada um deles, montar um projeto maior e ver qual a melhor direção!! Valeuuuuuuuuuuuuu
@mardoniorodrigues11 5 місяців тому
Que conteúdo espetacular!!! Ganhou Mais um inscrito.
Fiquei pensando em casos onde se têm documentos que contêm dados, como relatórios financeiros. Digamos que eu queira usar esse tipo de documento no RAG e depois fazer perguntas analíticas, como: 'Qual foi o lucro da minha empresa no mês X?' ou 'Quantos itens do produto X foram vendidos no mês Y?'. Imagino que, para esses casos, o exemplo do vídeo não funcione muito bem. Sendo assim, é possível criar uma solução que atenda a esse propósito usando RAG?
@inteligenciamilgrau 5 місяців тому ⁺²
Se o documento tiver dados de lucro, quantidades de itens, ele responde sim!! Mas fica atento que se você pedir para ele "somar", "calcular", o modelo vai errar!! E nesse caso você precisa criar uma ferramenta específica de matemática para o seu agente usar!! Que aí ele manda os dados para a ferramenta, ela calcula e passa a informação!! E se os dados forem em imagens, é só enviar a imagem!! Valeuuuuuuuuuuu
@fschincariol 6 місяців тому ⁺¹
Fantástico Bob!!! Estão podemos criar varios banco de dados de determinados assuntos e usá-los quando quisermos e assim a resposta é mais rápida e o custo é menor?
@inteligenciamilgrau 6 місяців тому ⁺¹
Exato! Você gasta na hora que gera o banco e depois no futuro vai gastar só pra converter a pergunta e com a resposta!! O texto processa uma vez só! Valeuuuuu
@nickvasc 5 місяців тому
Curti!!
@inteligenciamilgrau 5 місяців тому
Faaaaala Nicholas!! Valeuuuuuuuuuuuuuuuuuuuu
@adrianaviana3276 2 місяці тому ⁺¹
Estou criando um modelo RAG com o ollama, mas ele está trazendo respostas externas ao documento. Sabe como resolver isso?
@inteligenciamilgrau 2 місяці тому ⁺¹
Oi Adriana, não esquece de dizer no prompt para ele usar somente o que você passar como contexto! Coloca o texto em uma área específica no system e diga para ele responder usando o texto daquela área!! Valeuuuuuuu
@otimistarj 6 місяців тому
muito bom, para ter os chunks todos no mesmo tamanho não use separador.
text_splitter = CharacterTextSplitter(separator="", chunk_size=chunk_size,
@inteligenciamilgrau 6 місяців тому ⁺¹
Boaaaaa, valeu a dica!!
@orafaelgf 6 місяців тому ⁺¹
otimo video. direto ao ponto. parabens.
uma duvida:
caso eu queira ler um arquivo pdf, basta eu alterar o 'path' pra buscar desse arquivo ou preciso fazer mais algum ajuste?
@inteligenciamilgrau 6 місяців тому
PDF especificamente vai variar bastante porque tem vários padrões que surgiram ao longo do tempo!! Algumas vezes o pdf é feito de imagens (principalmente os mais antigos)! No geral vc precisa de uma lib que importa o pdf, extrai o texto, e aí vc manda o texto para ser processado!! Valeuuuuuu
@LVFPRODUCAO 6 місяців тому
excelente conteúdo, estou estudando muito LLMs, porém ainda não aplicando tanto.. Poderia me deixar uma sugestão de como aplicar RAG sem códigos (nocode) com efetividade/assertividade alta também? (N8N, DIFY..)
@inteligenciamilgrau 6 місяців тому ⁺¹
Faala LVF!! O dify faz com certeza nativo!! N8N vc vai precisar montar o banco manualmente e depois conectar!! Veja pinecone e supabase!! Valeuuuuuuuuuuuu
@adrianokelviodarochadantas5303 5 місяців тому
PDF que tem imagnes .. o LLM faz OCR ?
@inteligenciamilgrau 5 місяців тому
Faaaala Adriano!! Dos testes que eu fiz com PDF com imagens, ele só pega o texto mesmo!! Mas eu diria para você sempre testar PDFs com imagens para conferir porque isso pode variar dependendo de como a pessoa faz a implementação!! Nos vídeos que eu fiz sobre o ENEM, eu fazia OCR enviando as imagens do PDF como imagem mesmo! Você consegue extrair as imagens do PDF dependendo de como ele foi feito!! valeuuuuuuuuu
@UNKNOW_NAME00097 5 місяців тому
É possível fazer isso para ler dados de planilhas e depois fazer com prompt buscar esses dados e mostrar? Joga alguma planilhas com números e pedir e depois converte em json?
@inteligenciamilgrau 5 місяців тому
É possível sim!! Mas eu diria que se você já tem a planilha, usa algum programa pra ler os dados, já converte em variável e envia como texto normal! Vai dar certo também!! Dá inclusive para gerar gráficos e enviar o gráfico como imagem pra ia interpretar!! Valeuuuuuuuuuu
@AndreSilva-oy5kv 2 місяці тому
Curti muito o video. Fiquei em duvida, gostaria de passar um PDF que tem algumas informações cadastrais como nome,empresa,endereço e etc. Mas esses documentos tem padrões diversos,por isso acredito que usar IA seria uma boa. Eu passaria o documento e o output seria no formato json {"nome" "andre", "empresa": "Google"} e etc. Como o input são documentos diversos, acredito que o RAG seria uma boa,porem preciso do output em um formato especifico, nesse caso json.
Pode me explicar se devo usar RAG ou fine tuning ou até mesmo ambos ?
@inteligenciamilgrau 2 місяці тому
Faaaaala André, o ideal antes de enviar os PDFs direto para a LLM salvar, é fazer um pré-processamento! Principalmente quando os dados tem formatos diferentes!! Você pode ler os PDFs antes com um agente que vai padronizar a saída e só depois enviar os dados para o banco criar o RAG!! Valeuuuuuuuu
@AndreSilva-oy5kv 2 місяці тому
@@inteligenciamilgrau Infelizmente não consigo fazer um pre-processamento, são dados de processos judiciais, o motivo de usar IA é que não consigo desenhar uma logica que pegue esses dados de forma estruturada, já que existem diversos padrões de processos judiciais
@RogerioMatos75 6 місяців тому
Irmão, pra diminuir a quantidade de tokens eu pego o .pdf e transformo em .protobuf mantendo a semântica.
@inteligenciamilgrau 6 місяців тому
Muito interessante sua dica!! Já chegou a fazer o teste usando a API de quanto gasta com e sem protobuff pra ter uma noção da economia?
@DuCkOx 5 місяців тому
Como fica a questão de informações pessoais no documentos que a IA vai ler?
@inteligenciamilgrau 5 місяців тому
Faaaaala Lucas!! No caso cada empresa tem uma política de segurança de dados diferente! Tem que ler as documentações de cada empresa!! Em geral tem cenários que a empresa usa os dados para treino, outros cenários que não usa, mas retém os dados por um período de tempo! Para ter 100% de sigilo, só rodando na própria máquina com modelos opensource estilo Llama, Mistral e por aí vai!! Dá para usar via Ollama ou LmStudio que são os mais conhecidos!! Valeuuuuuuuuu
@AndreLuiz-wi5fz 2 місяці тому
Preciso aprender isso kkk
@inteligenciamilgrau 2 місяці тому
Uhuuuuuuuuu, demorou!!! RAG é vida!!
@diegocapelladev 5 місяців тому
Tem algum modelo grátis que eu poderia utilizar com o Ollama e Open WebUI para voz sem que seja necessário “treinar” a voz? Exemplo, converter texto para áudio.
@inteligenciamilgrau 5 місяців тому ⁺¹
Se estiver usando python, pode usar o pyttsx3!! Ele vai usar as vozes instaladas no seu PC para gerar os audios!! Valeuuuuuuuu
@diegocapelladev 5 місяців тому
@@inteligenciamilgrau Vou pesquisar sobre. Obrigado!!
@roalves1234 3 місяці тому
Olá professor, e se o contexto necessário ao chunk x por exemplo, estiver no bloco y? Isso o RAG consegue resolver?
@inteligenciamilgrau 3 місяці тому ⁺¹
O Rag pode resolver com abordagens avançadas!! Já passei por isso algumas vezes, e aí a solução vai ser mais avançada mesmo, resolvendo item a item eventualmente!! Pensa no rag como uma consulta ao dicionário! Ela é mais bruta e busca mais identificar os trechos do que ser inteligente de fato!
@roalves1234 3 місяці тому
@@inteligenciamilgrau Professor imagina que estou trabalhando com um artigo e a pergunta que eu farei depende do contexto dado pelo subtítulo - esse subtítulo aparecerá nos primeiros chunks mas não nos demais, afetando assim a resposta. O que posso fazer nesse caso?
@ramon58453 6 місяців тому
Parabéns pelo video. Ótima didatica.
Tentei replicar o exercicio, mas deu erro porque esta pedidno uma OPENAI_API_KEY no trecho OpenAIEmbeddings(), fique na dúvida porque no video não vi apontar essa chave. Abaixo segue o erro.
Agradeço se puder me ajudar e comentar o custo aproximado para procesamento do exemplo com essa api.
vectorstore = Chroma.from_documents(documents=all_splits, embedding=OpenAIEmbeddings())
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users
ala\AppData\Local\Programs\Python\Python312\Lib\site-packages\langchain_chroma\vectorstores.py", line 921, in from_documents
return cls.from_texts(
^^^^^^^^^^^^^^^
File "C:\Users
ala\AppData\Local\Programs\Python\Python312\Lib\site-packages\langchain_chroma\vectorstores.py", line 876, in from_texts
chroma_collection.add_texts(
File "C:\Users
ala\AppData\Local\Programs\Python\Python312\Lib\site-packages\langchain_chroma\vectorstores.py", line 389, in add_texts
embeddings = self._embedding_function.embed_documents(texts)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users
ala\AppData\Local\Programs\Python\Python312\Lib\site-packages\langchain_openai\embeddings\base.py", line 526, in embed_documents
return self._get_len_safe_embeddings(texts, engine=engine)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users
ala\AppData\Local\Programs\Python\Python312\Lib\site-packages\langchain_openai\embeddings\base.py", line 424, in _get_len_safe_embeddings
response = self.client.create(
^^^^^^^^^^^^^^^^^^^
File "C:\Users
ala\AppData\Local\Programs\Python\Python312\Lib\site-packages\openai
esources\embeddings.py", line 114, in create
return self._post(
^^^^^^^^^^^
File "C:\Users
ala\AppData\Local\Programs\Python\Python312\Lib\site-packages\openai\_base_client.py", line 1266, in post
return cast(ResponseT, self.request(cast_to, opts, stream=stream, stream_cls=stream_cls))
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "C:\Users
ala\AppData\Local\Programs\Python\Python312\Lib\site-packages\openai\_base_client.py", line 942, in request
return self._request(
^^^^^^^^^^^^^^
File "C:\Users
ala\AppData\Local\Programs\Python\Python312\Lib\site-packages\openai\_base_client.py", line 1046, in _request
raise self._make_status_error_from_response(err.response) from None
openai.AuthenticationError: Error code: 401 - {'error': {'message': 'Incorrect API key provided: your_api*****here. You can find your API key at platform.openai.com/account/api-keys.', 'type': 'invalid_request_error', 'param': None, 'code': 'invalid_api_key'}}
@inteligenciamilgrau 6 місяців тому
Faaala Ramon!! A lib dotenv puxa automaticamente a chave do arquivo .env !! Coloquei um exemplo no código do git, veja se agora vai!!
github.com/inteligenciamilgrau/videos_tutoriais/tree/main/rag
@otimistarj 5 місяців тому
é possivel fazer RAG simplesmente juntando dois PDFs de assuntos distintos num só arquivo ? da bons resultados ?
@inteligenciamilgrau 5 місяців тому
Faaala Antônio!! Pode sim!! Pensa que é um banco de dados que você consulta, como se fosse uma planilha em que cada célula tem um embedding e um trecho de texto!! A planilha não limita se vc quiser misturar um ou mais documentos!! Você pode ter mais colunas inclusive de outros assuntos que complementam aquele texto como o nome do arquivo e tudo mais!! O único limite que ela impõe é que tenha uma coluna de "embedding" que ela vai usar para comparar com o texto da pergunta! Acho que esse exemplo ajuda a entender!! Valeuuuuuuuu
@rennoman4609 6 місяців тому
Eu queria saber qual a dificuldade que os modelos tem hoje de consultar e analisar uma simples planilha , pois já testei inúmeras interfaces gratuitas e até pagas ( tirando for 4o , sei q ele faz isso ) , mas maioria ou não faz ou da erro .
Quer dizer , existe tecnologia para gerar um vídeo com prompt mas conversar com arquivos parece ser uma coisa q as i.as não curtem fazer
Alguém pode me explicar ???
Qual
@inteligenciamilgrau 6 місяців тому
Faaaaala Renno! Entendo sua dúvida, parece não fazer sentido, mas pensa que o problema maior está na importação que na LLM em si!! Pode não haver suporte à importação e nem todo arquivo importado terá a informação limpa e pronta para uso!! Os modelos gratuitos locais em geral não suportam importação!! Para rodar um modelo local com acesso à arquivos eu recomendo a Open WebUI que mostro nesse vídeo:
ua-cam.com/video/bmfR9YNksRo/v-deo.html
@Urukpensador 2 місяці тому
Da pra rodar em um orange pi win a64 512Mb RAM
@inteligenciamilgrau 2 місяці тому
Dá sim, desde que seja um modelo online! Se for rodar local não aguenta
@jorunessa 4 місяці тому
Esse canal ensina a fazer Reggae!
@inteligenciamilgrau 4 місяці тому
kkkkkkkkkkkkkkkkkkk boa
@Douglasmoreiranunes 6 місяців тому
Essa busca por similaridade em um banco de dados me faz pensar..... O que é pensar ?
@inteligenciamilgrau 6 місяців тому
rsrsrs pensar pra q, parceiro? rsrs
@renatobosa 10 днів тому
Eu faço reggae! 😂
@ElaraArale 6 місяців тому
Interessante então isso é RAG.

Наступне

Автоматичне відтворення

Como Ler PDF e DOCs com RAG Usando LangFLow com I.A. | Forma Mais Fácil e Rápida