Introduction to RAG, retrieval augmented generation

Поділитися
Вставка
  • Опубліковано 16 лис 2024

КОМЕНТАРІ • 73

  • @RaffaeleGaito
    @RaffaeleGaito  3 місяці тому

    Vuoi formarti sull'intelligenza artificiale? Entra nella mia academy IA360: ia360.academy/

  • @nugh1975
    @nugh1975 3 місяці тому +8

    ottimo, grazie. Aspetto il video sull'embedding.

    • @RaffaeleGaito
      @RaffaeleGaito  3 місяці тому +3

      aspetto di vedere se interessa anche ad altre persone

  • @FrancescoCataniaGroup
    @FrancescoCataniaGroup 2 місяці тому

    Ottimo video. Io ho utilizzato i rag inzieme ai db vettoriali e gpt e sql per creare un bot per un ristorante per un servizio di informazioni listino e gestione prenonatazione

  • @AdrianoFemiano
    @AdrianoFemiano 3 місяці тому +1

    Per quato detto al min 4:34 diceva un grande scusate se la mia ignoranza è superiore alla vostra! Grazie Raf per farmi capire a grandi linee concetti che da ignorante con me non avrei mai capito. Grazie

  • @nazariodelia3247
    @nazariodelia3247 3 місяці тому

    Non so se per caso o perché avevi letto un mio commento precedente, ma grazie per la tua precisazione nell'ultima parte del video. Poiché devo creare un tool ai da addestrare sia con il prompt che con dei documenti e non posso permettermi di fare più di un abbonamento (altrimenti farei chatgpt, Claude e la tua Academy senza pensarci due volte😂), avevo chiesto cosa scegliere tra i gpts di open ai, project di Claude o azure (che però è più impegnativo). Direi che a questo punto, per ora, lo strumento migliore per creare un tool da poter fare usare a terzi è il gpts, quindi dovrò fare l'abbonamento a quello poiché project di claude mi sembra di capire che sia limitato al singolo account e che non può essere usato da terzi (anche se Claude mi piace molto di più per tutte le altre attività di lavoro). Grazie mille!

  • @GiornalediSistema
    @GiornalediSistema 3 місяці тому +1

    Ottimo video; si al confronto RAG/Fine-tuning, e fosse possibile un video anche sull'embedding sarebbe il massimo. 🙂

  • @gianlucacamerini4770
    @gianlucacamerini4770 Місяць тому

    Bravo

  • @FulvioSilvestri-gc9pp
    @FulvioSilvestri-gc9pp 21 день тому

    Grazie.

  • @direttoreetico
    @direttoreetico 3 місяці тому +7

    Si fai un video con la differenza tra rag e file tuning thanks

    • @RaffaeleGaito
      @RaffaeleGaito  3 місяці тому +7

      vediamo un po' se interessa anche ad altri

  • @paolo_fantinel
    @paolo_fantinel 3 місяці тому +7

    Non vedo l'ora di vedere l'intelligenza artificiale in ambiente industriale, sopratutto a livello operativo. Penso al settore della manutenzione o della semplice (per modo di dire) risoluzione di problemi tecnici meccanici. Inserire tutti i manuali si macchinari costruiti assemblando 5/6 macchinari distinti dei quali do ogniuno abbiamo decine di manuali spesso tradotti dal tedesco in maniera un po grossolana. Mi immagino di radunare tutte le informazioni, i manuali, la componentistica, i pdf dei progettisti e tramite una domanda o magari una foto, mi estrae tutte le soluzioni applicabili a quel specifico particolare della macchina, recuperando i codici dei componenti impiegati e alle possibili soluzioni, non solo, una volta aggiornato la casistica dei problemi/soluzioni poter accorciare sensibilmente le tempistiche di risoluzione dei problemi e magari programmare in maniera più adeguata la manutenzione programmata. A breve mi iscriverò ad ingegneria gestionale e vorrei incentrare il tutto sull'intelligenza artificiale e la cua applicabilità in tutti i settori dell'industria

    • @RaffaeleGaito
      @RaffaeleGaito  3 місяці тому +1

      Grande! In bocca al lupo per questa tua nuova avventura allora!

    • @alessandrosalvaggio6772
      @alessandrosalvaggio6772 3 місяці тому +1

      i rag servono proprio anche per questo

    • @fmina76
      @fmina76 3 місяці тому +2

      Io mi occupo proprio di questo e il mondo dell’ Industrial AI (con requisiti diversi da quella generalista) è ancora tutto da esplorare e costruire nelle Operations. In bocca al lupo per la tua avventura universitaria con un piccolo avviso ai naviganti : non metterei al centro l’AI ma i processi (di manutenzione, analisi affidabilità, Fmeca, OEE, miglioramento continuo, etc) e le competenze e cultura nuova da costruire all’interno della workforce aziendale… le tecnologie a quel punto ne amplificheranno l’efficienza .. Ad Maiora

  • @vincorsaro
    @vincorsaro 3 місяці тому

    Grazie mille davvero Raffaele per questi tuoi contenuti, io uso quotidianamente l'IA per i miei studi in giurisprudenza, attualmente uso Gemini Pro, ChatGPT 4o, Perplexity (che ho conosciuto grazie a te) e Claude, li uso tutti e 4 in contemporanea proprio per confrontarli e mettermi al riparo il più possibile da allucinazioni ed errori, e ciononostante mi è capitato di ricevere allucinazioni da tutti e 4 (anche se va detto che Perplexity ne soffre di meno rispetto agli altri.
    In Academy si parla solo di programmazione dell'IA o vengono trattati anche altri temi, come appunto l'approccio allo studio e più in generale l'approccio al mondo del diritto?
    Io a tal proposito dal loro lancio ho creato due GPTs, ma non avendo conoscenze di programmazione non mi hanno dati grandissimi risultati finora, ma ora proverò a seguire il tuo tutorial su come caricare dei documenti sui miei GPTs.

  • @topastro
    @topastro 3 місяці тому +1

    Grazie.

  • @geronimocapo
    @geronimocapo 3 місяці тому +3

    Si confronto rag fine tuning grazie

    • @RaffaeleGaito
      @RaffaeleGaito  3 місяці тому

      vediamo se interessa anche ad altri e decido

  • @domenicopratico8141
    @domenicopratico8141 3 місяці тому

    Dopo questo video, ho deciso: MI SONO ISCRITTO ALLA TUA ACADEMY.
    See you on board :)

  • @lavoromeglio
    @lavoromeglio 3 місяці тому

    Grazie Raf, ottimo video. Domanda ignorante: sbaglio o un RAG e NotebookLM si assomigliano?

    • @RaffaeleGaito
      @RaffaeleGaito  3 місяці тому +1

      in un certo senso potremmo dire che NotebookLM è un RAG "leggero", con tutte i distinguo del caso ovviamente

  • @andnegr
    @andnegr 3 місяці тому

    Thanks!

  • @LuanCarli-s3f
    @LuanCarli-s3f 24 дні тому

    🦇

  • @blackrunner69
    @blackrunner69 3 місяці тому

    oggi mi iscrivo !

  • @riccardominunni4230
    @riccardominunni4230 3 місяці тому

    Confronto con rag fine certo!!

  • @DeathVsLife1975
    @DeathVsLife1975 3 місяці тому

    Ciao, vorrei programmare in flutter. Secondo te qual”ê la migliore AI che mi può aiutare?

    • @andrearitondale
      @andrearitondale 3 місяці тому +1

      Claude, Phind, Codestral e Codellama, ma i modelli da 34B o 70B di parametri minimo, quelli inferiori non sono sufficientemente potenti

    • @DeathVsLife1975
      @DeathVsLife1975 3 місяці тому

      @@andrearitondale 🤩 grazie

  • @GiuseppeCommisso-u4e
    @GiuseppeCommisso-u4e Місяць тому

    Domanda: posso creare RAG A PARTIRE DA LIBRI DI TESTO IN PDF? Esempio vorrei fare copia pdf di tutti i testi del corso di laurea in medicina per poterli consultare tramite chat. E’ possibile?

  • @noalemike63
    @noalemike63 3 місяці тому

    Quale sono le principali differenze tra un GPTs ad uso personale con project knowledge di dati professionali e il RAG?

    • @RaffaeleGaito
      @RaffaeleGaito  3 місяці тому

      "uso personale", direi che il punto della questione è lì
      Un'azienda quando mette in piedi un RAG lo fa per utilizzo professionale, duraturo nel tempo, con accesso (probabilmente) a varie persone del team, con una KB che cresce nel tempo, e così via...

  • @AnnaDustfield
    @AnnaDustfield 3 місяці тому

    Ok ma come si usa il RAG nella pratica? Si può usare anche per la musica, video e le immagini?

  • @andreadeprisco2925
    @andreadeprisco2925 3 місяці тому +1

    ChatGPT, per dovere di cronaca, riesce a inventarsi le cose anche citando la fonte (che dice tutt'altro).
    "E ho detto tutto..." (cit.)

    • @RaffaeleGaito
      @RaffaeleGaito  3 місяці тому

      L'ho detto in milioni di video, tranquillo ;)

    • @andreadeprisco2925
      @andreadeprisco2925 3 місяці тому

      @@RaffaeleGaito La mia non era una critica al video né tantomeno all'autore (ci mancherebbe). Era una critica a ChatGPT che non finisce mai di stupirmi. Negativamente.

  • @valeriorisa
    @valeriorisa 3 місяці тому

    Ma il RAG è paragonabile a l'uso dei GPT di openAI quando si immettono all'interno dei documenti di knowledge?

    • @RaffaeleGaito
      @RaffaeleGaito  3 місяці тому

      chiesto (e risposto) già in altri commenti ;)

  • @andrealamacchia8165
    @andrealamacchia8165 3 місяці тому

    Ciao Raff, una curiosità: se conosci i lavori di Borzacchiello, se dai in pasto a chat GPT il libro La Parola Magica e chiedessi al bot, per esempio, di rielaborare i vari decoding and profiling di Leonard Want in versione non vedente in modo da raggiungere gli stessi risultati del libro, chat GPT riuscirebbe a farlo, secondo te?
    Sinceramente usare le AI per farci dare una mano ulteriore alle riletture di libri di crescita personale sarebbe una bomba, non trovi?

    • @RaffaeleGaito
      @RaffaeleGaito  3 місяці тому

      Andrea secondo me la cosa migliore è provare. Ci metti pochissimo a fare un test ;)

  • @EgregioRegolo37
    @EgregioRegolo37 3 місяці тому

    Raffaele buongiorno. Scusa l'osservazione da nerd ma aldilà della dimensione dell'archivio RAG e Notebooklm sono la stessa cosa?

    • @RaffaeleGaito
      @RaffaeleGaito  3 місяці тому +1

      Diciamo che semplificando tantissimo NotebookLM ti permette di costruirti un tuo piccolo RAG. Così come anche i GPTs e i Projects di Claude.
      (I puristi esperti mi odieranno 😂)

  • @mikymarchese6570
    @mikymarchese6570 3 місяці тому

    Claude Sonnet, in modo gratuito, probabilmente fa questa cosa, cioè noi possiamo creare un "progetto" personalizzato dove carichiamo le info, i pdf, la doumentazione, e in quel caso le domande fatte all'AI vanno a pescare in quel "database" e non in generico...... Claude Sonnet è creato da ex di Open AI.....

    • @RaffaeleGaito
      @RaffaeleGaito  3 місяці тому

      vale lo stesso ragionamento che ho fatto per i GPTs

  • @lucaron9167
    @lucaron9167 3 місяці тому

    Come si crea un Rag? Inviando dei files a chatgpt?

    • @RaffaeleGaito
      @RaffaeleGaito  3 місяці тому

      uhm no 😅
      il video l'hai visto? hai visto lo schema super complesso che ho mostrato?

    • @lucaron9167
      @lucaron9167 3 місяці тому

      ​@@RaffaeleGaito eh si, speravo fosse più semplice 😅
      Nn é cosa che posso fare io in pratica, volevo avere la conferma 😢

  • @mikymarchese6570
    @mikymarchese6570 3 місяці тому

    grande Raf..... "io odio i capitan ovvio" 🤣🤣🤣 ... grazie come sempre per i tuoi contenuti..... e chi non mette un like è un "Capitan Ovvio" brutto e antipatico!! 😛😛

  • @pasqualebrescia
    @pasqualebrescia 2 місяці тому

    Anche NotebookLM di Google mi sembra una buona soluzione di RAG per principianti

  • @LucianoZuncheddu
    @LucianoZuncheddu 3 місяці тому

    E io che penavo fosse un acronimo legato al tuo Nome e Cognome!

  • @alessandrosalvaggio6772
    @alessandrosalvaggio6772 3 місяці тому

    il caso che hai citato del bot di risposta ai clienti l’ho proprio realizzato per alcuni moe clienti, hanno un ecommerce custom che ho realizzato anni fa e gli ho integrato un rag che ho fattp in python, misto tra locale e gpt, gli ho inserito anche data e ora, quindi ti avvisa pure se il negozio sia aperto o chiuso, mostra le foto dei prodotti, ecc…

    • @RaffaeleGaito
      @RaffaeleGaito  3 місяці тому +1

      bomba! ti va di dirci che stack tecnologico hai usato? magari può essere utile ad altri

    • @alessandrosalvaggio6772
      @alessandrosalvaggio6772 3 місяці тому

      @@RaffaeleGaito l’e-commerce nel caso specifico è un vecchio progetto in php/mysql/vanilla js
      è un sistema che ho realizzato diversi anni fa per clienti “piccoli”, tipo pasticcerie, rosticcerie ecc..
      ho creato poi diverse api custom come ad es. l’aggiornamento del catalogo prodotti (per prodotti “semplici”) tramite messaggio vocale su whatsapp e invio di una foto del prodotto (chiaramente poi da dentro la webapp, anche tramite smartphone si può modificare, aggiungere foto, opzioni del prodotto ecc), peró credimi, rendere “facile” l’aggiornamento da whatsapp è servito tantissimo per bypassare la “pigrizia mentale” nell’aggiornare i contenuti.
      riguardo al RAG ho creato un’api per estrarre i dati dal catalogo dell’ecommerce, la cui risposta è un json con tutti i campi ben in evidenza. poi ho creato in python un sistema che funge sia da api (ad es posso richiamarlo a whatsapp, sia da un plugin su wordpress, o direttamente come pagina web da embeddare in un sito) e che crea di fatto una chat. il bot per prima cosa quando viene avviato si crea in locale gli embeddings e quindi alimenta il db vettoriale dall’api di knowledgebase, quindi quando arriva una richiesta fa una ricerca tramite FAISS (quindi sempre in locale) sui documenti più rilevanti (in questo caso ho fatto una funzione che crea i chunk degli embeddings sulla base del singolo prodotto, non di “dimensioni” di testo e overlapping, quindi è molto preciso.
      per generare la risposta passo poi il tutto a gpt4o, a cui passo un prompt decisamente strutturato e anche data e ora attuale (nel fuso orario del cliente), in modo che possa rispondere anche a domande del tipo “posso ordinare per domani?” e se “doman” l’azienda è chiusa (i dati sugli orari arrivano sempre dal db dell’ecommerce, che contiene anche faq, ecc) il sistema correttamente risponde che il negozio è chiuso e propone alternative; questo funziona anche con gli orari, una cosa questa, che per esempio ho testato con chatbase ed altri sistemi simili e non funziona.
      poi tramite js ho creato qualche routine per mostrare le immagini dei prodotti (se presenti nel sistema e nella risposta) ma anche link (ad es. “come posso ordinare?” ti manda al form di contatto, piuttosto che ad altrre pagine specifiche.
      devo dire che il numero di “castronerie” (ad es. allucinazioni o risposte completamente inventate) è sceso moltissimo, anche se nelle risposte è sempre presente un disclaimer e il bot si presenta sempre come AI.

  • @paolomerzek
    @paolomerzek 3 місяці тому

    Ma differenza RAG e GPTS mio?

    • @RaffaeleGaito
      @RaffaeleGaito  3 місяці тому

      risposto già in altri commenti ;)

  • @MassimilianoNicotra
    @MassimilianoNicotra 3 місяці тому

    la ricetta della carbonara è sacra! Claude non la sbaglierebbe!

  • @micolebellocchio8234
    @micolebellocchio8234 3 місяці тому

    RAG sta per Raffaele Gaito

  • @AntonioForte-hu7hv
    @AntonioForte-hu7hv Місяць тому

    Bravo

  • @andreadeambrosis7336
    @andreadeambrosis7336 3 місяці тому

    Grazie.