Nel tempo avremo LLM sempre più evoluti. Sicuramente l’idea di un progetto open-source è intrigante, sta a vedere l’usabilità in base ad ognuno di noi. Al momento sto usando la funzione progetto di chapgpt che mi consente di uploadare tutto il codice e di sviluppare il tutto molto velocemente. Se in futuro questo LLM dovesse riuscire a fare lo stesso potrei dargli una chance.
Sinceramente l'ho provato, per migliorare l'impaginazione di un semplice script html con css: bella la possibilità di vedere subito i risultati in una finestra apposita, ma per il resto è un disastro! Non ha compreso il compito e ha peggiorato l' impaginazione precedente. Dopo due o tre tentativi di fargli comprendere meglio il compito (con tanto di immagine di esempio) mi ha detto che era terminato il tempo a mia disposizione! Torno su AI studio...
è una fregnata, dagli in pasto un equazione di quarto grado e poi vedi. il migliore è O1 al momento "x ^2 +(3x/ x−3 )^2 =16" . soluzione X=-1+-radice(7)
In questi giorni ho provato deepseek per la generazione di codice per google apps script. Sto facendo dei google forms col codice. Ds mi ha detto che non può fare direttamente le chiavi di risposta, dice di inserirle manualmente, invece chat gpt me le fa. Però chatgpt mi genera codice per una decina di domande, mentre deppseek mi ha generato codice per una cinquantina di domande
Ciao Simone, scrivo in italiano e risponde in italiano. Se uso Deep Think io scrivo in italiano e lui risponde in inglese. Domani li metto alla prova con altre lingue e ti dico.
poichè credo lo abbiano addestrato principalmente in lingua inglese poichè nei benchmark di coding e matematica dicevano only english, quindi sicuramente per usarlo al meglio bisogna scriverli in Inglese
Difficile valutarlo in modo professionale. Sarà anche gratuito e open source, ma è talmente ristretto nel numero di messaggi e nella quantità di caratteri degli allegati, che è invalutabile. Al momento il re del ragionamento complesso è sempre Claude 3.5 Sonnet. O forse lo è o1, ma non mi sognerò mai di pagare 200 euro al mese. Quelli di OpenAI hanno bisogno di una bella sgonfiata... Sora docet.
Lo uso da una settimana e non c’è paragone per completezza delle risposte anche su temi molto importanti con ChatGPT - 4o o Claude 3,5 - nei prossimi giorni provo a capire come addestralo su argomenti specifici poi ti dico.
Ciao Gabriele ma te lo stai utilizzando in italiano o in inglese ? Perché molti di questi benchmark sono in inglese e quindi sicuramente performa meglio su query in Inglese invece che in italiano
ma infatti ho detto che per coding e matematica è forte. Scrittura creativa non ho detto proprio nulla. E poi non ti dimenticare che è un modello open-source
su quelle due cose è migliore certo che si possono confrontare. Soprattutto poichè gli LLM non sono tutti uguali c'è chi è bravo con il coding, chi nei problemi complessi altri su scrittura creativa etc...
Nel tempo avremo LLM sempre più evoluti. Sicuramente l’idea di un progetto open-source è intrigante, sta a vedere l’usabilità in base ad ognuno di noi. Al momento sto usando la funzione progetto di chapgpt che mi consente di uploadare tutto il codice e di sviluppare il tutto molto velocemente. Se in futuro questo LLM dovesse riuscire a fare lo stesso potrei dargli una chance.
Taaaak 🎉🎉🎉
grande, Simone! grazie per la clip. sto provando deepSeek nel coding. piuttosto interessante (mi piace parlare per eufemismi)
Sinceramente l'ho provato, per migliorare l'impaginazione di un semplice script html con css: bella la possibilità di vedere subito i risultati in una finestra apposita, ma per il resto è un disastro! Non ha compreso il compito e ha peggiorato l' impaginazione precedente. Dopo due o tre tentativi di fargli comprendere meglio il compito (con tanto di immagine di esempio) mi ha detto che era terminato il tempo a mia disposizione! Torno su AI studio...
ma hai scritto in Inglese o in italiano?
Pazzesco🎉🎉
è una fregnata, dagli in pasto un equazione di quarto grado e poi vedi. il migliore è O1 al momento "x ^2 +(3x/ x−3 )^2 =16" . soluzione X=-1+-radice(7)
Dipende, dal lato coding e dal lato rapporto costo/rendimento, è pressoché il migliore. Soprattutto per quanto riguarda le API
@@alyax2026 dal punto di vista di analisi matematica il migliore è O1, ho fato tanti test. poi è anche vero che è gratuita. dipende cosa devi fare
ma infatti ho fatto vedere nel video che è seconda a o1. Ho riportato i dati del seguente benchmark aider.chat/docs/leaderboards/
@@simone_rizzo98 Risultati che fanno PAURA, spaccano
In questi giorni ho provato deepseek per la generazione di codice per google apps script. Sto facendo dei google forms col codice. Ds mi ha detto che non può fare direttamente le chiavi di risposta, dice di inserirle manualmente, invece chat gpt me le fa. Però chatgpt mi genera codice per una decina di domande, mentre deppseek mi ha generato codice per una cinquantina di domande
interessante silvia grazie per il contributo!
Impressionante...quando sarà disponibile su ollama?
ho controllato ora ma ancora non c'è dobbiamo aspettare un po' ollama.com/search?q=deepseek
Il fatto che è open source è fantastico
stanno facendo passi da gigante!
la sparo grossa: un video per deepSeek in locale?
ehhh molto grossa chi me lo da l'hardware ahahah
Ciao Simone, scrivo in italiano e risponde in italiano. Se uso Deep Think io scrivo in italiano e lui risponde in inglese. Domani li metto alla prova con altre lingue e ti dico.
poichè credo lo abbiano addestrato principalmente in lingua inglese poichè nei benchmark di coding e matematica dicevano only english, quindi sicuramente per usarlo al meglio bisogna scriverli in Inglese
Bello, però gli ho chiesto se è open source e mi ha detto di no ahahah
ahahahahah questo è fantastico!
@@simone_rizzo98 Comunque sei bravissimo, ti seguo da tempo e sei il miglior creatore di contenuti sulla AI in italia. Complimenti e continua così
Difficile valutarlo in modo professionale. Sarà anche gratuito e open source, ma è talmente ristretto nel numero di messaggi e nella quantità di caratteri degli allegati, che è invalutabile. Al momento il re del ragionamento complesso è sempre Claude 3.5 Sonnet.
O forse lo è o1, ma non mi sognerò mai di pagare 200 euro al mese. Quelli di OpenAI hanno bisogno di una bella sgonfiata... Sora docet.
il re degli open-source ho detto!
E nel video evidenzio il fatto che è secondo ad o1 riportando questi benchmark aider.chat/docs/leaderboards/
Lo uso da una settimana e non c’è paragone per completezza delle risposte anche su temi molto importanti con ChatGPT - 4o o Claude 3,5 - nei prossimi giorni provo a capire come addestralo su argomenti specifici poi ti dico.
si però, risponde solo in inglese o sbaglio?
@ supporta 40 lingue. Anche se a volte soprattutto nella funzione deep think può rispondere in inglese ma se glielo chiedi lo scrive in italiano.
Ciao Gabriele ma te lo stai utilizzando in italiano o in inglese ? Perché molti di questi benchmark sono in inglese e quindi sicuramente performa meglio su query in Inglese invece che in italiano
@@gabrielesportoletti7002 Grazie mille
Ciao Gabriele, ma non c'è paragone nel senso che è più scarso di Gpt e Sonnet oppure è meglio? E poi dove lo esegui, in locale?
👍
Ma scusate se gli chiedete chi sei o chi ti ha fatto, dice che è GPT4 di openAI 🤣...non mi sembra affidabile
ahhahaha interessante, significa che hanno usato i dati di GPT per addestrarlo è quindi un dinsillato
Non esageriamo! Nella scrittura creativa Claude è 100 spanne avanti.
ma infatti ho detto che per coding e matematica è forte. Scrittura creativa non ho detto proprio nulla. E poi non ti dimenticare che è un modello open-source
@@simone_rizzo98 E allora specificalo nel titolo del video! Come hai scritto tu fai intendere diversamente!
l'unica pecca è la lunghezza delle chat, a me la limita dopo non molto
eh si purtroppo è una limitazione
Come si fa a dire che un'intelligenza è migliore di un'altra solo perché fa due cose meglio?
su quelle due cose è migliore certo che si possono confrontare. Soprattutto poichè gli LLM non sono tutti uguali c'è chi è bravo con il coding, chi nei problemi complessi altri su scrittura creativa etc...
Distrugge 😂😂😂😂. Ma tu te ne intendi di AI?
più del doppio di accuratezza nei benchmark per me è distruggere. Soprattutto poichè è un modello open-source!