La face caché de ChatGPT : Dark knowledge, Embodiment & Modélisation du monde

Thibault Neveu

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 30 чер 2024
#chatgpt #ia #intelligenceartificielle
Patreon : / membership
ChatGPT est sur toutes les lèvres. Mais comment fonctionne réellement ChatGPT et quelle caractéristique ont permis la révolution qui l'accompagne ? Dans cette vidéo j'introduis la notion de Dark knowledge et d'embodiement. Je passe en revu les étapes ayant permis la création de chatGPT et les implications futures sur les capacités de modélisation du monde des modèles d'intelligence artificielle.
00:00 Introduction
01:57 Chat GPT : Innovation & Révolution
03:00 Dark knowledge
07:00 Embodiment
11:49 Apprentissage auto-supervisé
14:20 Aprentissage supervisé
16:00 Condition de travail et centralisation de l'éthique
17:25 Apprentissage par renforcement : PPO
19:15 Modèle basé sur l'énergie (energy based model)
20:30 Modélisation du monde
26:10 Conclusion
[Chronique d'une IA]
Spotify : open.spotify.com/show/5yTTTKf...
Amazon music : music.amazon.fr/podcasts/5097...
Apple Podcasts: podcasts.apple.com/us/podcast...
[About me]
Visual Behavior : visualbehavior.ai
Perso : www.thibaultneveu.ai/
Github : github.com/thibo73800
Linkedin : / thibaultneveu
Twitter : / thiboneveu
Наука та технологія

КОМЕНТАРІ • 38

@14Tyrion Рік тому ⁺³
Ça fait plaisir de voir une nouvelle video, merci pour ton travail de vulgariser ce domaine
@bakarysiby8803 Рік тому ⁺¹
Merci beaucoup Thibault pour les explications explicites, on vous attend impatiemment pour la phase pratique. Elles sont très cool vos vidéos !!!
@michel_p5021 Рік тому ⁺²
Merci Thibault, pour ces explications vues sous un angle super intéressant ! Une explication technique compréhensible mais pas que - loin de là ! Super exercice complètement réussi
@bumbledev Рік тому ⁺¹
Enfin une vidéo intéressante sur ChatGPT. Continues tes vidéos sont top 👍🏻
@ThibaultNeveu Рік тому
Merci à toi 👍
@recorr Рік тому ⁺²
Merci, Thibault, vous êtes le seul à répondre intelligemment aux seules questions intelligentes que vous posez dans ce domaine.
Je ne connaissais pas ces notions, et comme chatGPT m'a dit, lui-même qu'il n'avait pas accès à internet et qu'il ne savait que ce que lui avait enseigné l'équipe qui l'a entraîné, je pensais que la seule prouesse était de faire des phrases grammaticalement justes.
Mais si effectivement, on imagine qu'il puisse être entrainé plus librement, il pourrait identifier des choses qu'on ne lui a pas apprise, et notamment, ce que l'on ne veut jamais voir : l'idéologie particulière des gens qui ont préparé son entrainement initial. Et plus généralement l'ideologie, les biais cognitifs, derrière les discours.
@benhamilton5463 Рік тому
Excellent ! Un grand merci
@lewistib9674 Рік тому
Merci Thibault ! Une vidéo technique et intéressante loin du sensationnalisme ! Merci pour tes vidéos
@msaid1410 Рік тому ⁺¹
Super interressant !
@madaragrothendieckottchiwa8648 Рік тому
C’est super 😁 cool de te revoir Thibault !! Belle vidéo
@ThibaultNeveu Рік тому
Merci à toi 👍
@mohammedezzaitouni4272 Рік тому ⁺¹
Merci continuer svp
@superresistant0 Рік тому
Très bien expliqué
@xxXPoowerXxx Рік тому ⁺²
Concernant les agents et les biais issue du modèle critique on pourrait s'inspirer de la nature, chaque agent aurait des instincts (survie, reproduction, etc..) afin que l'intelligence prospère peu importe son type d'agent. D'où la nécessité de l'embodiment comme tu dis pour que l'intelligence puisse évoluer dans son environnement. Du coup la notion d'un comportement ou information est définit comme bonne ou mauvaise selon les valeurs naturels qu'il a hérité. On pourrait ajouter aussi une contrainte de temps à l'agent (sa mort) pour qu'il trouve toujours la meilleure solution rapidement et afin d'évoluer dans son environnement. À sa mort son information ne serait pas perdu puisqu'il se répliquerait. Son intelligence ne serait pas perdu non plus mais il atteindra un stade plus élevé (un autre environnement) où là il continuerai de se développer.
@recorr Рік тому ⁺¹
Je ne suis pas sûr que cet aspect de embodyment qui imite les récompenses et les craintes humaines soit indispensable.
Il me semble qu'à partir du moment où l'agent découvre le monde au travers de textes seulement, les contraintes des producteurs de textes que sont les humains, sont incluses dans ce monde.
Le but n'est pas de fabriquer un nouvel animal, mais un agent qui gère le savoir mieux que nous.
Dans les entraînements actuels, il n'est pas utile de dire à l'algorithme de se dépêcher, il est à fond.
Comprendre le monde à travers des textes, peut contenir sa propre récompense, qui est de prévoir ces textes.
@omicronsrule6565 Рік тому
Salut, est-ce qu'on aura une suite à la série sur les algorithmes génétiques ? C'était super intéressant.
@medacha4630 Рік тому
Merci beaucoup pour cette vidéo
@zinebelqabli3101 Рік тому
je me demande si je donne une idée original à chatgpt pour la developper en conversation avec lui. est ce que CHATGPT peut utiliserr cette idée originale avec d'autres personnes dans leurs conversations avec lui ? et merci pour tes videos je suis grande fun
@ewanherjean8523 Рік тому
Je ne suis pas sur d'avoir compris comment l'agent A fait pour apprendre de l'agent B ? C'est le principe générique des GAN qui est mis en pratique avec l'embodiment ?
@khey8368 Рік тому
Salut Thibaut merci pour cette vidéo très intéressante comme d'habitude. Est ce que tu pourrais citer tes sources s'il te plaît ?
@ThibaultNeveu Рік тому
Pas de sources spécifique dans cette vidéo, mis à part le site D'openAI et le papier original
@recorr Рік тому ⁺¹
Par rapport à la fin de la vidéo... je reprends mon idée :
On peut surtout imaginer que si l'entrainement se fait plus librement, plutôt que d'avoir plusieurs agents ayant chacun leur "culture" gamer, scientifique, religieux ... un même agent pourrait se rendre compte de l'incohérence de ces cultures entre elles, et saurait corriger celles qui ne sont pas conforme à sa connaissance du monde par ailleurs.
En clair, qu'il ne devienne pas un système relativiste mais tout simplement scientifique, comprenant que la plupart des humains se satisfont, se contentent et se complaisent dans des modèles culturels arbitraire, auto-référents, et incohérents.
Du coup, on peut imaginer que ce genre d'agent serait censuré dans un premier temps.
Car, si on l'applique à des discours, des discussions, enregistrées, il pourrait nous révéler des idéologies prohibées cachées derrière ces discours.
@Otomega1 10 місяців тому
Et imagine à quel point nous pourrions nous en servir pour élargir nos connaissances des biais idéologiques même les plus insoupçonnés et ainsi parvenir nous même à une vision encore plus réaliste et complète du monde .. ça fait rêver
Mais effectivement ça sera forcément censuré par les QI à 2 chiffres assoiffés de contrôle au pouvoir de nos pays européens, ainsi que par les corporations adeptes du politiquement correcte 👀
@recorr 10 місяців тому
@@Otomega1
la censure sera très difficile, car, il ne faut pas oublier que les LLM sont de plus en plus facile à entrainer, ils savent traduire, et les données sont disponibles dans le monde entier
par ailleurs, on peut déjà discuter de biais cognitifs avec Claude notamment, il faut une démarche d'enquête particulière pour éviter ses propres biais de politesse et de confirmation. Depuis mon message qui date de 6 mois en arrière, je constate que la plupart des gens n'ont toujours pas compris ce qu'est un apprentissage profond, ils ignorent totalement ce que Thibeault appelle dark knowledge, et que je pense correspond plus à une sorte de "deep knowledge", et finalement, je vois peu de gens qui essaient d'exploiter ce savoir caché. Bon, ça aussi c'est un biais, car, il est normal que par définition on ait plus de chance de tomber sur un youtubeur qui fait du Ponzi (création de contenu qui explique comment créer du contenu pour expliquer comment créer du contenu afin d'expliquer comment créer du contenu ...)
J'ai vu une seule vidéo qui montrait la réponse de 4 LLM au biais d'un humain.
@Otomega1 10 місяців тому
@@recorr Je suis intéressé, tu aurais une référence à me donner que j'aille chercher?
Ce qu'expose Thibault sur sa chaîne est assez rare sur les réseaux sociaux à ma connaissance, presque introuvable en fait.
@_LuisFernandes_ Рік тому
pourquoi ne pas utiliser un GAN pour générer les benchmarks ?
@battlefield5 Рік тому ⁺¹
Je suis très inquiet par les IAs qui comprennent le monde à cause des problèmes d'alignement. Est ce que t'as réfléchi sur ce sujet? Si oui j'aimerais beaucoup ton avis sur la question en réponse ou encore mieux, en vidéo!
@recorr Рік тому ⁺¹
C'est quoi les problèmes d'alignement ?
Ça m'intrigue de voir les mots "inquiet" et "comprendre" corrélés...
@ThibaultNeveu Рік тому
En effet il faudrait une vidéo sur le sujet ;)
@battlefield5 Рік тому
@@ThibaultNeveu super j'ai vraiment hâte !
@battlefield5 Рік тому
@@recorr il me semble qu'en français il y a que the flares qui a fait une vidéo dessus
@recorr Рік тому
@@battlefield5
Ok. Je vais essayer de voir. Merci.

Наступне

Автоматичне відтворення

Vision Transformers : Les transformers pour l'analyse d'image