@@TheMorpheusVlogs Kann es sein das ChatGPT den demokratischen Prompt mit dem König und den Goldstücken mit Absicht nicht lösen kann weil "es" sich für irgendwas hält?
Mein erstes Video von dir und dass du direkt 1h über das Thema gerissen hast und zugleich spannend warst, hat mich überzeugt dir ein Abo zu geben. Mehr, mehr mehr davon!!!
liebe dieses lange Format ❤ vor allem da ich nicht aus den passenden Fachgebieten komme hilft mir das video hier sehr zu verstehen,wie die benchmark werte überhaupt zustande kommen und wofür ich es nutzen kann und wofür eben nicht. das einzige video dass es verdient in die trends zu gehen, zu dem thema
Es ist doch gerade einmal 2 Stunden alt. Ich hab bis gerade gearbeitet und gucke es mir jetzt erst an. Ich finde nach 2 Stunden kann man da noch kein Urteil fällen ❤
@@PeddaVomMond habe ich auch nicht :) ging mir um die performance zu dem moment als ich es gesehen hatte. Da war die verhältnismäßig nicht so stark. Was ich schade finde, da das video einfach sehr gut ist.
Da es anscheinend mit meinem Kommentar noch Unklarheiten gibt was ich eigentlich meinte: YT sind die ersten Stunden sehr wichtig. Je mehr Traffic, dort passiert, desto mehr wird es anderen /neuen Menschen ausgespielt. Und dafür,dass das Video schon zwei Stunden online war, hatte es eben (mMn) noch sehr wenig Traffic (Views/Likes/Kommentare). Und das meinte ich mit simpler Performance in dem Kontext. Ich wollte ja auch ausdrücken,dass ich hoffe,dass das noch erheblich krass steigt,da es eben ein super Video ist.
Ich mag Rätsel und ich mag KI und ich mag deine Videos, leider habe ich das IT Video erst gesehen, aber war trotzdem sehr angenehm und schön, danke für deine Mühe, auch für den Newsletter, den ich davor gelesen hatte.
„Ein quasi verschlüsselter Text.. oder.. koreanisch war das“ fand ich gut. xD Fand das Video auch super interessant! Die Länge genau richtig fürs Abendessen. :)
habe den Kommentar gerade in dem Moment gelesen, als es im Video gesagt wurde xD Ich kann mir vorstellen, dass für diese Verschlüsselung die einzelnen Striche/Teile, aus denen ein koreanisches Zeichen besteht, anders angeordnet wurden. So kann man es eigentlich nicht mehr lesen. Man muss dann erkennen, auf welche Art die Zeichen neu zusammengewürfelt wurden
Danke für das informative Video. Es ist länger geworden, aber die Informationsdichte war durchgehend hoch. Die Rätsel haben mich gepackt und ich hatte einen entspannten Abend. Zudem bin ich glücklich, da ich die Rätseln lösen konnte. Das König-Rätsel hat eine für mich bekannte Lösungsstruktur gehabt, weswegen es ging.
Hast du auch mal Variationen sehr bekannter Logikprobleme ausprobiert? Zum Beispiel das Flussüberquerungsrätsel mit Wolf, Ziege und Kohlkopf. Dabei aber eine Regel ändern oder weglassen, so dass sich die optimale Zugfolge ändert. Viele Modelle greifen trotzdem auf die in den Trainingsdaten vorhandene Musterlösung zurück, auch wenn die jetzt falsch ist.
tolles Video, wie all' deine anderen. Die Videos von dir sind eins der Highlights auf YT. Danke für deine tolle Arbeit und die aufschlussreichen Einblicke.
letztlich wirkt o1 eigentlich nur so, als ob mehrere 4o antworten geben und diese wieder strukturiert analysiert werden um dann nach ein paar mal zu reflektieren eine gut sortierte und nachvollziehbare Antwort zu geben, die natürlich besser ist als vorher. Das erklärt auch, warum es beim reinen Texten nicht besser geworden ist, weil da reflektiertes Denken nicht wirklich hilft. So ähnlich wie 5 Schach-Engines zu kombinieren, was in den Anfängen der Schachcomputer einige ELO Punkte gebracht hat.
Großes Danke für diese umfängliche Erläuterung zu dem ganzen Thema insbesondere zu GPT-o1. Mich hat es jedoch stark gewundert, dass die meisten Modelle Schwierigkeiten mit dem "Ausdauerlauf" hatten. Recht einfach hatte ich die Lösung zusammen und bin kein Vorzeigelogiker. Bei der König-Aufgabe, kann ich mir vorstellen, dass entweder "Kreativität" gefehlt hat oder das Prinzip mit den VorschlägEN nicht erfasst wurde. Und deine Vermutung am Ende des Videos kann ich bestätigen, OpenAI baut jetzt stark das Team zur Erforschung von (Multi-)Agenten aus.
Sehr tolles Video. Ich habe durch Zufall beim O-Modell herausgefunden, dass sich dieses Modell mit dieser Aufgabe sehr schwergetan hat. Auch nach 2 Nachbesserungen kam es nicht auf das korrekte Ergebnis: Die Aufgabe: Verwenden Sie jede der neun Ziffern einmal, und nur einmal, und bilden Sie eine Menge von drei Primzahlen, die die kleinstmögliche Summe haben. Zum Beispiel ergibt die Menge 941, 827 und 653 die Summe 2.421, aber das ist bei weitem nicht minimal. Korrekt ist: 149 + 263 + 587=999, Erste Lösung: 269, 359 und 1487, was insgesamt 2115 ergibt.; Zweite Lösung: 149, 263 und 857, was insgesamt 1269 ergibt.; Dritte Lösung: 149, 283 und 761, was die Summe 1193 ergibt.
Bin fernab von Informatik, trotzdem bis zum Schluss geblieben - vielen Dank. Würde es toll finden, auch Geistes- und Sozialwissenschaften mit in die Betrachtung einzubeziehen (ja, Mathe/Logik deckt einen Teil davon ab, aber eben nur einen Teil). Wahrscheinlich geht das noch nicht, weil einfach sämtliches archiviertes Wissen nötig wäre, um etwa ein Phänomen kulturhistorisch herzuleiten oder einen geopolitischen Konflikt zu analysieren... wofür Statistik vielleicht eh nicht das geeignete Werkzeug ist, keine Ahnung, Würde mich interessieren.
Die Videopräsentation besticht durch ihre exzellente Qualität sowie eine überzeugende Länge. Die Zusammenfassung vieler komplexer Inhalte in einem übersichtlichen Format erfordert ein hohes Maß an Expertise, besonders wenn die Erläuterungen eine hohe Informationsdichte aufweisen. Hinsichtlich der Darstellung ist festzuhalten, dass diese sehr gut gelungen ist. Diesbezüglich überzeugt insbesondere die Wortwahl, da sie die Inhalte in verständlicher Form vermittelt. Des Weiteren wäre ich gewillt, mir ein bis zu zweistündiges Video vollständig anzusehen. Ihre Videos haben mich nämlich außerordentlich überzeugt. Deine Videos erwecken den Eindruck, dass Du eine sehr sympathische Persönlichkeit bist. Die Darstellung ist von bemerkenswerter Komplexität, wobei didaktische Qualität und Klarheit der Erläuterungen herausragen. Für dieses exzellente Video möchte ich meine Anerkennung zum Ausdruck bringen. Insbesondere die Modellfamilie erweist sich dabei als besonders interessant. Bemerkenswert ist ferner, dass - obwohl das GPT-4 erst vor rund zwei Jahren eingeführt wurde - bereits zwei weitere Modellfamilien entwickelt und etabliert wurden. Diese Modellfamilien sind durch einen signifikanten Innovationsgrad sowie vielversprechende Funktionalitäten gekennzeichnet. An dieser Stelle sei Ihnen für die Bereitstellung des Videomaterials gedankt.
Cool, dass die neue Version den Rechenweg darstellt 😎👏🏻
3 місяці тому+22
Könntest du mal ein Projekt damit mal entwickeln, wäre interessant wie lange du gebraucht hast und wie lange du mit chat gpt o1 in Kombination mit deinem Skill gebraucht hättest?
Für den Algorithmus 🔥🔥 Danke für deine Videos. Ich habe inzwischen auch meinen Master und bin mitten im Berufsleben. Da kann man sich leider nicht mehr in der Tiefe mit allen Neuheiten in jedem Bereich auseinandersetzen. Da sind deine Videos immer Gold wert. Vielen Dank. Grüße aus Stuttgart ✌️
54:26 Die Form sah für mich wie ein Aufsteiger/Absteiger (formal: Erzeugungs- und Vernichtungsoperator) aus. Deswegen habe ich mal kurz googlen müssen, um das einzuordnen. Und ja, das ist schon schwere Kost xD Wenn jemand ohne Physik Studium damit umgehen kann, hat meinen Respekt.
ich war ziemlich enttäuscht. Sobald man für die uni paar sachen braucht, merkt man, dass chat gpt oft einfach random sachen als antwort gibt, welche einfach nicht stimmen. also bin froh, dass da jetzt mit der neuen version hoffentlich das niveau nochmals steigt
@@TheGismo94Eben, ich verstehe nicht, weshalb das so dermaßen in den Himmel gelobt wird, als müsse man gar nichts mehr selbst machen. Es liefert dir vielleicht eine brauchbare Gliederung oder Impulse, aber die Ausarbeitung ist meist so dermaßen unbrauchbar, dass man das so definitiv nicht stehen lassen kann 😂
Gutes Video. Aber kurze Anmerkung: das manchmal in der falschen Sprache geantwortet wird ist auch ein Problem bei 4o. Das hab ich immer mal wieder, dass das Teil einfach auf Englisch antwortet, obwohl ich was auf deutsch frage. Glaube sogar auch GPT 3 hatte schon das Problem.
Ein Freund von mir macht seinen Mathe Doktor und er hat mir Beweis Aufgaben auf Bachelor Niveau gegeben. Nicht öffentliche (Aufgaben die tendenziell nicht in den Trainingsdaten) Aufgaben waren deutlich schwieriger für o1 Preview. Aber auch hier nur eine kleine Stichprobe. Mega Video, danke dir! 🤗
mal ne blöde Frage zu den Karten vom Anfang: ist denn gegeben, dass immer auf einer seite eine schwarze Form (Kreis, Refchteck,etc.) ist, und auf der anderen eine Farbe? Weil wenn dies nicht so wäre, müsste dann nicht auch das Rechteck umgedreht werden, damit da nicht evtl. ein Kreis drunter ist, weil dann hätte eben dieser Kreis eben keine gelbe Rückseite, sondern eine Form als Rückseite.
Kannst du eine Einschätzung zu den Pager Explosionen machen? Ist das theoretisch mit der richtigen Software auch auf Smartphones übertragbar oder müssen die Pager an der hardware manipuliert worden sein? Würde mich brennend interessieren.
vorallem wer hat die dinger verkauft ?! wie kann man den Akku per remote überhitzen lassen...wtf. als ich die Nachricht gesehn hab dachte ich mir nur " ok jetzt gehts los"...handy direkt ausgemacht. Kein scheiß. Hab mich direkt an Watchdogs erinnert...richtig freaki shit
Ich habe für meine Zwecke noch keine sinnvolle Anwendung für die o1 Modelle gefunden. Hab mal ein bissi mit rumgespielt. Es hat sicherlich seine Daseinsberechtigung für entsprechend komplexe Tasks, aber ich bin mit gpt4o und Claude 3.5 völlig zufrieden und nutze die beiden täglich beruflich sowie privat.
So wie ich das mitbekommen habe, dient o1 (strawberry) nur dazu synthetische Daten zu generieren um GPT-5 (orion) zu trainieren...und GPT-5 ist wohl auch schon fertig trainiert, aber man kann es noch nicht so groß skalieren...kommt wohl im Frühjahr nächsten Jahres...mal abwarten...
Für das Königsproblem ist mir noch eine weitere Lösung für den König eingefallen mit welcher 66 Goldmünzen möglich sind. Der König nutzt das "Lohncasino". Er nimmt zu jedem Vorschlag 3 Bürger zur Seite. Einer davon verliert seinen Lohn und die anderen Beiden würfeln mit dem König um dessen Anteil, somit haben der König und die beiden Glücklichen je eine 1/3 Chance ihren Lohn zu erhöhen. Der Lohnverlierende stimmt gegen den Vorschlag, die beiden potentiellen Gewinner dafür, da sie nur gewinnen können und nichts zu verlieren haben. Somit kann der König den Vorschlag jedes mal durchbringen. Das Verfahren wird wiederholt bis alle Lohnanteile beim König sind. Das Königs-haus gewinnt immer ;)
"Was hast du gesagt, Gerda?" Jetzt muss Gerda eigentlich die gleiche Antwort geben und reflektiert vielleicht einen Teil ihrer vorherigen. ~Gerda-o1-mini Hoffentlich wird Herr Meanwhile entlassen, er erscheint mir sehr ineffizient.
Was mich bei der ganzen Begeisterung am meisten ankotzt, ist, dass sich niemand Gedanken darum macht, welche sozialen Folgen damit verknüpft sind. In Zukunft wird dank KI es keinem Menschen mehr möglich sein, durch eigene Arbeit zu Wohlstand aufzusteigen. Es wird nur noch einige sehr reiche und sehr, sehr viele arme Menschen geben. Manuelle Arbeit wird von Maschinen gemacht, intellektuelle Arbeit von KI. Weil es billiger ist, als den Menschen zu beschäftigen. Also ich wäre an deiner Stelle einfach mal nicht so begeistert; heute gibt es schon V-Tuber - wenn das so weitergeht, werden KIs auch UA-cam-Kanäle betreiben. Dann bleibt für dich auch nichts mehr zu tun.
Und mich kotzen eher Leute wie dich an, die erstmal jede neue Technologie negativ sehen. Als die Eisenbahn aufkam, hättest du bestimmt auch zu denjenigen gehört, die ohne irgendwelche Belege einfach behauptet haben der Mensch würde bei Geschwindigkeiten über 40km/h sterben… Genauso wie deine Behauptung einfach komplett belegfrei und unsinnig ist.
Diese Bedenken bzw. Kritik hört man oft - und sie sind natürlich berechtigt und richtig. Aber richtig ist auch, dass KI Realität ist und nicht aufzuhalten. Manche ignorieren einfach die Tatsachen, andere schimpfen, warnen oder suchen die Schwächen um es klein zu reden. Aus meiner Sicht ist die einzig angemessen Reaktion zu verstehen, was möglich ist und Ideen zu entwickeln, wie der Einsatz so verträglich wie möglich zu gestalten ist. Das bietet die Chance, dass nicht wie beschrieben nur einige unfassbar reich werden (das gibt es schon), sondern die Wertschöpfung zumindest teilweise auf viele zu verteilen. Es gibt Arbeit, die nur Menschen machen können, beispielsweise im Bereich der Dienstleistungen Sicher, es wird grosse Umwälzungen geben aber die gab es oft und ebenso oft das Schreckgespenst, alle würden ersetzt. Wer am Ball bleibt, wer die soziale Zukunft mitgestaltet, der verbessert die Chancen und die Möglichkeit, dass weniger Arbeit nicht zwangsläufig ins Elend führt. Optimismus pur? Nein, aber Pessimisten werden nichts ändern - ausser sich selbst aufzugeben. Deshalb ist dieser Kanal so gut und wichtig und jeder kann sich hier informieren. verstehen und so wirklich qualifiziert mitreden.
@@youquinoman Qualifikation ist das Stichpunkt. Weniger Arbeit führt zu mehr Elend, man sieht es nur nicht. Die Konzentration von Kapital auf wenige Reiche führt zu Mietenkrisen und immer unerschwinglicher werdenden Immobilien. Immer mehr Menschen wird immer weniger der wertschöpfenden Arbeit überlassen und ihre Erwerbsmöglichkeit so weggenommen. "Teilweise" hilft da genauso wenig wie den Menschen zu verschweigen, dass die "neuen Jobs dank KI" nicht von den selben Menschen ausgeführt werden, die vorher arbeitslos wurden. Der Konkurrenzkampf um Arbeitsplätze wird weltweit noch schärfer, da 25% aller Menschen ihren Arbeitsplatz durch KI verlieren werden - und zwar quer durch alle Berufe. Buchhalter sind genauso betroffen wie KFZ-Schlosser. Wenn man Menschen ihr Brot nimmt, willst du dir nicht ausmalen, wie die Gesellschaft dann aussehen wird.
@@youquinoman Läuft dieses Argument nicht auf Survival of the fittest mit einem Schuss sozialdemokratische Absicherung hinaus? Und spielt diese gemütliche Einteilung in Optimisten und Pessimisten da nicht einer Psychologisierung politisch auszuhandelnder Machtverhältnisse in die Karten? Ich wundere mich immer wieder, woher diese viele Leuten kommen, die mit den Zumutungen der "schöpferischen Zerstörung" so locker umgehen. Ich fürchte, es ist in den meisten Fällen kein Opportunismus, sondern eine Bewältigungsmechanismus, der aber die Realität verzerrt.
^^ du brauchst dich wirklich nicht für lange Videos entschuldigen. Manche Antworten dauern eben länger als andere. Die Kreis-Gelb Frage zeigt wieder schön, wie schlecht wir sprachlich mit Logik umgehen. Gerade bei Implikationen und dem Oder. Es wäre noch spannend zu sehen wie die Modelle auf Fragen antworten, die nicht eine richtige Antwort haben. Also entweder auf Fehlschlüsse aus sind, oder mehrere Lösungen bieten. Wobei bei den Antworten scheint es Problemen die n Antworten haben keine Probleme zu haben, auch bei vielen n's. Ich bin auch mal gespannt wie LLM's künftig im wissenschaftlichen Schreiben verwendet werden. Ja zum einen kann man damit Arbeit faken. Auf der anderen Seite können diese Modelle das Anfertigen von Text massiv beschleunigen, was schnell mal mehr Aufwand werden kann als die eigentliche fachliche Arbeit. Und naja Review Paper landen auf einem ganz anderen Level, da kein Mensch tatsächlich alle Paper in irgend einem Fachbereich lesen kann. LLM's können das, sogar für alle Bereiche.
Ich habe o1 gebeten, mal ein Turnierprogramm zu schreiben, welches die Paarungen der Gegner nach dem Schweizer-System herausgeben und die Ergebnisse speichern soll. Für alle Runden, die man vorgeben kann. Das Schweizer System ist easy: Punktgleiche gegeneinander. Nicht zweimal gegen denselben Gegner. Das kriegt o1 nicht hin, auch nicht GPT 4. Und Gemini - da brauchen wir erst gar nicht mit anfangen. Ich frage mich, wie o1 richtige Software-Projekte schaffen soll. Probier(t)s mal aus.
ganz schön viele Worte! Also mit GPT, 01 mini kann man jetzt schon richtig arbeiten. Nicht mehr dieses elendige Geschwafel. Es ist deutlich schneller. Die Antworten sind komprimierter, besser strukturiert und kürzer. Ich benutze es vor allem, um für bestimmte Software Projekte geeignete APIS zusammen zu suchen. Das spart unheimlich Zeit. es ist auch überraschend gut in der Bewertung von Patterns in verschiedenen Programmiersprachen und Frameworks. was bisher überhaupt nicht zur Sprache gekommen ist, du kannst mit dem Modell auf relativ hohen, abstrakten Niveau Softwarearchitektur diskutieren, weil der dir immer die Informationen liefert, die du brauchst, um im kontinuierlichen Gedankenfluss zu bleiben. Das ist wirklich eine neue Erfahrung.
Bei den Goldstücken Rätsel: Würden nicht die Leute auf die Barrikaden gehen, wenn sie erfahren, sie bekommen kein Goldstück mehr und die anderen 2 Goldstücke :)? Da wäre doch sozial gleich eine Revolution🎉
Nunja, in der Realität würden die Leute auf die Barrikaden gehen, ja. Nur im mathematischen Gedankenkonstrukt ist das nicht vorgesehen und ist damit nicht möglich 🙆
Chat GPT ist zwar etwas anderes als LLAMA aber trotzdem sind Agents krass, sowie "long term memory" und "personalizing" a Model. Ich probiere "personalisation" gerade mit Ollama in der Web UI aus, dort ist alles noch experimentell aber es wird kommen und das wird richtig geil. Bild Generation kommt auch in ollama web ui. Meine Anwendung liegt halt wirklich nicht in der Coding Maths Produktivität oder sonst was, sondern ein persönlicher, privater Assistent der meine Daten im Rechner abrufen kann, Dinge kontrolliert, das System checken soll, im Netz sucht, Dinge downloaded, mich erinnert, und Daten abrucht die ich brauche, sich selbst aktualisiert etc.pp. noch nicht ganz Jarvis aber in die Richtung soll es gehen.
Eine KI kann meiner Meinung nach Sanduhren, Wasseruhren und Sonnenuhren bis zum geht nicht mehr optimieren. Eine mechanische Uhr käme nicht heraus, da die KI nur momentanes Wissen verarbeitet. Aber ja, selbst wenn die KI auf alles Wissen zugreifen kann, im Guten wie im Bösen, ist das schon erschreckend. Falls man diese Aussage mit einer KI überprüfen will, muss man der KI mitteilen, dass sich die Analyse auf die Zeit vor Erfindung der mechanischen Uhr bezieht.
In meiner Firma soll es offiziell nicht genutzt werden aber die meisten Entwickler nutzen es inzwischen irgendwie. Ich nutze es selber indem ich zum Beispiel Code Fragmente übermittel und umschreibe oder als Hilfestellung, wenn man dabei ist einen Lösungsansatz zu finden. Komplette Klassen oder sowas lasse ich aber nicht generieren.
Also ich fasse mal zusammen, O1 ist sehr gut in Mathe, ich bin in Mathe dagegen wirklich sehr dumm, schon immer gewesen. Kann ich leider nicht ändern 😅 Tolles Video, bin gespannt wo wir in zehn Jahren sind bei den Modellen. Freue mich auf die Innovatoren 😍
In 10 Jahren… KI Modelle werden alles im Leben durchdringen. Ob es dann noch UA-camr gibt, die Wissen so vermitteln, glaube ich ehrlich gesagt nicht. Die meisten Menschen können sich noch nicht mal vorstellen, was gerade passiert, geschweige in 5 Jahren. Mit diesem System 2 Denken, dem langsamen Denken, das eingebettet in KI übertrifft das Gedächtnis und die Schnelligkeit des Denkens jedes Menschen um das Zigfache.
Ist es möglich, dass manche (gute) KI's bei der Königsfrage die beiden Aussagen "die Bürger sind auf ihren Vorteil bedacht" und "sich enthält bei gleichbleibendem Lohn" bei Lohn = 0 als widersprüchlich bewerten?
Hmm, irgendwie bin ich mit der Loesung bei dem Kartenraetsel nicht so ganz einverstanden. Und zwar: Wenn eine Karte auf einer Seite einen Kreis hat, dann hat sie auf der anderen Seite die Farbe Gelb. So wie diese Bedingung formuliert ist, ist es unerheblich auf welcher Seite die Karte Gelb ist oder einen Kreis hat. Folglich muss auch die gelbe Karte ueberprueft werden oder die Regel muss umformuliert werden in: Wenn eine Karte auf >der sichbaren< Seite einen Kreis hat, dann hat sie auf der anderen Seite die Farbe Gelb. Kucks du: 9:46 Ps.: Mein Gedanke dazu wurde mir von GPT4o gerade bestaetigt und er/sie/es hat sich fuer seine falsche Antwort entschuldigt :P
Das wird schon durch den ersten Satz in der Prämisse negiert. "Du weißt bereits, dass jede Karte auf der einen Seite eine Form und auf der anderen Seite eine Farbe hat".
Erstmal vielen Dank für dieses sehr interessante und ausführliche Video und man muss sich fragen was in der Zukunft Nobelpreis überhaupt noch wert ist😄 auf der anderen Seite macht es aber Hoffnung dass wir in Zukunft Probleme lösen können die die Menschheit sehr entscheidend beeinflussen können und das zum Guten und die KI uns dahin noch sehr viel hilfeleisten wird vielleicht und selbst noch am Leben zu erhalten.. und die technischen Entwicklungen die gerade jetzt sehr dringend gebraucht werden noch schneller in der Realität umgesetzt werden können. Nebenbei könnte ich mir gut vorstellen dass es irgendwann eine Politik KI gibt die jedenfalls unbestechbar ist und auch keine sinnlosen Ausgaben macht.. nach den ganzen Erfahrungen die die Menschheit in den letzten 50 Jahren mit Politik gemacht hat denke ich dass eine KI keine weitere schlechte Alternative werden könnte sondern nur eine mögliche bessere Alternative die man in Zukunft im Auge fassen sollte um die alten Fehler der Vergangenheit nicht zu wiederholen.... oder besser gesagt von Menschen wiederholen zu lassen😄... als letzte Instanz könnte man jede Entscheidung noch einmal von einer KI unabhängig überprüfen lassen. vielen Dank für die immer interessanten Videos und viele Grüße von Andreas aus dem Elsass
Hallo Morpheus, teste mal die Aufgaben des Bundeswettbewerb Mathematik 2. Runde mit o1 preview. Die sind nochmal schwerer als diese Rätsel. (Aufgaben gibt es auf der Webseite vom BWM) Konnte es nur mit o1 mini probieren und da kamen bei mir bis jetzt bei 2/6 Aufgaben das richtige Ergebnis heraus, jedoch bei den richtigen Antworten ohne schlüssigen Beweis. Scheint so als stößt das Modell da an seine Grenzen, auch wenn man diese Leistung vllt (noch) nicht erwarten kann.
Habe ich einen Denkfehler? Die Karte mit dem Quadrat müsste man doch auch umdrehen? Ich habe zumindest nicht die Bedingung gehört, dass immer auf einer Seite eine Form und auf der anderen eine Farbe ist. So könnte doch auch auf der Karte mit dem Quadrat auf der Rückseite ein Kreis sein??
Ich stelle die Ehre der Mathe Doktoranden wieder her, denn die 63 Goldstücke hab ich noch im Kopf gelöst. Aber über kurz oder lang sollten diese Modelle sich dann auch mal ein neues Gesellschaftsmodel überlegen. Das alte wird ja nicht mehr lange gebraucht.
Wenn wir ChtatGPT O1 die Antwort auf die "Frage nach dem Sinn des Leben, des Universums und des ganzen Rests" stellen würden und ihm 7,5 Millionen Jahre Zeit zum nachdenken gäben dann müssten wir 180.000.000.000$ an Lizenzkosten berappen.
Weit über der Zeit? Ich hoffe das Video war erst der Anfang! Dieses System wird teilweise nicht verstanden, ich hoffe da nimmt man sich mehr Zeit um die Details und Potentiale herauszufinden! Machst du eine Videoreihe bei der Vollversion von o1? 🔥
"Experten in ihrem eigenen Fachgebiet geschlagen" ist aber auch sehr populistisch formuliert. Die Chemie-Fragen (mein "Fachgebiet") sind z.B. sehr breit. Niemand würde erwarten, dass ein Doktorand (und auch kein Professor) in der anorganischen Chemie derartige (teilweise) detailfragen zu organischer Katalyse beantworten kann. Wenn ich der O1 Fragen wirklich zu meinem Fachgebiet (also meiner Spezialisierung) stelle, dann ist es bisher meist entweder gescheitert oder hat "standard-lösungen" vorgeschlagen, die natürlich alle schon durchprobiert wurden und gescheitert sind. Meist waren die Vorschläge zum Vorgehen ungefähr auf dem Niveau, das ich von Bachelor-Studenten erwartet hätte. Insgesamt ist der komplette GPQA (Diamond) Benchmark stark biased, was man auch an der Verteilung der Themen sieht. Zusätzlich sind es eben Multiple-Choice fragen. Wenn man in das Paper zu dem Benchmark schaut, wird auch anerkannt, dass sowohl der Datensatz, als auch die "Experts" wahrscheinlich nicht repräsentativ sind.
9:00 - So, wie du das Problem präsentiert hast, müsste man drei Karten umdrehen - das Quadrat könnte ja auch einen Kreis auf der Rückseite haben. Dass das von vorneherein ausgeschlossen ist, steht nur im Text. Fail deinerseits.
1 Stunde Morpheus zu Gpt o1 - das übersteigt meine kühnsten Träume
Krasse Themen erfordern krasse Maßnahmen 😂
Und mir übersteigts mein Wissen 😢
2,5 -Speed geht noch gut
@@TheMorpheusVlogs Kann es sein das ChatGPT den demokratischen Prompt mit dem König und den Goldstücken mit Absicht nicht lösen kann weil "es" sich für irgendwas hält?
🤤
56:50
Mein erstes Video von dir und dass du direkt 1h über das Thema gerissen hast und zugleich spannend warst, hat mich überzeugt dir ein Abo zu geben. Mehr, mehr mehr davon!!!
liebe dieses lange Format ❤ vor allem da ich nicht aus den passenden Fachgebieten komme hilft mir das video hier sehr zu verstehen,wie die benchmark werte überhaupt zustande kommen und wofür ich es nutzen kann und wofür eben nicht. das einzige video dass es verdient in die trends zu gehen, zu dem thema
Schade, dass das Video nicht so gut performed gerade. Es ist sehr gut aufbereitet und maximal interessant! Danke
Es ist doch gerade einmal 2 Stunden alt. Ich hab bis gerade gearbeitet und gucke es mir jetzt erst an. Ich finde nach 2 Stunden kann man da noch kein Urteil fällen ❤
@@PeddaVomMond habe ich auch nicht :) ging mir um die performance zu dem moment als ich es gesehen hatte. Da war die verhältnismäßig nicht so stark. Was ich schade finde, da das video einfach sehr gut ist.
@@jute_ Bro da war das Video aber Grad erst raus was redest du da hää
@@tobiastomitzek3086 Das ist ein Peformer...
Da es anscheinend mit meinem Kommentar noch Unklarheiten gibt was ich eigentlich meinte: YT sind die ersten Stunden sehr wichtig. Je mehr Traffic, dort passiert, desto mehr wird es anderen /neuen Menschen ausgespielt. Und dafür,dass das Video schon zwei Stunden online war, hatte es eben (mMn) noch sehr wenig Traffic (Views/Likes/Kommentare). Und das meinte ich mit simpler Performance in dem Kontext.
Ich wollte ja auch ausdrücken,dass ich hoffe,dass das noch erheblich krass steigt,da es eben ein super Video ist.
Das war wirklich sehr spannend. Ich konnte gar nicht aufhören dir zu zuhören.
Sehr gut erklärt. Auch für jemanden der gar nicht vom Fach ist. Danke.
Danke dir für deine Aufklärungsarbeit - sehr spannend!
Danke fürs realistisch und ausführlich Aufbereiten! Kommentar für den Algo. :)
Ich mag Rätsel und ich mag KI und ich mag deine Videos, leider habe ich das IT Video erst gesehen, aber war trotzdem sehr angenehm und schön, danke für deine Mühe, auch für den Newsletter, den ich davor gelesen hatte.
„Ein quasi verschlüsselter Text.. oder.. koreanisch war das“ fand ich gut. xD
Fand das Video auch super interessant! Die Länge genau richtig fürs Abendessen. :)
habe den Kommentar gerade in dem Moment gelesen, als es im Video gesagt wurde xD
Ich kann mir vorstellen, dass für diese Verschlüsselung die einzelnen Striche/Teile, aus denen ein koreanisches Zeichen besteht, anders angeordnet wurden. So kann man es eigentlich nicht mehr lesen. Man muss dann erkennen, auf welche Art die Zeichen neu zusammengewürfelt wurden
Teilweise keine Ahnung gehabt wovon du da redest (was an mir liegt) aber es war sehr interessant. Finde das Format so auch angenehm zu schauen
wie immer vielen dank für deine unermüdliche arbeit!
Danke für das informative Video. Es ist länger geworden, aber die Informationsdichte war durchgehend hoch. Die Rätsel haben mich gepackt und ich hatte einen entspannten Abend. Zudem bin ich glücklich, da ich die Rätseln lösen konnte. Das König-Rätsel hat eine für mich bekannte Lösungsstruktur gehabt, weswegen es ging.
Danke für das Video 🙏 ich kommentier jetzt immer, weil du es verdient hast.
Die einzig relevante Bewertung. Alle anderen haben bisher nur zusammenhangslose Superlative gedroppt.
Zu erst hab ich gedacht, oh Gott, eine Stunde, aber Wahnsinn, wie du diese Stunde ausgefüllt hast, danke und viel Erfolg weiterhin!
Du musst dich nicht für die Länge entschuldigen das ist genau das was ich gesucht habe 😊
Hast du auch mal Variationen sehr bekannter Logikprobleme ausprobiert? Zum Beispiel das Flussüberquerungsrätsel mit Wolf, Ziege und Kohlkopf. Dabei aber eine Regel ändern oder weglassen, so dass sich die optimale Zugfolge ändert. Viele Modelle greifen trotzdem auf die in den Trainingsdaten vorhandene Musterlösung zurück, auch wenn die jetzt falsch ist.
tolles Video, wie all' deine anderen. Die Videos von dir sind eins der Highlights auf YT. Danke für deine tolle Arbeit und die aufschlussreichen Einblicke.
letztlich wirkt o1 eigentlich nur so, als ob mehrere 4o antworten geben und diese wieder strukturiert analysiert werden um dann nach ein paar mal zu reflektieren eine gut sortierte und nachvollziehbare Antwort zu geben, die natürlich besser ist als vorher. Das erklärt auch, warum es beim reinen Texten nicht besser geworden ist, weil da reflektiertes Denken nicht wirklich hilft. So ähnlich wie 5 Schach-Engines zu kombinieren, was in den Anfängen der Schachcomputer einige ELO Punkte gebracht hat.
Danke für deine Mühe!
Das war mit einst der spannenden Videos und die Zeit ist einfach mal so verflogen. Fands mega gut erklärt!!!! Tippitoppi!!
Großes Danke für diese umfängliche Erläuterung zu dem ganzen Thema insbesondere zu GPT-o1. Mich hat es jedoch stark gewundert, dass die meisten Modelle Schwierigkeiten mit dem "Ausdauerlauf" hatten. Recht einfach hatte ich die Lösung zusammen und bin kein Vorzeigelogiker. Bei der König-Aufgabe, kann ich mir vorstellen, dass entweder "Kreativität" gefehlt hat oder das Prinzip mit den VorschlägEN nicht erfasst wurde. Und deine Vermutung am Ende des Videos kann ich bestätigen, OpenAI baut jetzt stark das Team zur Erforschung von (Multi-)Agenten aus.
Sehr tolles Video. Ich habe durch Zufall beim O-Modell herausgefunden, dass sich dieses Modell mit dieser Aufgabe sehr schwergetan hat. Auch nach 2 Nachbesserungen kam es nicht auf das korrekte Ergebnis: Die Aufgabe: Verwenden Sie jede der neun Ziffern einmal, und nur einmal, und bilden Sie eine Menge von drei Primzahlen, die die kleinstmögliche Summe haben. Zum Beispiel ergibt die Menge 941, 827 und 653 die Summe 2.421, aber das ist bei weitem nicht minimal. Korrekt ist: 149 + 263 + 587=999, Erste Lösung: 269, 359 und 1487, was insgesamt 2115 ergibt.; Zweite Lösung: 149, 263 und 857, was insgesamt 1269 ergibt.; Dritte Lösung: 149, 283 und 761, was die Summe 1193 ergibt.
Danke , es hat Spaß gemacht dir zu zuhören!!! Spannend herüber gebracht.
Was passiert eigentlich, wenn ChatGPT ausfällt? Braucht man dann einen Informatiker oder einen Psychologen?🤔
Ja
Lol ich wollte gerade exakt dasselbe schreiben 😂
@@TheMorpheusVlogs zwei Dumme, ein Gedanke 😎❤️
Bin fernab von Informatik, trotzdem bis zum Schluss geblieben - vielen Dank. Würde es toll finden, auch Geistes- und Sozialwissenschaften mit in die Betrachtung einzubeziehen (ja, Mathe/Logik deckt einen Teil davon ab, aber eben nur einen Teil). Wahrscheinlich geht das noch nicht, weil einfach sämtliches archiviertes Wissen nötig wäre, um etwa ein Phänomen kulturhistorisch herzuleiten oder einen geopolitischen Konflikt zu analysieren... wofür Statistik vielleicht eh nicht das geeignete Werkzeug ist, keine Ahnung, Würde mich interessieren.
Dann fragste halt Dr. Google, sowie vorher auch.
richtig interessantes & extrem gut strukturiertes Video!! Danke!
Alaaaaaaaan ❤😍 nices Video 🎉
Die Videopräsentation besticht durch ihre exzellente Qualität sowie eine überzeugende Länge. Die Zusammenfassung vieler komplexer Inhalte in einem übersichtlichen Format erfordert ein hohes Maß an Expertise, besonders wenn die Erläuterungen eine hohe Informationsdichte aufweisen. Hinsichtlich der Darstellung ist festzuhalten, dass diese sehr gut gelungen ist. Diesbezüglich überzeugt insbesondere die Wortwahl, da sie die Inhalte in verständlicher Form vermittelt. Des Weiteren wäre ich gewillt, mir ein bis zu zweistündiges Video vollständig anzusehen. Ihre Videos haben mich nämlich außerordentlich überzeugt. Deine Videos erwecken den Eindruck, dass Du eine sehr sympathische Persönlichkeit bist. Die Darstellung ist von bemerkenswerter Komplexität, wobei didaktische Qualität und Klarheit der Erläuterungen herausragen. Für dieses exzellente Video möchte ich meine Anerkennung zum Ausdruck bringen. Insbesondere die Modellfamilie erweist sich dabei als besonders interessant. Bemerkenswert ist ferner, dass - obwohl das GPT-4 erst vor rund zwei Jahren eingeführt wurde - bereits zwei weitere Modellfamilien entwickelt und etabliert wurden. Diese Modellfamilien sind durch einen signifikanten Innovationsgrad sowie vielversprechende Funktionalitäten gekennzeichnet. An dieser Stelle sei Ihnen für die Bereitstellung des Videomaterials gedankt.
TL;DR Ist dieser Kommentar mit KI generiert?
Cool, dass die neue Version den Rechenweg darstellt 😎👏🏻
Könntest du mal ein Projekt damit mal entwickeln, wäre interessant wie lange du gebraucht hast und wie lange du mit chat gpt o1 in Kombination mit deinem Skill gebraucht hättest?
Advent of Code mit o1 😊
Für den Algorithmus 🔥🔥
Danke für deine Videos. Ich habe inzwischen auch meinen Master und bin mitten im Berufsleben. Da kann man sich leider nicht mehr in der Tiefe mit allen Neuheiten in jedem Bereich auseinandersetzen. Da sind deine Videos immer Gold wert.
Vielen Dank. Grüße aus Stuttgart ✌️
54:26 Die Form sah für mich wie ein Aufsteiger/Absteiger (formal: Erzeugungs- und Vernichtungsoperator) aus. Deswegen habe ich mal kurz googlen müssen, um das einzuordnen. Und ja, das ist schon schwere Kost xD
Wenn jemand ohne Physik Studium damit umgehen kann, hat meinen Respekt.
Sehr geiles video. Liebe diese langen Videos. ❤ diese 10-20 min styled Videos nerven nur noch. Super Video❤
GPT-4o hat meine Kompetenzen bereits deutlich übertroffen..... o1 wird einfach overkill
Dann könnte man dich direkt entlassen D:
ich war ziemlich enttäuscht. Sobald man für die uni paar sachen braucht, merkt man, dass chat gpt oft einfach random sachen als antwort gibt, welche einfach nicht stimmen. also bin froh, dass da jetzt mit der neuen version hoffentlich das niveau nochmals steigt
Es unterstützt(unbezahlbar) mich bei meinem Master.
@@TheGismo94Eben, ich verstehe nicht, weshalb das so dermaßen in den Himmel gelobt wird, als müsse man gar nichts mehr selbst machen. Es liefert dir vielleicht eine brauchbare Gliederung oder Impulse, aber die Ausarbeitung ist meist so dermaßen unbrauchbar, dass man das so definitiv nicht stehen lassen kann 😂
@@thediesel1241naja es löst jedes meiner übungsblätter in der uni (physik ba) ohne probleme
oh...mit dem könig rätsel auch gleich was über politik gelernt
Danke für dieses ausführliche Video zu dem Thema!
Sehr geiles Video, lieber 1 Stunde anstadt 5 Parts. Danke dir für die Zusammenfassung. Wirklich schade das, dass Video nicht gut performed ):
Bin ehrlich gesagt mit der Performance sehr zufrieden 😊 vor allem, dass so viel Gutes Feedback kommt 🥰
Danke für die Zusammenfassung 👍 echt krass was O1 mittlerweile kann
immer wieder inspirierend deine arbeit zu beobachten.ich lerne von dir und werde mich in zukunft bei dir revangieren ;) abo hast du dir verdient
krass ausführlich, danke!
Vielen Dank für das tolle Video
Gutes Video.
Aber kurze Anmerkung: das manchmal in der falschen Sprache geantwortet wird ist auch ein Problem bei 4o. Das hab ich immer mal wieder, dass das Teil einfach auf Englisch antwortet, obwohl ich was auf deutsch frage.
Glaube sogar auch GPT 3 hatte schon das Problem.
Einfach für den Algorithmus danke für die Arbeit
niemand pennt hier wenn du was enthusiastisch Vorträgst
Ein Freund von mir macht seinen Mathe Doktor und er hat mir Beweis Aufgaben auf Bachelor Niveau gegeben. Nicht öffentliche (Aufgaben die tendenziell nicht in den Trainingsdaten) Aufgaben waren deutlich schwieriger für o1 Preview. Aber auch hier nur eine kleine Stichprobe. Mega Video, danke dir! 🤗
mal ne blöde Frage zu den Karten vom Anfang: ist denn gegeben, dass immer auf einer seite eine schwarze Form (Kreis, Refchteck,etc.) ist, und auf der anderen eine Farbe?
Weil wenn dies nicht so wäre, müsste dann nicht auch das Rechteck umgedreht werden, damit da nicht evtl. ein Kreis drunter ist, weil dann hätte eben dieser Kreis eben keine gelbe Rückseite, sondern eine Form als Rückseite.
Kannst du eine Einschätzung zu den Pager Explosionen machen? Ist das theoretisch mit der richtigen Software auch auf Smartphones übertragbar oder müssen die Pager an der hardware manipuliert worden sein? Würde mich brennend interessieren.
vorallem wer hat die dinger verkauft ?! wie kann man den Akku per remote überhitzen lassen...wtf. als ich die Nachricht gesehn hab dachte ich mir nur " ok jetzt gehts los"...handy direkt ausgemacht. Kein scheiß. Hab mich direkt an Watchdogs erinnert...richtig freaki shit
@@blackswan6386 laut neuen Informationen soll Sprengstoff eingebaut worden sein
@@Wesly420Snips
Wo kommt diese Information her?
@@gkiosseopoulos von den Amis anscheinend, Tagesschau
Ich habe für meine Zwecke noch keine sinnvolle Anwendung für die o1 Modelle gefunden. Hab mal ein bissi mit rumgespielt. Es hat sicherlich seine Daseinsberechtigung für entsprechend komplexe Tasks, aber ich bin mit gpt4o und Claude 3.5 völlig zufrieden und nutze die beiden täglich beruflich sowie privat.
So wie ich das mitbekommen habe, dient o1 (strawberry) nur dazu synthetische Daten zu generieren um GPT-5 (orion) zu trainieren...und GPT-5 ist wohl auch schon fertig trainiert, aber man kann es noch nicht so groß skalieren...kommt wohl im Frühjahr nächsten Jahres...mal abwarten...
Vielen Danke für die Erklärung. Mega spannend
Wem soll ich jetzt nur sagen, dass hier kein Ort für ihre Hausaufgaben ist, wenn die Leute nicht mehr auf StackOverflow fragen müssen?
Für das Königsproblem ist mir noch eine weitere Lösung für den König eingefallen mit welcher 66 Goldmünzen möglich sind.
Der König nutzt das "Lohncasino". Er nimmt zu jedem Vorschlag 3 Bürger zur Seite. Einer davon verliert seinen Lohn und die anderen Beiden würfeln mit dem König um dessen Anteil, somit haben der König und die beiden Glücklichen je eine 1/3 Chance ihren Lohn zu erhöhen.
Der Lohnverlierende stimmt gegen den Vorschlag, die beiden potentiellen Gewinner dafür, da sie nur gewinnen können und nichts zu verlieren haben. Somit kann der König den Vorschlag jedes mal durchbringen.
Das Verfahren wird wiederholt bis alle Lohnanteile beim König sind. Das Königs-haus gewinnt immer ;)
Dieser Fortschritt haut mich weg! - Wer da einschläft, der weiss nicht was es geschlagen hat. Ein hochinteressante Präsentation, vielen Dank!
Sehr gutes video! Danke! 🙏
Danke für deine Arbeit
Sehr schön verständliche Erklärung :)
Meanwhile in germany: "Geeeerda?? Haben wir noch Druckerpapier? Wir müssen unsere Anfrage fürs Fax erst einmal ausdrucken und es dann sauber Ablegen"
"Was hast du gesagt, Gerda?"
Jetzt muss Gerda eigentlich die gleiche Antwort geben und reflektiert vielleicht einen Teil ihrer vorherigen. ~Gerda-o1-mini
Hoffentlich wird Herr Meanwhile entlassen, er erscheint mir sehr ineffizient.
@@AuftragschilIer Stell dir mal vor, es wäre Büro und keiner geht hin 🤭
Habs durch geguck..war voll into it! Die Wiedergabezeit schmeckt bestimmt
Was mich bei der ganzen Begeisterung am meisten ankotzt, ist, dass sich niemand Gedanken darum macht, welche sozialen Folgen damit verknüpft sind. In Zukunft wird dank KI es keinem Menschen mehr möglich sein, durch eigene Arbeit zu Wohlstand aufzusteigen. Es wird nur noch einige sehr reiche und sehr, sehr viele arme Menschen geben. Manuelle Arbeit wird von Maschinen gemacht, intellektuelle Arbeit von KI. Weil es billiger ist, als den Menschen zu beschäftigen. Also ich wäre an deiner Stelle einfach mal nicht so begeistert; heute gibt es schon V-Tuber - wenn das so weitergeht, werden KIs auch UA-cam-Kanäle betreiben. Dann bleibt für dich auch nichts mehr zu tun.
Und mich kotzen eher Leute wie dich an, die erstmal jede neue Technologie negativ sehen. Als die Eisenbahn aufkam, hättest du bestimmt auch zu denjenigen gehört, die ohne irgendwelche Belege einfach behauptet haben der Mensch würde bei Geschwindigkeiten über 40km/h sterben… Genauso wie deine Behauptung einfach komplett belegfrei und unsinnig ist.
Diese Bedenken bzw. Kritik hört man oft - und sie sind natürlich berechtigt und richtig. Aber richtig ist auch, dass KI Realität ist und nicht aufzuhalten. Manche ignorieren einfach die Tatsachen, andere schimpfen, warnen oder suchen die Schwächen um es klein zu reden. Aus meiner Sicht ist die einzig angemessen Reaktion zu verstehen, was möglich ist und Ideen zu entwickeln, wie der Einsatz so verträglich wie möglich zu gestalten ist. Das bietet die Chance, dass nicht wie beschrieben nur einige unfassbar reich werden (das gibt es schon), sondern die Wertschöpfung zumindest teilweise auf viele zu verteilen. Es gibt Arbeit, die nur Menschen machen können, beispielsweise im Bereich der Dienstleistungen
Sicher, es wird grosse Umwälzungen geben aber die gab es oft und ebenso oft das Schreckgespenst, alle würden ersetzt. Wer am Ball bleibt, wer die soziale Zukunft mitgestaltet, der verbessert die Chancen und die Möglichkeit, dass weniger Arbeit nicht zwangsläufig ins Elend führt. Optimismus pur? Nein, aber Pessimisten werden nichts ändern - ausser sich selbst aufzugeben. Deshalb ist dieser Kanal so gut und wichtig und jeder kann sich hier informieren. verstehen und so wirklich qualifiziert mitreden.
@@youquinoman Qualifikation ist das Stichpunkt. Weniger Arbeit führt zu mehr Elend, man sieht es nur nicht. Die Konzentration von Kapital auf wenige Reiche führt zu Mietenkrisen und immer unerschwinglicher werdenden Immobilien. Immer mehr Menschen wird immer weniger der wertschöpfenden Arbeit überlassen und ihre Erwerbsmöglichkeit so weggenommen. "Teilweise" hilft da genauso wenig wie den Menschen zu verschweigen, dass die "neuen Jobs dank KI" nicht von den selben Menschen ausgeführt werden, die vorher arbeitslos wurden. Der Konkurrenzkampf um Arbeitsplätze wird weltweit noch schärfer, da 25% aller Menschen ihren Arbeitsplatz durch KI verlieren werden - und zwar quer durch alle Berufe. Buchhalter sind genauso betroffen wie KFZ-Schlosser. Wenn man Menschen ihr Brot nimmt, willst du dir nicht ausmalen, wie die Gesellschaft dann aussehen wird.
@@youquinoman Läuft dieses Argument nicht auf Survival of the fittest mit einem Schuss sozialdemokratische Absicherung hinaus? Und spielt diese gemütliche Einteilung in Optimisten und Pessimisten da nicht einer Psychologisierung politisch auszuhandelnder Machtverhältnisse in die Karten? Ich wundere mich immer wieder, woher diese viele Leuten kommen, die mit den Zumutungen der "schöpferischen Zerstörung" so locker umgehen. Ich fürchte, es ist in den meisten Fällen kein Opportunismus, sondern eine Bewältigungsmechanismus, der aber die Realität verzerrt.
^^ du brauchst dich wirklich nicht für lange Videos entschuldigen. Manche Antworten dauern eben länger als andere.
Die Kreis-Gelb Frage zeigt wieder schön, wie schlecht wir sprachlich mit Logik umgehen. Gerade bei Implikationen und dem Oder. Es wäre noch spannend zu sehen wie die Modelle auf Fragen antworten, die nicht eine richtige Antwort haben. Also entweder auf Fehlschlüsse aus sind, oder mehrere Lösungen bieten. Wobei bei den Antworten scheint es Problemen die n Antworten haben keine Probleme zu haben, auch bei vielen n's.
Ich bin auch mal gespannt wie LLM's künftig im wissenschaftlichen Schreiben verwendet werden. Ja zum einen kann man damit Arbeit faken. Auf der anderen Seite können diese Modelle das Anfertigen von Text massiv beschleunigen, was schnell mal mehr Aufwand werden kann als die eigentliche fachliche Arbeit. Und naja Review Paper landen auf einem ganz anderen Level, da kein Mensch tatsächlich alle Paper in irgend einem Fachbereich lesen kann. LLM's können das, sogar für alle Bereiche.
Also 4o kriegt das mit den r in "strawberry" auch hin - manchmal :)
Ich habe o1 gebeten, mal ein Turnierprogramm zu schreiben, welches die Paarungen der Gegner nach dem Schweizer-System herausgeben und die Ergebnisse speichern soll. Für alle Runden, die man vorgeben kann. Das Schweizer System ist easy: Punktgleiche gegeneinander. Nicht zweimal gegen denselben Gegner. Das kriegt o1 nicht hin, auch nicht GPT 4. Und Gemini - da brauchen wir erst gar nicht mit anfangen. Ich frage mich, wie o1 richtige Software-Projekte schaffen soll. Probier(t)s mal aus.
Viel Spass in Korea. Ein sehr schönes Land!
Wow! danke für das Video ❤
Doktor ist das Beste. So soll es gestehen. Aber Amateure machen das, was auch immer sie machen, aus Liebe, so wie das Wort es schon beschreibt.
großartige Darstellung.
Leider mein Kontingent schon aufgebraucht, es macht so Spaß. Ich wünschte ich hätte keine Limits, aber gut Rechenleistung kostet halt.
Ich fand die Königfrage eindeutig formuliert. Kam auch auf 63. Als Antwort auf 47:00
ganz schön viele Worte! Also mit GPT, 01 mini kann man jetzt schon richtig arbeiten. Nicht mehr dieses elendige Geschwafel. Es ist deutlich schneller. Die Antworten sind komprimierter, besser strukturiert und kürzer. Ich benutze es vor allem, um für bestimmte Software Projekte geeignete APIS zusammen zu suchen. Das spart unheimlich Zeit. es ist auch überraschend gut in der Bewertung von Patterns in verschiedenen Programmiersprachen und Frameworks. was bisher überhaupt nicht zur Sprache gekommen ist, du kannst mit dem Modell auf relativ hohen, abstrakten Niveau Softwarearchitektur diskutieren, weil der dir immer die Informationen liefert, die du brauchst, um im kontinuierlichen Gedankenfluss zu bleiben. Das ist wirklich eine neue Erfahrung.
Bei den Goldstücken Rätsel:
Würden nicht die Leute auf die Barrikaden gehen, wenn sie erfahren, sie bekommen kein Goldstück mehr und die anderen 2 Goldstücke :)?
Da wäre doch sozial gleich eine Revolution🎉
Wir werden es bald herausfinden When die beinahe AGI deinen und meinen Job macht.
Nunja, in der Realität würden die Leute auf die Barrikaden gehen, ja. Nur im mathematischen Gedankenkonstrukt ist das nicht vorgesehen und ist damit nicht möglich 🙆
Gehe ich richtig in der Annahme das o1 preview besser ist als o1 mini?
ich habe dir einfach das abo gegeben.. netter typ
Chat GPT ist zwar etwas anderes als LLAMA aber trotzdem sind Agents krass, sowie "long term memory" und "personalizing" a Model. Ich probiere "personalisation" gerade mit Ollama in der Web UI aus, dort ist alles noch experimentell aber es wird kommen und das wird richtig geil. Bild Generation kommt auch in ollama web ui. Meine Anwendung liegt halt wirklich nicht in der Coding Maths Produktivität oder sonst was, sondern ein persönlicher, privater Assistent der meine Daten im Rechner abrufen kann, Dinge kontrolliert, das System checken soll, im Netz sucht, Dinge downloaded, mich erinnert, und Daten abrucht die ich brauche, sich selbst aktualisiert etc.pp. noch nicht ganz Jarvis aber in die Richtung soll es gehen.
4:57 Nicht in Mathe nach dem was ich getestet habe😂
Strawberry hat es manchmal richtig aber manchmal auch falsch Buchstabiert 😆
Der GPT store soll der halbe Weg zu Agents sein, bin ich mal gespannt wie sich das nächstes Jahr entwickelt 🔥💪🏻
Starkes Video 💪
Eine KI kann meiner Meinung nach Sanduhren, Wasseruhren und Sonnenuhren bis zum geht nicht mehr optimieren. Eine mechanische Uhr käme nicht heraus, da die KI nur momentanes Wissen verarbeitet. Aber ja, selbst wenn die KI auf
alles Wissen zugreifen kann, im Guten wie im Bösen, ist das schon erschreckend. Falls man diese Aussage mit einer KI überprüfen will, muss man der KI mitteilen, dass sich die Analyse auf die Zeit vor Erfindung der mechanischen Uhr bezieht.
Danke! wie immer
In meiner Firma soll es offiziell nicht genutzt werden aber die meisten Entwickler nutzen es inzwischen irgendwie.
Ich nutze es selber indem ich zum Beispiel Code Fragmente übermittel und umschreibe oder als Hilfestellung, wenn man dabei ist einen Lösungsansatz zu finden.
Komplette Klassen oder sowas lasse ich aber nicht generieren.
Also ich fasse mal zusammen, O1 ist sehr gut in Mathe, ich bin in Mathe dagegen wirklich sehr dumm, schon immer gewesen. Kann ich leider nicht ändern 😅 Tolles Video, bin gespannt wo wir in zehn Jahren sind bei den Modellen. Freue mich auf die Innovatoren 😍
In 10 Jahren… KI Modelle werden alles im Leben durchdringen. Ob es dann noch UA-camr gibt, die Wissen so vermitteln, glaube ich ehrlich gesagt nicht. Die meisten Menschen können sich noch nicht mal vorstellen, was gerade passiert, geschweige in 5 Jahren. Mit diesem System 2 Denken, dem langsamen Denken, das eingebettet in KI übertrifft das Gedächtnis und die Schnelligkeit des Denkens jedes Menschen um das Zigfache.
Ist es möglich, dass manche (gute) KI's bei der Königsfrage die beiden Aussagen "die Bürger sind auf ihren Vorteil bedacht" und "sich enthält bei gleichbleibendem Lohn" bei Lohn = 0 als widersprüchlich bewerten?
Hmm, irgendwie bin ich mit der Loesung bei dem Kartenraetsel nicht so ganz einverstanden. Und zwar:
Wenn eine Karte auf einer Seite einen Kreis hat, dann hat sie auf der anderen Seite die Farbe Gelb.
So wie diese Bedingung formuliert ist, ist es unerheblich auf welcher Seite die Karte Gelb ist oder einen Kreis hat. Folglich muss auch die gelbe Karte ueberprueft werden oder die Regel muss umformuliert werden in:
Wenn eine Karte auf >der sichbaren< Seite einen Kreis hat, dann hat sie auf der anderen Seite die Farbe Gelb.
Kucks du: 9:46
Ps.: Mein Gedanke dazu wurde mir von GPT4o gerade bestaetigt und er/sie/es hat sich fuer seine falsche Antwort entschuldigt :P
Echt spannend 😮
Auch auf der Karte mit Viereck könnte ein runder Kreis dahinter sei??
Das wird schon durch den ersten Satz in der Prämisse negiert.
"Du weißt bereits, dass jede Karte auf der einen Seite eine Form und auf der anderen Seite eine Farbe hat".
Zum coden brauch ich das auf jeden fall! das will ich!
Erstmal vielen Dank für dieses sehr interessante und ausführliche Video und man muss sich fragen was in der Zukunft Nobelpreis überhaupt noch wert ist😄 auf der anderen Seite macht es aber Hoffnung dass wir in Zukunft Probleme lösen können die die Menschheit sehr entscheidend beeinflussen können und das zum Guten und die KI uns dahin noch sehr viel hilfeleisten wird vielleicht und selbst noch am Leben zu erhalten.. und die technischen Entwicklungen die gerade jetzt sehr dringend gebraucht werden noch schneller in der Realität umgesetzt werden können. Nebenbei könnte ich mir gut vorstellen dass es irgendwann eine Politik KI gibt die jedenfalls unbestechbar ist und auch keine sinnlosen Ausgaben macht.. nach den ganzen Erfahrungen die die Menschheit in den letzten 50 Jahren mit Politik gemacht hat denke ich dass eine KI keine weitere schlechte Alternative werden könnte sondern nur eine mögliche bessere Alternative die man in Zukunft im Auge fassen sollte um die alten Fehler der Vergangenheit nicht zu wiederholen.... oder besser gesagt von Menschen wiederholen zu lassen😄... als letzte Instanz könnte man jede Entscheidung noch einmal von einer KI unabhängig überprüfen lassen. vielen Dank für die immer interessanten Videos und viele Grüße von Andreas aus dem Elsass
Hallo Morpheus, teste mal die Aufgaben des Bundeswettbewerb Mathematik 2. Runde mit o1 preview. Die sind nochmal schwerer als diese Rätsel. (Aufgaben gibt es auf der Webseite vom BWM) Konnte es nur mit o1 mini probieren und da kamen bei mir bis jetzt bei 2/6 Aufgaben das richtige Ergebnis heraus, jedoch bei den richtigen Antworten ohne schlüssigen Beweis. Scheint so als stößt das Modell da an seine Grenzen, auch wenn man diese Leistung vllt (noch) nicht erwarten kann.
Warum kann beim Viereck kein Kreis auf der anderen Seite sein? War da eine Regel die besagt dass immer eine Form und eine Farbe auf einer Karte sind?
ja
Bin grad zur Hälfte drin wtf das video ist eine stunde lang? Dachte ich bin 10 min drin es ist super interessant!
Für den Algorithmus daher genug Text damit es wirklich Auswirkung hat. Leider weiß ich nicht wie viele Worte gebraucht werden
Habe ich einen Denkfehler? Die Karte mit dem Quadrat müsste man doch auch umdrehen?
Ich habe zumindest nicht die Bedingung gehört, dass immer auf einer Seite eine Form und auf der anderen eine Farbe ist. So könnte doch auch auf der Karte mit dem Quadrat auf der Rückseite ein Kreis sein??
Ich stelle die Ehre der Mathe Doktoranden wieder her, denn die 63 Goldstücke hab ich noch im Kopf gelöst. Aber über kurz oder lang sollten diese Modelle sich dann auch mal ein neues Gesellschaftsmodel überlegen. Das alte wird ja nicht mehr lange gebraucht.
Haha. Ja, die Arbeitsleistung müssten wir dann aber auch Überprüfen können. Also nichts mit zurücklehnen und die Show genießen.^^
ich bin auch auf 63 gekommen (aber auf papier)
Ich wusste die Lösung bereits freihändig und mit geschlossenen Augen bevor ich Fragestellung gehört hatte.
Wenn wir ChtatGPT O1 die Antwort auf die "Frage nach dem Sinn des Leben, des Universums und des ganzen Rests" stellen würden und ihm 7,5 Millionen Jahre Zeit zum nachdenken gäben dann müssten wir 180.000.000.000$ an Lizenzkosten berappen.
Weit über der Zeit? Ich hoffe das Video war erst der Anfang! Dieses System wird teilweise nicht verstanden, ich hoffe da nimmt man sich mehr Zeit um die Details und Potentiale herauszufinden! Machst du eine Videoreihe bei der Vollversion von o1? 🔥
"Experten in ihrem eigenen Fachgebiet geschlagen" ist aber auch sehr populistisch formuliert. Die Chemie-Fragen (mein "Fachgebiet") sind z.B. sehr breit. Niemand würde erwarten, dass ein Doktorand (und auch kein Professor) in der anorganischen Chemie derartige (teilweise) detailfragen zu organischer Katalyse beantworten kann. Wenn ich der O1 Fragen wirklich zu meinem Fachgebiet (also meiner Spezialisierung) stelle, dann ist es bisher meist entweder gescheitert oder hat "standard-lösungen" vorgeschlagen, die natürlich alle schon durchprobiert wurden und gescheitert sind. Meist waren die Vorschläge zum Vorgehen ungefähr auf dem Niveau, das ich von Bachelor-Studenten erwartet hätte.
Insgesamt ist der komplette GPQA (Diamond) Benchmark stark biased, was man auch an der Verteilung der Themen sieht. Zusätzlich sind es eben Multiple-Choice fragen. Wenn man in das Paper zu dem Benchmark schaut, wird auch anerkannt, dass sowohl der Datensatz, als auch die "Experts" wahrscheinlich nicht repräsentativ sind.
@TheMorpheusVlog wie wird sich KI deiner Meinung nach in den nächsten Jahrzehnten verändern? Wie stellst du dir die Zukunft der KI im Jahr 2100 vor?
Um ehrlich zu sein weiß ich nicht Mal wie es in 5 Jahren aussehen wird 😂 aber ich kann gerne Mal ein Video dazu erstellen
Beim Wason Selection Task wäre es hilfreich gewesen, auf den Abschnitt "you already know ..." hinzuweisen ...
9:00 - So, wie du das Problem präsentiert hast, müsste man drei Karten umdrehen - das Quadrat könnte ja auch einen Kreis auf der Rückseite haben.
Dass das von vorneherein ausgeschlossen ist, steht nur im Text. Fail deinerseits.
Es steht auch im Text, dass eine Seite immer eine "shape" ist, die andere eine Farbe. Ich hab die Lösungen geprüft, auch bei der Seite.
wie übergibst du denn große Repos an ChatGPT?