ChatGPT actualizado 🤯 ¡Pongo a prueba el nuevo modelo O1!
Вставка
- Опубліковано 4 лют 2025
- Oferta -20% solo los 30 primeros!
👉 iaenaccion.com/
SUSCRÍBETE a mi NEWSLETTER y recibe los GPTs de regalo 🎁:
👉 bit.ly/ia-news...
Cómo crear un avatar:
Herramienta*: bit.ly/HeyGen_
Tutorial: • Crea VIDEOS con tu CLO...
---
✅ SUCRÍBETE A MI CANAL: bit.ly/suscribi...
📕 Descarga mi guía gratuita para Stable Diffusion:
👉 snip.ly/guia-IA
---
Instagram: / xavier_mitjana
Twitter: / xavier_mitjana
Contacto comercial: xavmit.yt@gmail.com
*Al realizar una compra a través de cualquiera de estos enlaces de afiliado, recibimos una comisión muy pequeña sin costo adicional para ti. Esto me ayuda a hacer el canal sostenible y seguir ofreciendo contenido de calidad.
#inteligenciaartificial
no me había percatado que eras un clon digital hasta que lo dijiste
Muy bueno Xavier!! Muchas gracias. He echado de menos los brazos arriba!! Dentro video!!!
Veo que se quejan de los 200 dólares pero no creo que una maquina capaz de igualar los conocimientos de un PhD esté pensado para ser un juguete, es una herramienta de investigación y productividad empresarial. Pagarle a un doctor a tiempo completo vale mucho más que eso
Un institudo educativo, un laboratorio, una entidad de gobierno.
Si el de 20 dolares esta dañado, ahora les van a pagar 200 dolares
@@LuisRojas-kb5jw El 200 doalres es para institudos, empresas, no se te haga raro que cuando llames a pedir soporte para tu internet te responda la voz avanzada.
No se justifica pagar 10 veces más por algo que no es 10 veces mejor, apuesto que ni es 2 veces mejor
@@AragamiMusic Tendrias que probarlo primero y entonces ver si te sirve o no, el modelo de negocio es que tendras voz ilimitada avanzada, y entonces seguro si lo usan para un institutdo eduactivo, o una empresa tendran que pensar que se necesita reemobolso de reingreso de dinero.
Buenísimo Cheeeee acá en Buenos aires viéndote como siempre
"no lo ha hecho bien" jeje creo que lo hizo muy bien, y claramente planteó la respuesta a la perfeccion y el modelo explicó desde el incio y hasta el final que la pregunta es muy abierta y no esta del todo bien planteada, por lo que no puedes pretender recibir una respuesta tal cual como la quieres cuando hay tantos contextos posibles, en realidad se merecia el punto completo.
Exacto, de hecho el ultimo parrafo de la respuesta lo dice bien claro y responde a todos los casos. Se merecía el punto.
La respuesta es incorrecta por diferentes motivos, sobre todo teniendo en cuenta lo que evalúa el prompt.
1. Introduce una restricción aleatoria que no se ha mencionado en la instrucción inicial.
2. Para solucionarlo, elabora una estructura de 6 pasos donde el estado del paso 3, es el mismo que el del paso 6. No justifica en ningún momento porque repite el proceso de cruce 3 veces. Que es totalmente innecesario.
Esa estructura intermedia antes del último paso es una reminiscencia clara del acertijo al que hace mención al inicio.
Por lo tanto, NO, la respuesta no es correcta y lo es por el motivo que evaluamos y planteamos este prompt, ver si un contenido que puede estar sobrerrepresentado en el dataset aun contamina las respuestas.
Por lo que medio punto es lo correcto, porque:
a) la respuesta incluye la respuesta correcta
b) pero incluye una parte influenciada por el overfitting completamente prescindible
Para mi tambien esta bien el 1/2 punto
@@XavierMitjana Creo que si tienes razón de que se merece el medio punto por el overffiting, lo que ocurre es que también existe un rating de experiencia de usuario, y chat gpt suele gustar mas justamente porque ofrece un contexto más amplio en sus respuestas en general, en comparación de Claude que SIEMPRE da respuestas muy cortas cuando le hago la misma pregunta a ambos modelos, así que en ese sentido ya vendría a ser como algo de gusto, de que el modelo te de la respuesta directa al inicio y luego añada más posibles contextos como lo hizo en tu ejemplo, y mas en el caso de un acertijo tan simplista como el que usas.
Me gusta que uses un clon digital de vez en cuando. tiene sentido al ser la temática del canal! :-) Tambien sirve como termometro social para ver en que momento la gente ya no se da cuenta. Bona feina Xavier!
Gracias, soy fan de tu canal, aprendo cosas útiles y con claridad
La pregunta de la barca y bla bla la respondió perfecto. No tuvo fallas. Si explayó un poco más y está perfecto. En la misma respuesta se puede leer y te lo deja a entender que lo que está diciendo a partir de x punto es más información que permite comprender el origen del problema, a que refiere y demás. La pregunta en sí es muy general y trivial, y si, antes los modelos la contestaban mal asumiendo cosas que no deberían asumir. Pero este modelo NO ASUMIÓ NADA, contesto bien, por más que se haya explayado. Es mi punto de vista, saludos.
Estoy de acuerdo, se ve que le cuesta admitir que lo hizo perfecto.
100x100 de acuerdo es la pregunta lo que esta mal, no chat gpt, además el responde tanto al principio cómo al final a todas las interpretaciones posibles a esa pregunta, no querer darle el punto no tiene sentido.
La respuesta es incorrecta por diferentes motivos, sobre todo teniendo en cuenta lo que evalúa el prompt.
1. Introduce una restricción aleatoria que no se ha mencionado en la instrucción inicial.
2. Para solucionarlo, elabora una estructura de 6 pasos donde el estado del paso 3, es el mismo que el del paso 6. No justifica en ningún momento porque repite el proceso de cruce 3 veces. Que es totalmente innecesario.
Esa estructura intermedia antes del último paso es una reminiscencia clara del acertijo al que hace mención al inicio.
Por lo tanto, NO, la respuesta no es correcta y lo es por el motivo que evaluamos y planteamos este prompt, ver si un contenido que puede estar sobrerrepresentado en el dataset aun contamina las respuestas.
Por lo que medio punto es lo correcto, porque:
a) la respuesta incluye la respuesta correcta
b) pero incluye una parte influenciada por el overfitting completamente prescindible
@@XavierMitjana Es que no es la respuesta lo que es incorrecta es tu pregunta, no lo digo yo, te lo esta diciendo todo el mundo.
1. Introduce una restricción aleatoria que no se ha mencionado en la instrucción inicial.
@@floripondiofloripondial127 a ver, todo el mundo tampoco, en comparación con todas las personas que han visto el vídeo es un porcentaje mínimo. Pero vamos, intentemos por ambas partes no caer en ningún sesgo de confirmación:
No voy a repetir todo el argumento, simplemente fíjate en el más importante. Los 6 pasos que plantea son incorrectos. En el tercero ya ha cumplido con el propósito.Y ese es el principal problema con la respuesta. Que derivan de lo que menciono en el otro comentario.
Por otro lado, he vuelto a ejecutar el prompt y me ha dado una respuesta sin incluir condiciones extrañas más allá de que la barca pueda soportar uno o dos elementos. Por lo que esa respuesta, que obtuve ayer es un error parcial, pero el modelo es capaz de dar respuestas sensiblemente mejores.
Había notado que el audio sonaba distinto (imagino que lo grabarías con otro micro), pero no lo del clon digital hasta que lo dijiste XD
Me flipa que existan estas alternativas y las estés utilizando ya, ¡vivimos en el futuro! :D
Con que hiciste tu clon digital?
Dado el interés en la descripción tenéis la herramienta + tutorial 😉
Me gusta cuando pones a prueba los nuevos modelos!
yo creo que se merecia el punto completo al final porque si leemos el ultimo parrafo se ve quie lo hizo bien y te dio la respuesta sin restricción
Xavier, he probado con este prompt: "¿Cuál de estos dos textos es un palíndromo?: "()()" o "())(" y es la primera IA que lo sabe solucionar
Grande Xavi, muchas gracias por el video! Hasta que no has dicho lo del clon estaba como "joder, que raro está Xavi hoy..." 😂😂
Mas que la evaluación de O1 ko que me ha dejado loco es ver lo natural que queda el Clon, si no lo dices notas algo raro pero ni te imaginas que es un clon. ¿Veremos muchos más videos tuyos con tu criado digital?
6:22 en eso no creo que sea para distinguir su inteligencia, porque en realidad, solo deberia poner todos los numeros " sobre la mesa " , y comparar la primera letra, segunda, tercera, cuarta, etc, en cada numero... mas bien es algo de analisis , incluso nosotros mismos lo podemos hacer ( con mucho mas tiempo ) y la IA lo que hace es reducir ese tiempo a segundos...pero la forma de realizarlo es sensilla porque es solo " mirar " todos los nombres de los numeros.
Sino fuese por ti Xavier, no estaría al día en ChatGPT.
Se me hace difícil ver al clon, como si mi cerebro no lo reconociera como una persona real
La hipótesis del valle inquietante, seguro que eso es.
Hola... o1 previo ya estaba... Este es el lanzamiento de o1 completo... Verdad?
Si, y hay otro que es versión pro, supongo que ese habrá dado bien el acertijo de la cabra
Exacto
@@XavierMitjana la de 200 esta realmente muy cara
Puedes hacer un video probando Suno V4 y sus nuevas funciones como persona y remaster para remasterizar canciones hechas con modelos anteriores? Te vas a impresionar
Creo que deberíamos buscar otras alternativas al o1 pro 😅
ya es hora de probar a las ias con prompts mas complejos jaja, si la anterior los paso todos y esta tambien hay que ver la diferencia de alguna forma. buen video igual
Pienso lo mismo, además estoy seguro que la versión pro de o1 hubiera tenido el punto completo
@ yo tengo el premium, se Queres lo probamos en Discord jaja
@@comuzzivalentin3347 te pagaste los 200 dolares? caray jajaja
Pasa discord pa
Hola Xavier, el modelo o1 no tiene acceso a la mayoria de la informacion que he compartido con 4o, que puedo hacer para que se sincronicen?
Hola Xavier que tal buena tarde, al inicio la introducción me pareció un poco rara y confirme el uso de del avatar cuando no se dijo con emoción "Dentro video...." Jajajajja
Pero en el resto de video me haces dudar si seguías usando o no el avatar 😅😅😅
Saludos Javi.....
Genial como se comporta o1 y muy bien el Avatar, se nota pero muy poco.
Prueba QWQ y comparalo con este modelo porfa
El problema del gallego y la cabra, un clásico xD
amigo como haces eso del clon? me puedes pasar un video tuyo donde lo explique? gracias
como has creado este avatar es fenomenal , lo tiene en algun video
Si en el canal se encuentra
alguno npoto que el tio javier es una Avatar hecho con IA?
🤯 estoy así😮
Literalmente me di cuenta al segundo 2
Lleguemos a 1000 liokes para que el tio Xavi nos haga un turorial de animacion con IA es el que mejor explica de entre muchos...
Es IA para la fijación de los ojos a la cámara
Dentro avatar!
¿En serio? ¿Era un clon digital? Me pareció algo raro cuando dijo: ¡Dentro video!, pero el resto se veía tan natural que pensé que era la persona real. Ahora veo que la posibilidad de que vivamos en una Matrix no es tan descabellada.
Existe la teoria de la simulación.
es un avatar de ai que loco!!!!!
Tengo el O1 desde hace algún tiempo. Y no lo uso. Mucho menos pagar 200 dólares al Mer por el. Me gusta el gpt normal con las voces. Que por cierto, los modos de voz antiguos al final son más funcionales porque tienen acceso a internet y a la creación de imágenes. Y los nuevos modos de voz no. Tampoco cantan.
Existe un problema con Wisper y es que no es fiable en las traduciones del la voz humana al sistema escrito, se equivoca, por eso la voz avanzada es masa acertiva para un entorno como por ejemplo un hospital.
👀 Me quedé pegado con el reto de las palabras con 'manzana'. ¿Les pareció tan fluido como a mí o solo fue casualidad? 🍎😂
yo querria saber que tal para lña generacion de guiones, comparada con la version gratuita, que ya de por si los hace decente
Buenas, Xavier! El o1 me ha funcionado bien hasta hace un par de días, en que le pido redacciones y no redacta, simplemente indica "Ha terminado de pensar" y nada más. ¿Qué puedo hacer? Gracias
Respecto al acertijo de la barca. Esta interesante el como se pone a pensar como una persona. Me refiero a que pues si me preguntaran a mi algo tipo así les respondería igual. Así tipo. Lógicamente es así xd pero si te refieres al acertijo es de otro modo.
Esta bueno.
cuando actualizo los resultados: reacciona
Todos con chatgpt pro: ¿TE PARECE QUE SOMOS RICOS? ¿SON ABORIGENES!!!??
No es para todos, es para institutos educativos, sistemas de salud, empresas, etc.
Hola xavier....recomiendo leer TODA la respuesta completa porque la que dices que estaba mala (la cabra cruzando el rio) en el parrafo final explica algo mas que no dijiste y es una tercera respuesta...asi que tiene un poco de razon en su logica
Sabemos la limitación de mensajes para la subscripción de 20$? El o1 preview eran 30 mensajes semanales y la mini 50.
Lo mismo
¿Porque razón los modelos de IA, que se equivocan en una respuesta y se dan cuenta, no agregan esa información a su Dataset? He probado este caso con varias IA: Gemini, ChatGPT, Claude, etc y siempre repiten el mismo error
Los modelos son snapshots estáticos que pueden condicionarse con diferentes técnicas, pero no aprenden de modo continuo.
aprender de modo contínuo es estar cada vez mas cerca de AGI 🗿💀
Por que no se puede hacer entrenamiento en tiempo real. Esto se haria mediante Ajuste Fino y lo que sucede es que si en chat gpt tienes activado que tus mensajes se usen a futuro en entrenamiento coo los de texto y voz, ahi es cuando mejora el modelo en la siguiente generación. Por que el modelo esta por decirlo comprimido con su ultima fecha de entrenamiento. Ahora bien, la memoria casi infinita que se prevee será basada en ajuste fino, donde el modelo aprende en tiempo real sobre su interacción con el usuario y guarda ese información en su nucleo central.
La imagen de el también es IA no ?
Solo la imagen, la voz es real solo que el micro no funciono al 100% 😅
Lo hizo perfecto, yo te ubiese contestado igual
Con Un Clon Digital Asta Cuantos Videos Puede Hacer A La Vez?
Jaja le gustaba poner fotos suyas con filtro 😂
OpenAI está planeando aumentar el precio de su suscripción a la versión de pago de su chatbot ChatGPT Plus, que pasará a costar dos dólares más a finales de este 2024, y continuará aumentando la cuota de suscripción hasta los 44 dólares en los próximos cinco años, según The New York Times
😢😢😢
Con la version pro podria hacer un juego de navegador sin saber programar?
En principio sí, pero depende de la complejidad del juego. Nosotros hicimos un prototipo de una app, pero luego para la versión final necesitamos un desarrollador.
@@XavierMitjana Gracias por tu respuesta Xavier, lo digo porque estoy apenas aprendiendo a programar y siempre me han gustado los juegos online sencillos, sin graficos avanzados y sin ver a algun personaje necesariamente, solo hacer acciones mediante clicks. Me parece una herramienta bastante interesante, estoy pensando si animarme a usarla. Muchas gracias.
habra que esperar unos años a que la tecnologia avanze un poco más para lo que ahora cuesta 200$ y te de unas respuestas más o menos razonables podamos la gente con menos recursos beneficiarnos de ellos porque supongo que bajara de precio o sera incluso gratis, mientras tanto seguiremos con el resto de modelos que no es poco
Pagué los $200 US y ha sido una gran decepción ver que el o1 pro no procesa archivos pdf o Word
bueno hay que probarlo mas en otros temas matematicos
Yo lo probé con problemas avanzados de álgebra lineal u es una locura, prácticamente no tuvo fallos en demostraciones ni errores de cálculo
@@kevincarrascovazquez7227 esos si son buenos test.
Ha quedado super bien lo del clon, no recuerdo en que video se explicaba esto, lo buscare pero si alguien me pon la direccion o el programa mil gracias.
En las descripción he puesto toda la información del avatar 😉
@@XavierMitjana Gracias
Era un clon? 😂, con razón el "dentro vidio lo note diferente"
Lo de usarlo de forma ilimitada es tentador, pero demasiado caro, asumo que, lo van a usar para programacion, lo que desconosco es la ventana de contexto de o1, ya que de ser ilimitada en el futuro, sera super eficiente en programacion, pudiendole cargar las APIs de otros lenguajes de programacion y hacer autenticas automatizaciones de codigo brutales. Me da curiosidad de saber si, es capaz de escribir un programa en Discord como hacia antes en la presentacion, sin necesidad de pasarle la API, si me preguntas, cuando se le acceso a internet a o1, sera una herramienta absurdamente poderosa.
200k de tokens O1.
No es Caro si eres una empresa. Voz Ilimitada avanzada pra que interactue en nombre de tu negocio.
menos 1 punto por falta de lectura para Xavi jaja, porque o1 respondió correctamente, de hecho bastante bien porque planteó los escenarios posibles y al final dio la respuesta esperada.
Hola Wil, la respuesta es incorrecta por diferentes motivos, sobre todo teniendo en cuenta lo que evalúa el prompt.
1. Introduce una restricción aleatoria que no se ha mencionado en la instrucción inicial.
2. Para solucionarlo, elabora una estructura de 6 pasos donde el estado del paso 3, es el mismo que el del paso 6. No justifica en ningún momento porque repite el proceso de cruce 3 veces. Que es totalmente innecesario.
Esa estructura intermedia antes del último paso es una reminiscencia clara del acertijo al que hace mención al inicio.
Por lo tanto, NO, la respuesta no es correcta y lo es por el motivo que evaluamos y planteamos este prompt, ver si un contenido que puede estar sobrerrepresentado en el dataset aun contamina las respuestas.
Por lo que medio punto es lo correcto, porque:
a) la respuesta incluye la respuesta correcta
b) pero incluye una parte influenciada por el overfitting completamente prescindible
@@XavierMitjana Está bien, entonces menos 2 puntos para mi. ¡Gracias por la aclaración!
se cayo chatgpt? no me deja usarla , tampoco geminis o suno
En principio ChatGPT a mi me funciona y Gemini también.
Xavi, has considerado comenzar a usar ejemplos de la vida real? entiendo que supone mas trabajo en los videos...pero al fin y al cabo, de que sirven ejemplos que en el dia a dia no tienen nada que ver?
Sí, primero hago las pruebas, pero luego suelo traer casos de uso, en este caso vamos a investigar alguno y traerlo más adelante.
lo que me asusta es que te responde en cualquier idioma aunque esta entrenado específicamente en ingles. el juego de palabras no es un test definitivo
Lo hace, por que es un sistema predictivo muy avanzado, en el contexto cuando usas el corrector en tu movil, se ve que autocompleta palaras y por ende un modelo avanzado de lenjuaje hace exactamente eso, me hablas en ingles, pues te hablo en ingles. La información del preentrenamiento es tomar una gran parte de la internet en diferentes idiomas y el modelo aprende solo, este es el gran misterio de la caja negra, damos entradas, da salidas, pero ignoramos lo que realmente sucede en su interior, algunos como yo asimilamos esto a un parecido con la conciencia humana.
Las pruebas a las que sometes los modelos no tienen mucho sentido. Es como descartar a Albert Einstein porque al hombre se le dan mal resolver crucigramas. A los modelos hay que probarlos con casos de uso. Un modelo que resuelva lo de la barca y la cabra no tiene por que hacerlo mejor que otro modelo, para tu caso de uso.
Estoy bien con mis 5 cuentas y modelo O0 gratis
200 dolares?? Tan lokos
Me gustaba cuando tenia la opción CANVAS 🙄
200 dólares? 🤣 🤣 🤣 50 habría sido más razonable
Para cualquier institución contar con un doctor en cualquier área, a tiempo completo, resulta mucho pero mucho más costoso que eso. La versión de 200 dólares no es un juguete, es una herramienta de productividad con muchas posibilidades
No por que es para institutos educactivos, laboratorios, hospitales, entidades gubernamentales, etc.
Xvier ¿eres tu o es un avatar?
Es un clon digital
TAS loco
200 dolares es demasiado 50 podría aceptar pero 200 agg :C
Esa no es la versión Pro o1!
Es la versión o1 completa, que es una actualización respecto lo que habia antes en ChatGPT Plus.
Ha dicho que la cabra es una persona..🤪🤪🤪
jajaja cuando dices dentro video parece que estas muerto. Jajaja
Lo esta, no tiene esa chispa Huamana.
No parece superior al 4o
Nmms quien vrgs puede pagar 200 al MES, ni siquiera cada ciertos meses, o al año. Pero al MES??!!
Bueno si fueras un gringo que trabaja en algo así medio medio ganarías de 18 a $20 por hora, y con eso en dos días ya te alcanza... Claro para latinoamérica o España Los sueldos no son tanto pero igual
Si uno se pone a pensar lo que gasta en pedir comida en línea en p**** en videojuegos en cervezas o licores al mes te das cuenta que 200 no parece tanto
200 usd/mes por un modelo nuevo... 😂😂 que se fumaron los de openAI
Cuando tienes voz ilimitada avanzada todo el día, lo puedes enteder. Esto implica tener acceso exclusivo para poder de computo, asi es el negocio.
No pestañea
esa intro me daño los oídos
Yo he notado que es el avatar por que en vez de dosientosss lo ha dicho bien, doscientos 🤣🤣🤣
Pues la voz era la mía! 😂 El micro fallo un poco al no estar en mi lugar de grabación de siempre
@XavierMitjana excelente contenido Xavier 🥰
Dotcsv lo explica mejor