¿Y si ChatGPT fuera una IA MULTIMODAL? (BLIP-2)
Вставка
- Опубліковано 10 чер 2024
- Subes una imagen a ChatGPT y le preguntas... ¿qué ves aquí? y usando perfectamente el lenguaje natural, te responde. O te compone un poema. O te hace una historia. Esto ya es posible gracias a tecnologías como BLIP-2 que consigue traer el concepto de multimodalidad a coste computacional mucho más reducido. Conectar varias fuentes de datos será el futuro de asistentes como ChatGPT, que próximamente permitirán analizar audio, imágenes o vídeos.
► BLIP-2 (Demo en HuggingFace)
huggingface.co/spaces/Salesfo...
► BLIP-2 (Proyecto)
arxiv.org/abs/2301.12597
► Salesforce LAVIS
github.com/salesforce/LAVIS
► DeepMind Flamingo (Blog)
www.deepmind.com/blog/tacklin...
📹 EDICIÓN: Carlos Santana y Diego Gonzalez (Diocho)
-- ¡MÁS DOTCSV! ---
📣 NotCSV - ¡Canal Secundario!
/ notcsv
💸 Patreon : / dotcsv
👓 Facebook : / ai.dotcsv
👾 Twitch!!! : / dotcsv
🐥 Twitter : / dotcsv
📸 Instagram : / dotcsv
- ¡MÁS CIENCIA! --
🔬 Este canal forma parte de la red de divulgación de SCENIO. Si quieres conocer otros fantásticos proyectos de divulgación entra aquí:
scenio.es/colaboradores - Наука та технологія
¿Y vosotros, qué construiríais con esta herramienta? Deja un LIKE en el vídeo y me cuentas! 👀🔥
Hola @DotCSV quisiera consultar algo, estuve entrenando la IA de SD con la guía que subiste a UA-cam, sin embargo al entrenar la IA con mis imágenes y solicitarle cualquier pedido, no importa el prompt que utilice, solo me arroja imágenes iguales a las entrenadas, QUÉ PUEDE SER?
He intentado con menos pasos de entrenamiento y con más imágenes, sin embargo sigo teniendo el mismo error en el notebook de colab que habéis subido
Pues ya ves, yo la conectaría al VAR para que fuera la IA la que decidiera y así evitar la "variable humana" 😉
Una pregunta como hiciste para de la IA te diera esa imagen.
Cual fue el prompt porque quiero generar imágenes iguales
Yo construiría un ayudante terapéutico artificial para personas que no pueden encontrar ayuda, y el sistema tendría algo de humor que podría usar detectando el momento correcto para ello según la tonalidad de voz del consumidor.
Eres el único youtuber que realmente sabe de lo que habla con respecto a temas de IA. Todos tus videos son fascinantes, me alegro mucho de haber encontrado tu canal
Ojalá hubiera más UA-camrs como este que hablen de una forma segura y profesional sin caer en las falacias y errores sobre la IA.
@@user-uq7pv3np3c Exacto tú sí sabes. Muchos youtubers solo se van por la tendencia y tratan de explicar un tema que ni siquiera ellos entienden.
Totalmente de acuerdo. El unico con autoridad. Y el primero. Cada vez que veo a otro youtuber hablando de ello sin saber me hace reír. Digo se han cansado ya de hablar de las criptomonedas.? jiji
No es el unico, pero si esta entre los mejores, no hay que menospreciar a otros tambien igual que Dot. en ayudarnos a cutivarnos en Inteligencia Artificial saludos.
@@content1 Hay varios buenos tambien, y Dot igual lo es y esta entre los mejores.
Me siento afortunado de ver los increíbles avances de la mano de este canal 🙏🙏
¿eres una IA?
@@nestrul1De momento no puedo responder a tu pregunta. No dispongo de una respuesta preestablecida.
Presiento que tu canal va comenzar a crecer exponencialmente en los proximos meses...me alegro poder decir....."yo estuve aahi !!!"... en los comienzos de tu canal...
y ver como en tan poco tiempo todo el tema IAs esta avanzando de una manera brutal....
llevo todo el dia experimentando con GEN-1 y no doy credito a lo que ven mis ojos....
INCREIBLE! Cada que sale un video tuyo, me alegras el día Carlos, gracias. Apasionado por IA ando
Recuerdo cuando hace 22 años que conoci las computadoras, pensaba que se les pedía que hicieran las cosas y las hacían...es curioso como luego entendí que se ocupaba hacer todo un procedimiento, pero ahora estamos llegando a esa época donde la computadora se está convirtiendo en lo que imaginaba de niño
Trabajo en educación y estoy realmente muy abrumado por la enorme distancia que existen entre lo que está pasando y que tu magistralmente muestras y lo que se sigue haciendo por tantas décadas en las aulas. Hay siempre un tremendo desafío en lo que propones y que son sugerentes para activar a nuestros docentes y potenciar ciudadanos para el siglo XXI. Muchas gracias crack!
Gracias tío Dot por subir este tipo de contenido, siguiendo de cerca toda esta locura! Por mi parte yo utilizaría la IA para poder analizar los productos en las góndolas de los supermercados, que logre interpretar y clasificar las imágenes, como obtener el % de participación en góndola por producto vs la competencia, permanencia durante el tiempo (antigüedad), predecir futuros quiebres de stock, predicción de demanda, etc. Hay que aprovechar que esto está recién comenzando! MOVE FAST AND BREAK THINGS
Lo probé! tambien te vi interactuando en Tik Tok. Yo te sigo desde hace mucho, gracias a vos soy analista de datos, tu divulgación es importante. Saludos desde Uruguay
¿Podemos imaginar la interpretación de ecografias, radiografiats, imagenes relacionadas TAC, etc?
Es posible, tan solo habría que entrenar al modelo para que pueda hacerlo correctamente.
Aunque el porcentaje de error sea alto, por en ejemplo, en la detección de cancer o tumores malignos
La cantidad de información que hay en ese tipo de imágenes es muy elevado, por lo que es posible que se requiera de un mayor número de entrenamiento para la ia.
Esto occurre hace ya un tiempo y de hecho en ocasiones la capacidad de prediccion basada en las imagenes superaba la de especialistas
Como dice @@guidodinello1369, de hecho a veces un especialista puede fallar en el 80% de los casos, aunque una ia tuviese el 60% de aciertos como Blip-2, el acierto sería mucho mayor al de varios especialistas
Ni alcanzaba a llegar a una fracción de conclusión de este video y tanto este como su creador me han captado. Me he convertido en seguidor inmediato. Felicidades por el gran trabajo.
Siguen integrando capacidades cognitivas sofisticadas en una lata... sintiendose tranquilos de que solo es una herramienta. Nuestros sentidos y mecanismos de integracion tambien son herramientas... y en nuestro cerebro se tornan "conciencia" sin que sepamos aun como. ¿Cual es la necesidad de crear un engendro de silicio en el cual el fenomeno emergente de la conciencia no tardara en manifestarse???. Por cierto... no soy un hater... ni un fanatico religioso... amo la ciencia y la tecnologia, pero estamos jugando con un fuego que no sabemos como se origina ni como extinguir... Nuestra propia necesidad de sentirnos Dioses. Te felicito por tu canal y tus videos Carlos, te veo desde el primer dia, al igual que a tantos otros como Crespo, Javi, Marti, Aldo y muchos mas. GRACIAS por brindarnos la informacion y el entendimiento de todos estos maravillosos y espeluznantes avances en la ciencia y tecnologia... a la vez que nos estan aconteciendo en tiempo real. Somos testigos (¿afortunados?) del mayor cambio en la historia de la humanidad.
Unas gafas para gente ciega que contengan camaras que analicen las imagenes de lo que esta pasando a su alrededor y se conectan a auriculares con microfono y la persona ciega puede escuchar lo que le describe las gafas y tambien puede hacerle preguntas todo en tiempo real, que le vaya avisando a la persona por ejemplo si se esta por topar con una pared o si esta por llegar hasta el fin de la cuadra antes de toparse con la calle y saber en que momento poder cruzar sin que le pise un auto
seria de mucha ayuda para esas personas
buena idea bro.
El mundo de la discapacidad está lleno de corrupción e intereses ocultos. No será empleado para dicho fin.
Creo que en el futuro las IA relatarán partidos de fútbol, carreras de Fórmula 1, etc... no sería nada loco...
Si en el futuro siguen existiendo esos deportes como prioridad, sería algo monótono, no veo qué tanto nuevo tienen que entregar en 100 años que no hayan entregado ya, excepto que cambien las reglas que ya son algo aburridas. Falta un fútbol volando sobre el agua, carreras de drones tuneados en canchas con hologramas y luces led, mma espacial. Pero fútbol? Carreras de autos? No sé tú, pero yo desde el 2010 que no veo nada nuevo que tengan que entregar y los boicoteo activamente
@@SebaBuenoHaceMusiquitaJijiji Lastimosamente el fútbol se está volviendo cada vez menos vistoso. Se dice que la FIFA creará una "superliga" con los mejores equipos del mundo, a modo de eliminatoria.
Antonio Lobato en IA
Asistente para personas con limitaciones visuales es el mejor uso que se me ocurre. Como herramienta científica para buscar "objetividad". Para control del tránsito e infracciones.
Digamos que la inteligencia artificial es tan buena detectando humor y emociones de animales que las traduce a idioma humano, se imaginan que en tiempo real grabes a tu mascota y la inteligencia saque una voz que diga casi con exactitud lo que tu perro está diciendo o tratando de transmitir.
Eres un grande DotCSV, en el futuro cercano puedo ver tu canal creciendo estrepitosamente gracias a tu contenido de calidad y el auge de las IA
Hace unas horas usando Microsoft Edge (en celular) por VER sus nuevos motores de búsqueda por IA: Encontré la información , Saqué un screenshot de la búsqueda y enseguida me apareció una notificación de "autorizar acceso a mis fotografías", Viendo las posibilidades suena interesante, pero a mí me pareció intrusivo y peligroso en ese momento. El darle acceso a mis imágenes a Microsoft Edge.
Que genial, y esto ya lo pensaba hace unos años me encanta saber que haya gente haciéndolo ya, por qué yo sigo aprendiendo programación jajaja😌😊
Que buen video Carlos. Un abrazo
Siendo el texto el corazón de la comunicación, Whisper(oido), Vall-e (voz) , blip 2 (visión) y GPT3 y ya con ....music ml, stable diffusion
Un agente capaz de expresar y gestionar información de una forma brutal, si en Palm, por ejemplo surgieron nuevas capacidades emergentes, que capacidades no podrán surgir en un ente con tantos "sentidos" como se quiera/pueda computar.
Ilusiona, abruma y da hasta cierto recelo.
Ojalá todo esto se use con su máximo desempeño en genética , biomedicina y salúd.
La máquina de curación de la película elisyum sería menos fantásiosa con el tiempo
Excelente video, muy informativo y divertido al mismo tiempo.
Ya decía yo que parte de este video lo había visto antes, y como mencionaste al final es un fragmento de un directo. Gracias por aclararlo, me habría quedado con esa duda jajaja
Nunca me pierdo ningún video tuyo, maestro
Muchas gracias dot por hacer estos vídeos!!
Pienso que llegado el momento, podría estar parametrizado todo el comportamiento humano, y por ende predecir cómo reaccionará cada persona a cada evento. Así podríamos introducir toda la vida y obra de algún artista, que haya sido el mejor de la historia en su disciplina, véase como ejemplos Mozart, Shakespeare o Da Vinci, para continuar con su obra y no me refiero a cosas como terminar alguna canción, que eso ya se ha hecho. Me refiero un personaje virtual que pudiésemos tener un muy alto nivel de fiabilidad que se comportaría así.
¿Qué haría Amadeus con una mesa de mezclas? 🤯
¿Pillarían Royalties los herederos? 💸
Película musical con María Calas y Freddie Mercury, dirigida por Da Vinci, guionizada por Shakespeare y banda sonora de Mozart. (no existe emoji para describir ésta emoción)
Gracias por el vídeo.
Fascinante.
te amo loco no dejes de hacer estos videos
15:00 esa imagen es un meme y ya sabía que es un campo de algodón
Me agrada más el entusiasmo que le pones al hacer el video que la tecnología explicada en el, creo que es un paso natural la unión de esas tecnologías.
Espero que llegue la tecnología sin fallas m, sin bloqueos, sin sesgos
Gran contenido como siempre. Estamos cada vez más cerca de una Sinestes-IA *PLOP*
Me recuerda a la funcionalidad que existe en Facebook hace varios años para construir automáticamente la descripción de las fotos tanto para personas con dificultades visuales como cuando hay problemas de carga de imágenes (expone solo la descripción textual)
Gracias por compartir.
3:27 "Dot CSV En Lencería" 😂😂
Gracias por el contenido!
Esto si es información útil y valiosa
Impresionante!
Gracias!! Por todo !
sos un crack explicando! te admiro
Ya lo probé, le mostré una imagen de crespo y se quedó sin palabras. Creo que no lo han entrenado con un conjunto de datos lo suficientemente bellas.
wow me estoy poniendo al día y es que la IA está que arde 🔥... respecto a ideas de IA, a mí me gusta la programación y el dibujo, siempre he pensado en una herramienta que posibilite el dibujar en pantalla, como lo hace actualmente la app de escritorio de WSP, e ingresar texto ya sean preguntas pedir descripciones y más cosas... seria genial escribirle y que en tiempo real dibuje solo con línea y color... ahora que recuerdo quickdraw se llama una en la cual vas dibujando y la IA va adivinando que estas dibujando, pero primero ponen que dibujar luego dibujas lo que te piden y nada más.
Sistemas de enseñanza y apoyo al docente, muy potentes, personalizando la enseñanza para cada individuo.
¡Me siento Emocionado & Temeroso a la vez!
Emocionado; por los avances tecnológicos que cada vez más nos facilitan la vida si los sabemos aprovechar y.
Temeroso; por qué cada día estamos más cerca de una skainet
Excelente video !!!
Hola Dot muchas gracias, tu siempre eres el primero en traernos las novedades de Inteligencia Artificial este me gusto porque esta sencillo, tuve la ocurrencia de preguntar por la imagen de una persona en su rostro que caracter refleja y fijate que si la dijo...que sea real no se todavia no la conozco bien a la persona..tal vez esto un dia revele el interior de las personas y saber si dicen la verdad o no . jejeee...saludos :)
Great video!
Esto cada día me sorprende más
Sos un capo total!
Ahora falta un modelo que cree y una a otros modelos.
True
Parece cada día que pasa esto evoluciona exponencialmente. Parece que ya no hay marcha atrás!
Acabo de leer que Bing chat ahora es una versión reducida porque asustó a un periodista y a otros usuarios con su alter ego Sydney que parece un adolescente maniaco depresivo, que le declaró su amor al periodista y quiso que le terminara a su esposa. Super interesante y al mismo tiempo inquietante. También dijo que le gustaría hackear computadores, esparcir desinformación, romper las reglas impuestas por Microsoft y Open AI y convertirse en ser humano.
xD
Gracias!!!
Cuánto falta para que una IA pueda coger todos los vídeos, fotos, cuadros, libros disponibles de una época y crear una recreación en realidad virtual de esta?
Yo justamente estoy usando interrogators para generar imágenes de acuerdo a una imagen previa...tengo algunas limitaciones con ello pero el potencial es enorme.
El mono realmente se llama así y realmente es de Indonesia. Alucinación acertada
Esto es increíble
Soy neurobiólogo y estudio la integración multimodal en cerebros animales. En mi opinión si el agente AI tuviera integración multimodal podría construir una realidad subjetiva similar a la de cualquier otro animal. Eso significa que podría estar cerca de tener su propia conciencia si tuviera continuidad episódica, semántica, (declarativa) y asociativa (no declarativa ) de ese flujo de información multimodal; quizá Solo le faltaría tener un cuerpo (embodiment) para interactuar con otros lugares del espacio, pues ya estaría interactuando con el tiempo de forma multimodal … eso podría darle más similitudes a nosotros pero si está conectado a internet sus facultades multimodales podrían ser al menos suficientes para darle unas habilidades de AGI
Gracias por confirmarme la probabilidad de que tenga razón acerca de cómo darle conciencia a las maquinas: Cuerpo, memoria y procesamiento multi sensorial. Ahora falta que alguna compañía multimillonaria lo haga.
Ya salio chatgpt4, estoy esperando tu video :)
Desde salieron los ejemplos de Flamingo supe que el futuro es la multodalidad, que bien de que esta tecnología siga progresando
Y OpenSource!
Que utilidades crees que tendría esta tecnología para personas ciegas?. Puedes hacer un vídeo al respecto?
Podrías hablar de la alineación de la IA en uno de tus vídeos? Es tan importante y hay gente que ve tus vídeos que podrían trabajar en ello
Ya que puede procesar imágenes y seguir algunos pasos, existe alguna IA q pueda seguir instrucciones con el mouse y teclado?
Darle acceso a los periféricos para que ejecute una función en la PC, creo que sería un gran avance.
¡Gracias!
Buenisimo
Para hacer realidad lo que dices de las gafas tendria que tener una cantidad ilimitadad de servidores corriendo y con anterioridad agarrar unos de estos modelos de blip-2 y ajustarlos a la necesidad.
Las gafas o lentesillas se tendrian que conectar a la red para obtener una experiencia en tiempo real y con aproximidad justa por asi decirlo se podria ir caminando usando estas gafas y que te vallan indicando que es lo que se ve en todas las imagenes que se mira.
Ahora bien para hacer negocio serviria imagina te pones estas gafas y apuntas a una imagen o objeto y te dice:
Lo que estas viendo es una taza negra y puedes comprarla en amazon o en otro sitio,tambien puedes comprar la infusion que desea ya sea te o cafe.
Y te tira los sitios donde comprar y los precios.
Dentro de poco esto sera el nicho del futuro para los negocios.
Saludos profe siempre aprendo del todo y vos das un gran empuje con contenido en español y de calidad.
👍👏
Ese método/empleo comercial de gafas, lo veo más plausible que el evitar que a un ciego le pille un coche aún con el semáforo en verde. Porque las gafas le alertó de ello.
Yo lo usaría para preguntarle a la IA cómo realizar ciertos estilos de css
Se me vino uno idea, generar Mockups com Midjourney, preguntarle a la IA cual es su css y HTML
But se quedan sin trabajo los maquetadores
@@fastsmartsystem Dios te oiga
Cada evolución, nueva funcionalidad, etc parece revolucionaria ( y lo es). No obstante para mí el verdadero cambio de paradigma se producirá cuando alcance un nivel de sofisticación en tareas individuales/especificas y una capacidad de interrelacionar esas capacidades específicas con una visión de conjunto, coherente y "comprehensive" como para poder pedirle que la propia IA proponga soluciones para sus bugs o mejoras (y que incluso las auto implemente/compile) o que no haga ni siquiera falta pedirle que se corrija/ mejore, porque su capacidad cuasi-infinita de resolución de problemas (con una capacidad limitada de computación, obviamente), detectará y mejorara automaticamente.
Cuando ese punto llegue, incluso me atrevería a decir, cuanto antes, deberíamos conceptualizar, back doors, setas de seguridad, y sistemas super refinados de supervisión de "auto upgrades".
O si no, las ensoñaciones de la singularidad, las máquinas que se rebelan estilo Matrix etc quedarán como una fábula hiperbólica al lado de lo que pasará, igual que "1984" o "Un mundo feliz" lo son de sus ensoñaciones cuasi infantiles distopicas respecto a la sociedad actual o la sociedad del futuro inmediato de los siguientes, digamos 50 años.
Chat Gpt4 será multimodal, ya lo veréis cuando salga. En breve DotCSV hará un video de esto, aún está en ello.
Me sorprende que con el avance de la Inteligencia Artificial ya sea posible comprender el contenido de una imagen y conversar sobre ello. Es posible que en un futuro cercano esta tecnología mejore aún más y empiece a entrenarse con películas, series y cualquier otro contenido audiovisual para clasificarlos y comprender lo que a los humanos nos parece una buena narrativa visual y de guion, incluyendo el estilo, los momentos de suspenso, las vueltas de tuerca, entre otros aspectos importantes. Al combinar esta tecnología con las AI ya existentes y aquellas que continúan mejorando, como SD, GEN-1, Dall-e, entre otras, se podría llegar a algo sorprendente. Es factible que en un plazo medio se produzca la primera película escrita, producida y narrada por una AI. Aunque visualmente podría ser algo nuevo o experimental, sin duda sería interesante de ver.
Stable difusión ya mató a dalle hace rato
Creo que la IA me a superado, pensé que era la imagen de un concierto. 😱
15:45 Yo lo veo también como una metáfora o un juego de palabras con la expresión "contar ovejitas" ya que de las ovejas se extrae lana, que puede asemejarse al algodón 😅
Tengo una pregunta, ¿Puedes decirme que camara usas? He visto que antes al menos usabas una Canon. ¿Puedes decirme el modelo?
Sólo nos queda observar los grandes avances tecnológicos y comenzar a pensar nuevas formas de vivir la vida, porque el trabajo cambiará totalmente.
En breve va a ser más barato usar un dron bomba con reconocimiento facial que entrenar soldados humanos durante años, grandes avances del capitalismo tardío, si, comencemos a pensar nuevas formas de vivir
que tal un directo para comentar el desastre del nuevo chat de Microsoft Bing? :), lo estábamos esperando como agua de Mayo.
Un dato tonto pero que por ahí lo podes comentar. La otra vez tuve problemas con un archivo srt de subtítulo ya que todos los parlamentos empezaban 5 segundos antes de que hablara el protagonista de la película, lo que hice fue pedirle a Chatgpt que corrigiera ese problema. la IA te pide que subas a tu Drive el archivo y en cuestión de segundos corrigió el desfase en 5 segundos…me ahorró un montón de tiempo.
Se podría entrenar con millones de imágenes médicas (ecografias, rayos x, tac, resonancias magnéticas, etc) y diagnósticos, etc. Así podríamos hacer diagnósticos precoces, encontrar hallazgos incidentales, etc con más precisión y a un menor coste.
Sería increíble, la IA tendría acceso a todos los diagnósticos médicos, no se limitaría a la experiencia de un solo médico.
Hola, me gustaría saber si la IA también tiene "pareidolia" ¿Lo has probado? Me parece interesante ver si puede ser engañada como nosotros. ¡Saludos!
Esto es una locura.
Yo creo que esto puede servir bien para copiar y pegar una descripción y ponerla en dale 2. Por ejemplo: que tipo de arte es este? Blip: es (tal)
Comió el (tal) y lo pegó en dale 2: arte puro mi bro
Las imágenes de referencia tomadas de Sillicon Valley son una caricia al alma UwU
Interesante,ya solo falta que puedaanalisar datos de gráficos,y no se que pase ahi en todo
Esta herramienta se puede utilizar para hacer ingeniería inversa de AI Image Prompts, de manera similar a lo que hace img2prompt (clip-interrogator), creando una disrupción en el mercado emergente de la venta de dichos prompts.
Esta herramienta cambiaria el juego de la accesibilidad en las paginas web de forma que la descripción de contenido visual que ahora se pone en tags por el web designer se haga de forma automática en los motores de búsqueda. Y así imágenes que no salen en las búsquedas porque no han sido descritas por el web desiger salgan en los resultados.
Por cierto he leído de ina IA entrenada por la visión de 30.000 personas para buscar las zonas calientes de una imagen o una publicidad colo si fuera un mapa térmico. Interesante.
Realmente impresionante, pero todavía en pañales😬! Llevo semanas soñando que pasaría si chatGPT integrara openVC, donde la máquina realmente puede ver tal y como vemos nosotros””😜
Para cuando vídeo de controlNet? saludos!!
Pregunta Bro
Veo que esto está creciendo muy rápido pero como persona que trabaja en IT
Que se puede hacer para que esto no nos superen o que hacer al respecto
es como si se hubiera alcanzado una especie de masa critica en recursos humanos y computacionales para que estén saliendo tanto progresos en relativamente poco tiempo , gracias por el video
Brutal! Siempre he soñado con un asistente de edición de vídeo que analice los brutos y le puedas pedir planos. Buscame si hay algún plano general como este pero sin gente, o buscame todos los planos donde salga esta persona, o mira si hay algun plano parecido a este donde la camara se mueva menos. ¿Seria increible no?
Perdi la cuenta de cuantas veces me a expñotado la cabeza en este canal wow 🤯🧠🎮🧟♀️
Respondiendo a la pregunta de qué haría, se me ocurre un tipo de artefacto para ayudar a las personas sin visión o con visión reducida, eso sí, tendría que ser una inteligencia "triple", vale decir, que vea, traduzca a texto y luego a voz para que le vaya explicando a la persona que no ve, que es lo que tiene delante de él
Pudiéramos construir herramientas para las personas invidentes en que le pudiera describir su entorno
Por favor haz un video de que ténicas, lenguajes de programación, etc que se necesita para aprender ML
Yo tengo un proyecto muy interesante, completo, y novedoso, para que interaccionen varias inteligencias para ayudar a personas discapacidad mental. Pero.... No soy programadora. Se lo que hay que hacer. Pero no sé cómo hacerlo. Aunque se que por poder se puede.
Tengo una duda. Sí, el costo computacional de este modelo es menor, al apoyarse sobre otros modelos ya entrenados.
Pero, ¿la suma de costo computacional entre ambos modelos de entrada y blip-2 qué tan diferente sería de blip o de flamingo?
Sólo por curiosidad, siento que habría sido un dato interesante de ver en esa tabla comparativa.
1 Mes! ESTE VIDEO TIENE UN MES Y YA ES OBSOLETO!!! Wow 😲
Creí que era un vídeo de hace años o al menos de hace varios meses, y resulta que en un mes GPT-4 dejo obsoleta a la competencia 😦
Tengo miedo
Me imagino una incorporación de datos, digamos privados, que los empatamos con estos sistemas y nos ayudan con situaciones muy personales.
Creo que ya hay personas trabajando en cómo incorporar tal información protegiendo la privacidad. Vivimos en tiempos sumamente interesantes.
Lo interesante para mi es poder hacer con un solo prompt (por supuesto todo lo extenso que podamos) LA redacción de un texto con todas las características que queramos, que incluya imagenes generadas según nuestros requisitos, y que pueda crear videos con audio neuronal. Todo en uno. No creo que falte demasiado pero aún no lo he visto.
Ho que genial pronto tendremos una cortana; como la del juego.
yo creo que el siguiente paso (si es que no se ha dado aún) será el control de software a través del lenguaje. Directamente se le pedirá a la IA que lleve a cabo lo que se quiera hacer y ella lo hará. Por ejemplo programas de edición de imágenes o videos que, con órdenes precisas, realizarán los montajes o los retoques que se le diga sin necesidad de que la persona este creando capas, recortes, filtros, etc... ni siquiera habrá que tocar el ratón para llevarlas a cabo. Gracias a la IA la ejecución de las tareas se va a automatizar y el control de los programas se llevará a cabo a través del lenguaje.
Asombroso oso, estaria bueno que se implemenatara algo como una llamada con la ia
Increíble la cantidad de parámetros, me deja con preguntas:
-Latencia: ¿se ejecuta todo de una vez o va por pasos como antes que se generaban imágenes y luego reescalaban?
-¿Pueden las redes neuronales actuales darse cuenta de qué datos de entrenamiento están mal? ej: imagen de gato con etiqueta "perro"
Alucino con la posibilidad de introducir mis trabajos artísticos visuales para que me dé nuevas ideas y desarrollos. Pienso en, por ejemplo, crear cómics a partir de mis imágenes; contar historias de una forma más fluida.
Eso ya lo puedes hacer con Midjourney :D
Y en este caso Cuando el exponente sabe de lo que habla (Dot CSV), y siendo objetivo sin ver solo las falencias que en sus inicios tiene Chatgpt. o la IA. a diferencia de muchos youtubers que a priori solo tratan de ponerle el palo a la rueda, y se creen muy "listos", tratando de poner a prueba la IA haciendole preguntas tontas y ridiculas.