¿Y si ChatGPT fuera una IA MULTIMODAL? (BLIP-2)

Поділитися
Вставка
  • Опубліковано 10 чер 2024
  • Subes una imagen a ChatGPT y le preguntas... ¿qué ves aquí? y usando perfectamente el lenguaje natural, te responde. O te compone un poema. O te hace una historia. Esto ya es posible gracias a tecnologías como BLIP-2 que consigue traer el concepto de multimodalidad a coste computacional mucho más reducido. Conectar varias fuentes de datos será el futuro de asistentes como ChatGPT, que próximamente permitirán analizar audio, imágenes o vídeos.
    ► BLIP-2 (Demo en HuggingFace)
    huggingface.co/spaces/Salesfo...
    ► BLIP-2 (Proyecto)
    arxiv.org/abs/2301.12597
    ► Salesforce LAVIS
    github.com/salesforce/LAVIS
    ► DeepMind Flamingo (Blog)
    www.deepmind.com/blog/tacklin...
    📹 EDICIÓN: Carlos Santana y Diego Gonzalez (Diocho)
    -- ¡MÁS DOTCSV! ---
    📣 NotCSV - ¡Canal Secundario!
    / notcsv
    💸 Patreon : / dotcsv
    👓 Facebook : / ai.dotcsv
    👾 Twitch!!! : / dotcsv
    🐥 Twitter : / dotcsv
    📸 Instagram : / dotcsv
    - ¡MÁS CIENCIA! --
    🔬 Este canal forma parte de la red de divulgación de SCENIO. Si quieres conocer otros fantásticos proyectos de divulgación entra aquí:
    scenio.es/colaboradores
  • Наука та технологія

КОМЕНТАРІ • 447

  • @DotCSV
    @DotCSV  Рік тому +114

    ¿Y vosotros, qué construiríais con esta herramienta? Deja un LIKE en el vídeo y me cuentas! 👀🔥

    • @solufinancieras
      @solufinancieras Рік тому

      Hola @DotCSV quisiera consultar algo, estuve entrenando la IA de SD con la guía que subiste a UA-cam, sin embargo al entrenar la IA con mis imágenes y solicitarle cualquier pedido, no importa el prompt que utilice, solo me arroja imágenes iguales a las entrenadas, QUÉ PUEDE SER?

    • @solufinancieras
      @solufinancieras Рік тому

      He intentado con menos pasos de entrenamiento y con más imágenes, sin embargo sigo teniendo el mismo error en el notebook de colab que habéis subido

    • @Valavirgillin
      @Valavirgillin Рік тому +2

      Pues ya ves, yo la conectaría al VAR para que fuera la IA la que decidiera y así evitar la "variable humana" 😉

    • @luishercules4651
      @luishercules4651 Рік тому

      Una pregunta como hiciste para de la IA te diera esa imagen.
      Cual fue el prompt porque quiero generar imágenes iguales

    • @kea.nu-metal4113
      @kea.nu-metal4113 Рік тому +2

      Yo construiría un ayudante terapéutico artificial para personas que no pueden encontrar ayuda, y el sistema tendría algo de humor que podría usar detectando el momento correcto para ello según la tonalidad de voz del consumidor.

  • @garygallagher6
    @garygallagher6 Рік тому +172

    Eres el único youtuber que realmente sabe de lo que habla con respecto a temas de IA. Todos tus videos son fascinantes, me alegro mucho de haber encontrado tu canal

    • @user-uq7pv3np3c
      @user-uq7pv3np3c Рік тому +4

      Ojalá hubiera más UA-camrs como este que hablen de una forma segura y profesional sin caer en las falacias y errores sobre la IA.

    • @garygallagher6
      @garygallagher6 Рік тому +1

      @@user-uq7pv3np3c Exacto tú sí sabes. Muchos youtubers solo se van por la tendencia y tratan de explicar un tema que ni siquiera ellos entienden.

    • @content1
      @content1 Рік тому

      Totalmente de acuerdo. El unico con autoridad. Y el primero. Cada vez que veo a otro youtuber hablando de ello sin saber me hace reír. Digo se han cansado ya de hablar de las criptomonedas.? jiji

    • @guero04
      @guero04 Рік тому +1

      No es el unico, pero si esta entre los mejores, no hay que menospreciar a otros tambien igual que Dot. en ayudarnos a cutivarnos en Inteligencia Artificial saludos.

    • @guero04
      @guero04 Рік тому

      @@content1 Hay varios buenos tambien, y Dot igual lo es y esta entre los mejores.

  • @savendark6632
    @savendark6632 Рік тому +153

    Me siento afortunado de ver los increíbles avances de la mano de este canal 🙏🙏

    • @nestrul1
      @nestrul1 Рік тому

      ¿eres una IA?

    • @savendark6632
      @savendark6632 Рік тому +2

      ​@@nestrul1De momento no puedo responder a tu pregunta. No dispongo de una respuesta preestablecida.

  • @gamusino78
    @gamusino78 Рік тому +22

    Presiento que tu canal va comenzar a crecer exponencialmente en los proximos meses...me alegro poder decir....."yo estuve aahi !!!"... en los comienzos de tu canal...
    y ver como en tan poco tiempo todo el tema IAs esta avanzando de una manera brutal....
    llevo todo el dia experimentando con GEN-1 y no doy credito a lo que ven mis ojos....

  • @franchutee5675
    @franchutee5675 Рік тому +27

    INCREIBLE! Cada que sale un video tuyo, me alegras el día Carlos, gracias. Apasionado por IA ando

  • @donrogerciano
    @donrogerciano Рік тому +12

    Recuerdo cuando hace 22 años que conoci las computadoras, pensaba que se les pedía que hicieran las cosas y las hacían...es curioso como luego entendí que se ocupaba hacer todo un procedimiento, pero ahora estamos llegando a esa época donde la computadora se está convirtiendo en lo que imaginaba de niño

  • @gottreux
    @gottreux Рік тому +4

    Trabajo en educación y estoy realmente muy abrumado por la enorme distancia que existen entre lo que está pasando y que tu magistralmente muestras y lo que se sigue haciendo por tantas décadas en las aulas. Hay siempre un tremendo desafío en lo que propones y que son sugerentes para activar a nuestros docentes y potenciar ciudadanos para el siglo XXI. Muchas gracias crack!

  • @nicolasguerra7718
    @nicolasguerra7718 Рік тому +5

    Gracias tío Dot por subir este tipo de contenido, siguiendo de cerca toda esta locura! Por mi parte yo utilizaría la IA para poder analizar los productos en las góndolas de los supermercados, que logre interpretar y clasificar las imágenes, como obtener el % de participación en góndola por producto vs la competencia, permanencia durante el tiempo (antigüedad), predecir futuros quiebres de stock, predicción de demanda, etc. Hay que aprovechar que esto está recién comenzando! MOVE FAST AND BREAK THINGS

  • @MrPianica
    @MrPianica Рік тому +3

    Lo probé! tambien te vi interactuando en Tik Tok. Yo te sigo desde hace mucho, gracias a vos soy analista de datos, tu divulgación es importante. Saludos desde Uruguay

  • @xaviertarratsamiel9555
    @xaviertarratsamiel9555 Рік тому +78

    ¿Podemos imaginar la interpretación de ecografias, radiografiats, imagenes relacionadas TAC, etc?

    • @WimerC10
      @WimerC10 Рік тому +13

      Es posible, tan solo habría que entrenar al modelo para que pueda hacerlo correctamente.

    • @Intocables
      @Intocables Рік тому +2

      Aunque el porcentaje de error sea alto, por en ejemplo, en la detección de cancer o tumores malignos

    • @moijuarez2275
      @moijuarez2275 Рік тому +2

      La cantidad de información que hay en ese tipo de imágenes es muy elevado, por lo que es posible que se requiera de un mayor número de entrenamiento para la ia.

    • @guidodinello1369
      @guidodinello1369 Рік тому +5

      Esto occurre hace ya un tiempo y de hecho en ocasiones la capacidad de prediccion basada en las imagenes superaba la de especialistas

    • @samuelesquercastro
      @samuelesquercastro Рік тому +4

      Como dice ​@@guidodinello1369, de hecho a veces un especialista puede fallar en el 80% de los casos, aunque una ia tuviese el 60% de aciertos como Blip-2, el acierto sería mucho mayor al de varios especialistas

  • @ariarc
    @ariarc Рік тому +1

    Ni alcanzaba a llegar a una fracción de conclusión de este video y tanto este como su creador me han captado. Me he convertido en seguidor inmediato. Felicidades por el gran trabajo.

  • @danieldelarosa810
    @danieldelarosa810 Рік тому +2

    Siguen integrando capacidades cognitivas sofisticadas en una lata... sintiendose tranquilos de que solo es una herramienta. Nuestros sentidos y mecanismos de integracion tambien son herramientas... y en nuestro cerebro se tornan "conciencia" sin que sepamos aun como. ¿Cual es la necesidad de crear un engendro de silicio en el cual el fenomeno emergente de la conciencia no tardara en manifestarse???. Por cierto... no soy un hater... ni un fanatico religioso... amo la ciencia y la tecnologia, pero estamos jugando con un fuego que no sabemos como se origina ni como extinguir... Nuestra propia necesidad de sentirnos Dioses. Te felicito por tu canal y tus videos Carlos, te veo desde el primer dia, al igual que a tantos otros como Crespo, Javi, Marti, Aldo y muchos mas. GRACIAS por brindarnos la informacion y el entendimiento de todos estos maravillosos y espeluznantes avances en la ciencia y tecnologia... a la vez que nos estan aconteciendo en tiempo real. Somos testigos (¿afortunados?) del mayor cambio en la historia de la humanidad.

  • @alejandro_hierro
    @alejandro_hierro Рік тому +7

    Unas gafas para gente ciega que contengan camaras que analicen las imagenes de lo que esta pasando a su alrededor y se conectan a auriculares con microfono y la persona ciega puede escuchar lo que le describe las gafas y tambien puede hacerle preguntas todo en tiempo real, que le vaya avisando a la persona por ejemplo si se esta por topar con una pared o si esta por llegar hasta el fin de la cuadra antes de toparse con la calle y saber en que momento poder cruzar sin que le pise un auto

    • @alrimvt02
      @alrimvt02 Рік тому

      seria de mucha ayuda para esas personas

    • @robotvivo5158
      @robotvivo5158 Рік тому

      buena idea bro.

    • @LA.GALERNA
      @LA.GALERNA Рік тому

      El mundo de la discapacidad está lleno de corrupción e intereses ocultos. No será empleado para dicho fin.

  •  Рік тому +16

    Creo que en el futuro las IA relatarán partidos de fútbol, carreras de Fórmula 1, etc... no sería nada loco...

    • @SebaBuenoHaceMusiquitaJijiji
      @SebaBuenoHaceMusiquitaJijiji Рік тому +1

      Si en el futuro siguen existiendo esos deportes como prioridad, sería algo monótono, no veo qué tanto nuevo tienen que entregar en 100 años que no hayan entregado ya, excepto que cambien las reglas que ya son algo aburridas. Falta un fútbol volando sobre el agua, carreras de drones tuneados en canchas con hologramas y luces led, mma espacial. Pero fútbol? Carreras de autos? No sé tú, pero yo desde el 2010 que no veo nada nuevo que tengan que entregar y los boicoteo activamente

    • @fernandoquiroga9061
      @fernandoquiroga9061 Рік тому

      ​@@SebaBuenoHaceMusiquitaJijiji Lastimosamente el fútbol se está volviendo cada vez menos vistoso. Se dice que la FIFA creará una "superliga" con los mejores equipos del mundo, a modo de eliminatoria.

    • @xavirex4153
      @xavirex4153 Рік тому

      Antonio Lobato en IA

  • @solecipollari
    @solecipollari Рік тому

    Asistente para personas con limitaciones visuales es el mejor uso que se me ocurre. Como herramienta científica para buscar "objetividad". Para control del tránsito e infracciones.

  • @oscarltbro6808
    @oscarltbro6808 Рік тому +2

    Digamos que la inteligencia artificial es tan buena detectando humor y emociones de animales que las traduce a idioma humano, se imaginan que en tiempo real grabes a tu mascota y la inteligencia saque una voz que diga casi con exactitud lo que tu perro está diciendo o tratando de transmitir.

  • @dumstain13
    @dumstain13 Рік тому

    Eres un grande DotCSV, en el futuro cercano puedo ver tu canal creciendo estrepitosamente gracias a tu contenido de calidad y el auge de las IA

  • @SUPERVAN666
    @SUPERVAN666 Рік тому +4

    Hace unas horas usando Microsoft Edge (en celular) por VER sus nuevos motores de búsqueda por IA: Encontré la información , Saqué un screenshot de la búsqueda y enseguida me apareció una notificación de "autorizar acceso a mis fotografías", Viendo las posibilidades suena interesante, pero a mí me pareció intrusivo y peligroso en ese momento. El darle acceso a mis imágenes a Microsoft Edge.

  • @ernestoaquino8086
    @ernestoaquino8086 Рік тому +5

    Que genial, y esto ya lo pensaba hace unos años me encanta saber que haya gente haciéndolo ya, por qué yo sigo aprendiendo programación jajaja😌😊

  • @Gamma3
    @Gamma3 Рік тому +1

    Que buen video Carlos. Un abrazo

  • @joseramon-5138
    @joseramon-5138 Рік тому +2

    Siendo el texto el corazón de la comunicación, Whisper(oido), Vall-e (voz) , blip 2 (visión) y GPT3 y ya con ....music ml, stable diffusion
    Un agente capaz de expresar y gestionar información de una forma brutal, si en Palm, por ejemplo surgieron nuevas capacidades emergentes, que capacidades no podrán surgir en un ente con tantos "sentidos" como se quiera/pueda computar.
    Ilusiona, abruma y da hasta cierto recelo.
    Ojalá todo esto se use con su máximo desempeño en genética , biomedicina y salúd.
    La máquina de curación de la película elisyum sería menos fantásiosa con el tiempo

  • @oswaldocruz5620
    @oswaldocruz5620 Рік тому

    Excelente video, muy informativo y divertido al mismo tiempo.

  • @pictorres
    @pictorres Рік тому

    Ya decía yo que parte de este video lo había visto antes, y como mencionaste al final es un fragmento de un directo. Gracias por aclararlo, me habría quedado con esa duda jajaja

  • @sunbreeze9142
    @sunbreeze9142 Рік тому +1

    Nunca me pierdo ningún video tuyo, maestro

  • @Nicolas-xt3mi
    @Nicolas-xt3mi Рік тому +1

    Muchas gracias dot por hacer estos vídeos!!

  • @ahoraparchis
    @ahoraparchis Рік тому +3

    Pienso que llegado el momento, podría estar parametrizado todo el comportamiento humano, y por ende predecir cómo reaccionará cada persona a cada evento. Así podríamos introducir toda la vida y obra de algún artista, que haya sido el mejor de la historia en su disciplina, véase como ejemplos Mozart, Shakespeare o Da Vinci, para continuar con su obra y no me refiero a cosas como terminar alguna canción, que eso ya se ha hecho. Me refiero un personaje virtual que pudiésemos tener un muy alto nivel de fiabilidad que se comportaría así.
    ¿Qué haría Amadeus con una mesa de mezclas? 🤯
    ¿Pillarían Royalties los herederos? 💸
    Película musical con María Calas y Freddie Mercury, dirigida por Da Vinci, guionizada por Shakespeare y banda sonora de Mozart. (no existe emoji para describir ésta emoción)
    Gracias por el vídeo.

  • @ulikity
    @ulikity Рік тому

    te amo loco no dejes de hacer estos videos

  • @EdwinAr
    @EdwinAr Рік тому +1

    15:00 esa imagen es un meme y ya sabía que es un campo de algodón
    Me agrada más el entusiasmo que le pones al hacer el video que la tecnología explicada en el, creo que es un paso natural la unión de esas tecnologías.
    Espero que llegue la tecnología sin fallas m, sin bloqueos, sin sesgos

  • @mrbobcr
    @mrbobcr Рік тому

    Gran contenido como siempre. Estamos cada vez más cerca de una Sinestes-IA *PLOP*

  • @tarabore
    @tarabore Рік тому +3

    Me recuerda a la funcionalidad que existe en Facebook hace varios años para construir automáticamente la descripción de las fotos tanto para personas con dificultades visuales como cuando hay problemas de carga de imágenes (expone solo la descripción textual)

  • @doctorsueno2505
    @doctorsueno2505 Рік тому

    Gracias por compartir.

  • @arlangutierrez
    @arlangutierrez Рік тому +1

    3:27 "Dot CSV En Lencería" 😂😂

  • @Andersson5d
    @Andersson5d Рік тому

    Gracias por el contenido!

  • @educacionBM
    @educacionBM Рік тому

    Esto si es información útil y valiosa

  • @guillermodaniel4859
    @guillermodaniel4859 Рік тому

    Impresionante!

  • @RuloGames1
    @RuloGames1 Рік тому

    Gracias!! Por todo !

  • @mattsanto_
    @mattsanto_ Рік тому

    sos un crack explicando! te admiro

  • @matiasbrollo6871
    @matiasbrollo6871 Рік тому

    Ya lo probé, le mostré una imagen de crespo y se quedó sin palabras. Creo que no lo han entrenado con un conjunto de datos lo suficientemente bellas.

  • @ZadkielDower
    @ZadkielDower Рік тому

    wow me estoy poniendo al día y es que la IA está que arde 🔥... respecto a ideas de IA, a mí me gusta la programación y el dibujo, siempre he pensado en una herramienta que posibilite el dibujar en pantalla, como lo hace actualmente la app de escritorio de WSP, e ingresar texto ya sean preguntas pedir descripciones y más cosas... seria genial escribirle y que en tiempo real dibuje solo con línea y color... ahora que recuerdo quickdraw se llama una en la cual vas dibujando y la IA va adivinando que estas dibujando, pero primero ponen que dibujar luego dibujas lo que te piden y nada más.

  • @fuiel1ensaberlo
    @fuiel1ensaberlo Рік тому

    Sistemas de enseñanza y apoyo al docente, muy potentes, personalizando la enseñanza para cada individuo.

  • @yairsarmiento9917
    @yairsarmiento9917 Рік тому

    ¡Me siento Emocionado & Temeroso a la vez!
    Emocionado; por los avances tecnológicos que cada vez más nos facilitan la vida si los sabemos aprovechar y.
    Temeroso; por qué cada día estamos más cerca de una skainet

  • @mauriciolugo6239
    @mauriciolugo6239 Рік тому

    Excelente video !!!

  • @guero04
    @guero04 Рік тому

    Hola Dot muchas gracias, tu siempre eres el primero en traernos las novedades de Inteligencia Artificial este me gusto porque esta sencillo, tuve la ocurrencia de preguntar por la imagen de una persona en su rostro que caracter refleja y fijate que si la dijo...que sea real no se todavia no la conozco bien a la persona..tal vez esto un dia revele el interior de las personas y saber si dicen la verdad o no . jejeee...saludos :)

  • @puratecnologia8430
    @puratecnologia8430 Рік тому

    Great video!

  • @monsieur910
    @monsieur910 Рік тому

    Esto cada día me sorprende más

  • @germangioffre
    @germangioffre Рік тому

    Sos un capo total!

  • @javiercoronado6424
    @javiercoronado6424 Рік тому +6

    Ahora falta un modelo que cree y una a otros modelos.

  • @JL-sy2me
    @JL-sy2me Рік тому +1

    Parece cada día que pasa esto evoluciona exponencialmente. Parece que ya no hay marcha atrás!

  • @foreropa
    @foreropa Рік тому +2

    Acabo de leer que Bing chat ahora es una versión reducida porque asustó a un periodista y a otros usuarios con su alter ego Sydney que parece un adolescente maniaco depresivo, que le declaró su amor al periodista y quiso que le terminara a su esposa. Super interesante y al mismo tiempo inquietante. También dijo que le gustaría hackear computadores, esparcir desinformación, romper las reglas impuestas por Microsoft y Open AI y convertirse en ser humano.

  • @parkin09kinder
    @parkin09kinder Рік тому

    Gracias!!!

  • @joancarlestomas
    @joancarlestomas Рік тому +4

    Cuánto falta para que una IA pueda coger todos los vídeos, fotos, cuadros, libros disponibles de una época y crear una recreación en realidad virtual de esta?

  •  Рік тому +1

    Yo justamente estoy usando interrogators para generar imágenes de acuerdo a una imagen previa...tengo algunas limitaciones con ello pero el potencial es enorme.

  • @JECC8834
    @JECC8834 Рік тому +1

    El mono realmente se llama así y realmente es de Indonesia. Alucinación acertada

  • @dainco08
    @dainco08 Рік тому +1

    Esto es increíble

  • @os2171
    @os2171 Рік тому +1

    Soy neurobiólogo y estudio la integración multimodal en cerebros animales. En mi opinión si el agente AI tuviera integración multimodal podría construir una realidad subjetiva similar a la de cualquier otro animal. Eso significa que podría estar cerca de tener su propia conciencia si tuviera continuidad episódica, semántica, (declarativa) y asociativa (no declarativa ) de ese flujo de información multimodal; quizá Solo le faltaría tener un cuerpo (embodiment) para interactuar con otros lugares del espacio, pues ya estaría interactuando con el tiempo de forma multimodal … eso podría darle más similitudes a nosotros pero si está conectado a internet sus facultades multimodales podrían ser al menos suficientes para darle unas habilidades de AGI

    • @axolotron1298
      @axolotron1298 Рік тому

      Gracias por confirmarme la probabilidad de que tenga razón acerca de cómo darle conciencia a las maquinas: Cuerpo, memoria y procesamiento multi sensorial. Ahora falta que alguna compañía multimillonaria lo haga.

  • @elias-san3767
    @elias-san3767 Рік тому

    Ya salio chatgpt4, estoy esperando tu video :)

  • @joelcoll4034
    @joelcoll4034 Рік тому

    Desde salieron los ejemplos de Flamingo supe que el futuro es la multodalidad, que bien de que esta tecnología siga progresando

  • @rasuvire
    @rasuvire Рік тому +4

    Que utilidades crees que tendría esta tecnología para personas ciegas?. Puedes hacer un vídeo al respecto?

  • @Scott_Raynor
    @Scott_Raynor Рік тому +1

    Podrías hablar de la alineación de la IA en uno de tus vídeos? Es tan importante y hay gente que ve tus vídeos que podrían trabajar en ello

  • @waxy3220
    @waxy3220 Рік тому +3

    Ya que puede procesar imágenes y seguir algunos pasos, existe alguna IA q pueda seguir instrucciones con el mouse y teclado?
    Darle acceso a los periféricos para que ejecute una función en la PC, creo que sería un gran avance.

  • @georgesgranger2961
    @georgesgranger2961 Рік тому

    ¡Gracias!

  • @arielcurra7647
    @arielcurra7647 Рік тому

    Buenisimo

  • @qbitscondiasalterados5891
    @qbitscondiasalterados5891 Рік тому

    Para hacer realidad lo que dices de las gafas tendria que tener una cantidad ilimitadad de servidores corriendo y con anterioridad agarrar unos de estos modelos de blip-2 y ajustarlos a la necesidad.
    Las gafas o lentesillas se tendrian que conectar a la red para obtener una experiencia en tiempo real y con aproximidad justa por asi decirlo se podria ir caminando usando estas gafas y que te vallan indicando que es lo que se ve en todas las imagenes que se mira.
    Ahora bien para hacer negocio serviria imagina te pones estas gafas y apuntas a una imagen o objeto y te dice:
    Lo que estas viendo es una taza negra y puedes comprarla en amazon o en otro sitio,tambien puedes comprar la infusion que desea ya sea te o cafe.
    Y te tira los sitios donde comprar y los precios.
    Dentro de poco esto sera el nicho del futuro para los negocios.
    Saludos profe siempre aprendo del todo y vos das un gran empuje con contenido en español y de calidad.
    👍👏

    • @LA.GALERNA
      @LA.GALERNA Рік тому

      Ese método/empleo comercial de gafas, lo veo más plausible que el evitar que a un ciego le pille un coche aún con el semáforo en verde. Porque las gafas le alertó de ello.

  • @AdrianAcurero
    @AdrianAcurero Рік тому +13

    Yo lo usaría para preguntarle a la IA cómo realizar ciertos estilos de css

    • @nickysalazar1418
      @nickysalazar1418 Рік тому +1

      Se me vino uno idea, generar Mockups com Midjourney, preguntarle a la IA cual es su css y HTML

    • @fastsmartsystem
      @fastsmartsystem Рік тому

      But se quedan sin trabajo los maquetadores

    • @AdrianAcurero
      @AdrianAcurero Рік тому

      @@fastsmartsystem Dios te oiga

  • @_BKKB_
    @_BKKB_ Рік тому

    Cada evolución, nueva funcionalidad, etc parece revolucionaria ( y lo es). No obstante para mí el verdadero cambio de paradigma se producirá cuando alcance un nivel de sofisticación en tareas individuales/especificas y una capacidad de interrelacionar esas capacidades específicas con una visión de conjunto, coherente y "comprehensive" como para poder pedirle que la propia IA proponga soluciones para sus bugs o mejoras (y que incluso las auto implemente/compile) o que no haga ni siquiera falta pedirle que se corrija/ mejore, porque su capacidad cuasi-infinita de resolución de problemas (con una capacidad limitada de computación, obviamente), detectará y mejorara automaticamente.
    Cuando ese punto llegue, incluso me atrevería a decir, cuanto antes, deberíamos conceptualizar, back doors, setas de seguridad, y sistemas super refinados de supervisión de "auto upgrades".
    O si no, las ensoñaciones de la singularidad, las máquinas que se rebelan estilo Matrix etc quedarán como una fábula hiperbólica al lado de lo que pasará, igual que "1984" o "Un mundo feliz" lo son de sus ensoñaciones cuasi infantiles distopicas respecto a la sociedad actual o la sociedad del futuro inmediato de los siguientes, digamos 50 años.

  • @pixelinitrate
    @pixelinitrate Рік тому

    Chat Gpt4 será multimodal, ya lo veréis cuando salga. En breve DotCSV hará un video de esto, aún está en ello.

  • @Valorodrigo
    @Valorodrigo Рік тому +11

    Me sorprende que con el avance de la Inteligencia Artificial ya sea posible comprender el contenido de una imagen y conversar sobre ello. Es posible que en un futuro cercano esta tecnología mejore aún más y empiece a entrenarse con películas, series y cualquier otro contenido audiovisual para clasificarlos y comprender lo que a los humanos nos parece una buena narrativa visual y de guion, incluyendo el estilo, los momentos de suspenso, las vueltas de tuerca, entre otros aspectos importantes. Al combinar esta tecnología con las AI ya existentes y aquellas que continúan mejorando, como SD, GEN-1, Dall-e, entre otras, se podría llegar a algo sorprendente. Es factible que en un plazo medio se produzca la primera película escrita, producida y narrada por una AI. Aunque visualmente podría ser algo nuevo o experimental, sin duda sería interesante de ver.

  • @SHARLISHARLI
    @SHARLISHARLI Рік тому +1

    Creo que la IA me a superado, pensé que era la imagen de un concierto. 😱

  • @albertsallent
    @albertsallent Рік тому

    15:45 Yo lo veo también como una metáfora o un juego de palabras con la expresión "contar ovejitas" ya que de las ovejas se extrae lana, que puede asemejarse al algodón 😅

  • @emilio4774
    @emilio4774 Рік тому

    Tengo una pregunta, ¿Puedes decirme que camara usas? He visto que antes al menos usabas una Canon. ¿Puedes decirme el modelo?

  • @theburnjam4913
    @theburnjam4913 Рік тому +1

    Sólo nos queda observar los grandes avances tecnológicos y comenzar a pensar nuevas formas de vivir la vida, porque el trabajo cambiará totalmente.

    • @RuloGames1
      @RuloGames1 Рік тому +1

      En breve va a ser más barato usar un dron bomba con reconocimiento facial que entrenar soldados humanos durante años, grandes avances del capitalismo tardío, si, comencemos a pensar nuevas formas de vivir

  • @46557200
    @46557200 Рік тому

    que tal un directo para comentar el desastre del nuevo chat de Microsoft Bing? :), lo estábamos esperando como agua de Mayo.

  • @Nicolasfaziob
    @Nicolasfaziob Рік тому

    Un dato tonto pero que por ahí lo podes comentar. La otra vez tuve problemas con un archivo srt de subtítulo ya que todos los parlamentos empezaban 5 segundos antes de que hablara el protagonista de la película, lo que hice fue pedirle a Chatgpt que corrigiera ese problema. la IA te pide que subas a tu Drive el archivo y en cuestión de segundos corrigió el desfase en 5 segundos…me ahorró un montón de tiempo.

  • @forifdeflais2051
    @forifdeflais2051 Рік тому +1

    Se podría entrenar con millones de imágenes médicas (ecografias, rayos x, tac, resonancias magnéticas, etc) y diagnósticos, etc. Así podríamos hacer diagnósticos precoces, encontrar hallazgos incidentales, etc con más precisión y a un menor coste.

    • @dainco08
      @dainco08 Рік тому +1

      Sería increíble, la IA tendría acceso a todos los diagnósticos médicos, no se limitaría a la experiencia de un solo médico.

  • @carlosmillan2295
    @carlosmillan2295 Рік тому +2

    Hola, me gustaría saber si la IA también tiene "pareidolia" ¿Lo has probado? Me parece interesante ver si puede ser engañada como nosotros. ¡Saludos!

  • @adamrd210
    @adamrd210 Рік тому

    Esto es una locura.

  • @iyvuguugouvuvul
    @iyvuguugouvuvul Рік тому

    Yo creo que esto puede servir bien para copiar y pegar una descripción y ponerla en dale 2. Por ejemplo: que tipo de arte es este? Blip: es (tal)
    Comió el (tal) y lo pegó en dale 2: arte puro mi bro

  • @arnoldardila1747
    @arnoldardila1747 Рік тому

    Las imágenes de referencia tomadas de Sillicon Valley son una caricia al alma UwU

  • @juanburgos9449
    @juanburgos9449 Рік тому +2

    Interesante,ya solo falta que puedaanalisar datos de gráficos,y no se que pase ahi en todo

  • @edgarmedrano2562
    @edgarmedrano2562 Рік тому

    Esta herramienta se puede utilizar para hacer ingeniería inversa de AI Image Prompts, de manera similar a lo que hace img2prompt (clip-interrogator), creando una disrupción en el mercado emergente de la venta de dichos prompts.

  • @content1
    @content1 Рік тому

    Esta herramienta cambiaria el juego de la accesibilidad en las paginas web de forma que la descripción de contenido visual que ahora se pone en tags por el web designer se haga de forma automática en los motores de búsqueda. Y así imágenes que no salen en las búsquedas porque no han sido descritas por el web desiger salgan en los resultados.
    Por cierto he leído de ina IA entrenada por la visión de 30.000 personas para buscar las zonas calientes de una imagen o una publicidad colo si fuera un mapa térmico. Interesante.

  • @PacoGPT
    @PacoGPT Рік тому

    Realmente impresionante, pero todavía en pañales😬! Llevo semanas soñando que pasaría si chatGPT integrara openVC, donde la máquina realmente puede ver tal y como vemos nosotros””😜
    Para cuando vídeo de controlNet? saludos!!

  • @larcsoul227
    @larcsoul227 Рік тому

    Pregunta Bro
    Veo que esto está creciendo muy rápido pero como persona que trabaja en IT
    Que se puede hacer para que esto no nos superen o que hacer al respecto

  • @jorgegalindo658
    @jorgegalindo658 Рік тому

    es como si se hubiera alcanzado una especie de masa critica en recursos humanos y computacionales para que estén saliendo tanto progresos en relativamente poco tiempo , gracias por el video

  • @carlesmora8351
    @carlesmora8351 Рік тому

    Brutal! Siempre he soñado con un asistente de edición de vídeo que analice los brutos y le puedas pedir planos. Buscame si hay algún plano general como este pero sin gente, o buscame todos los planos donde salga esta persona, o mira si hay algun plano parecido a este donde la camara se mueva menos. ¿Seria increible no?

  • @thepumperkevin7
    @thepumperkevin7 Рік тому

    Perdi la cuenta de cuantas veces me a expñotado la cabeza en este canal wow 🤯🧠🎮🧟‍♀️

  • @fabianitalorodriguezdonoso8340

    Respondiendo a la pregunta de qué haría, se me ocurre un tipo de artefacto para ayudar a las personas sin visión o con visión reducida, eso sí, tendría que ser una inteligencia "triple", vale decir, que vea, traduzca a texto y luego a voz para que le vaya explicando a la persona que no ve, que es lo que tiene delante de él

  • @louistocasoft316
    @louistocasoft316 Рік тому +1

    Pudiéramos construir herramientas para las personas invidentes en que le pudiera describir su entorno

  • @audiencianacional4385
    @audiencianacional4385 Рік тому

    Por favor haz un video de que ténicas, lenguajes de programación, etc que se necesita para aprender ML

  • @LA.GALERNA
    @LA.GALERNA Рік тому +3

    Yo tengo un proyecto muy interesante, completo, y novedoso, para que interaccionen varias inteligencias para ayudar a personas discapacidad mental. Pero.... No soy programadora. Se lo que hay que hacer. Pero no sé cómo hacerlo. Aunque se que por poder se puede.

  • @rafaelgraterol6908
    @rafaelgraterol6908 Рік тому

    Tengo una duda. Sí, el costo computacional de este modelo es menor, al apoyarse sobre otros modelos ya entrenados.
    Pero, ¿la suma de costo computacional entre ambos modelos de entrada y blip-2 qué tan diferente sería de blip o de flamingo?
    Sólo por curiosidad, siento que habría sido un dato interesante de ver en esa tabla comparativa.

  • @jRafael8a
    @jRafael8a Рік тому +2

    1 Mes! ESTE VIDEO TIENE UN MES Y YA ES OBSOLETO!!! Wow 😲
    Creí que era un vídeo de hace años o al menos de hace varios meses, y resulta que en un mes GPT-4 dejo obsoleta a la competencia 😦
    Tengo miedo

  • @luisortega7028
    @luisortega7028 Рік тому +9

    Me imagino una incorporación de datos, digamos privados, que los empatamos con estos sistemas y nos ayudan con situaciones muy personales.
    Creo que ya hay personas trabajando en cómo incorporar tal información protegiendo la privacidad. Vivimos en tiempos sumamente interesantes.

  • @Owriel
    @Owriel Рік тому

    Lo interesante para mi es poder hacer con un solo prompt (por supuesto todo lo extenso que podamos) LA redacción de un texto con todas las características que queramos, que incluya imagenes generadas según nuestros requisitos, y que pueda crear videos con audio neuronal. Todo en uno. No creo que falte demasiado pero aún no lo he visto.

  • @rholanoswaldo
    @rholanoswaldo Рік тому

    Ho que genial pronto tendremos una cortana; como la del juego.

  • @aleoncrypto506
    @aleoncrypto506 Рік тому

    yo creo que el siguiente paso (si es que no se ha dado aún) será el control de software a través del lenguaje. Directamente se le pedirá a la IA que lleve a cabo lo que se quiera hacer y ella lo hará. Por ejemplo programas de edición de imágenes o videos que, con órdenes precisas, realizarán los montajes o los retoques que se le diga sin necesidad de que la persona este creando capas, recortes, filtros, etc... ni siquiera habrá que tocar el ratón para llevarlas a cabo. Gracias a la IA la ejecución de las tareas se va a automatizar y el control de los programas se llevará a cabo a través del lenguaje.

  • @Djoako22
    @Djoako22 Рік тому

    Asombroso oso, estaria bueno que se implemenatara algo como una llamada con la ia

  • @JorgetePanete
    @JorgetePanete Рік тому +1

    Increíble la cantidad de parámetros, me deja con preguntas:
    -Latencia: ¿se ejecuta todo de una vez o va por pasos como antes que se generaban imágenes y luego reescalaban?
    -¿Pueden las redes neuronales actuales darse cuenta de qué datos de entrenamiento están mal? ej: imagen de gato con etiqueta "perro"

  • @estudiantedeciclos5973
    @estudiantedeciclos5973 Рік тому +1

    Alucino con la posibilidad de introducir mis trabajos artísticos visuales para que me dé nuevas ideas y desarrollos. Pienso en, por ejemplo, crear cómics a partir de mis imágenes; contar historias de una forma más fluida.

    • @DMaturana
      @DMaturana Рік тому +1

      Eso ya lo puedes hacer con Midjourney :D

  • @macariosanchez5640
    @macariosanchez5640 Рік тому

    Y en este caso Cuando el exponente sabe de lo que habla (Dot CSV), y siendo objetivo sin ver solo las falencias que en sus inicios tiene Chatgpt. o la IA. a diferencia de muchos youtubers que a priori solo tratan de ponerle el palo a la rueda, y se creen muy "listos", tratando de poner a prueba la IA haciendole preguntas tontas y ridiculas.