¡La IA de Meta que quiere COMBINARLO TODO! (contado por otra IA)
Вставка
- Опубліковано 27 тра 2023
- Imagínate una IA capaz de combinar imágenes, con audio, texto, imágenes de profundidad o mapas de calor. Todo en un misma IA llamada ImageBind que nos permitirá armar buscadores mucho más avanzados o aplicaciones fascinantes como generar imágenes a partir de audios. Todo esto es lo que la nueva IA de Meta puede hacer.
Meta ImageBind (Web)
imagebind.metademolab.com
📹 EDICIÓN: Carlos Santana y Diego Gonzalez (Diocho)
-- ¡MÁS DOTCSV! ---
📣 NotCSV - ¡Canal Secundario!
/ notcsv
💸 Patreon : / dotcsv
👓 Facebook : / ai.dotcsv
👾 Twitch!!! : / dotcsv
🐥 Twitter : / dotcsv
📸 Instagram : / dotcsv
- ¡MÁS CIENCIA! --
🔬 Este canal forma parte de la red de divulgación de SCENIO. Si quieres conocer otros fantásticos proyectos de divulgación entra aquí:
scenio.es/colaboradores - Наука та технологія
¿Entonces...? ¿Jubilamos al DotCSV de carne y hueso?
JAJAJ QUEDA BUENISIMO, lo unico que apenas le fqlla es la voz, es como mas fina y robotica, pero se siente que es tuya
Espera.... Y si siempre fuiste tú el Digital Twin?? 🧐
No, aun le falta más humanidad.
Está muy mal aún, se siente plano.
Ni de coña, es aburridísimo escuchar un tono tan plano y carente de emoción...😅
Ya que nos pones a tu avatar al menos ponle pelo.
😂😂😂
Buena 😅
😂😂😂
le puede poner un mohawk? 😆
@@370.y wooosh
Wow, esto es increible. Aun no nos damos cuenta hasta donde podran llegar las IAs... Prefiero al DotCSV de verdad pero es extremadamente increible lo que se ha desarrollado la IA en tan solo unos meses... Bravo Dot!!
ua-cam.com/video/12_c7-eL7Cc/v-deo.html
Supongo que como todo, van a llegar donde diga Don Dinero....
Está super bien la IA, pero me encanta la variación de tonos de tú voz, me hace prestar más atención
me pasó lo mismo! y uno no se da cuenta de la importancia de la entonación hasta que vemos estos ejemplos.
Es el problema actual, la comunicación por voz no es solamente pronunciar bien sino entonar y variar el timbre dependiendo de la información que queremos transmitir y dónde, cuándo y cómo reforzar la información utilizando las variaciones.. ahí está lo divertido, desarrollar algo que no se pueda distinguir.. 😁
Soy el único que escucha como eco en su voz??? Será que cuando grabó su voz la IA aprendió a imitar el eco como parte de su voz??? Jajaja
@@miguelangel-nj8cqlo mismo pensé jajaja
@@makhumapogoNo sera raro que la siguiente semana salga una ia que pongas un input como por ejemplo : Expocicion y te ajuste los tonos y timbres de la voz ia
Para muchos este es el mejor canal que explica la IA.
junto con el tio RingaTech
que fuerte... porque me encanta el tema, pero me fue super dificil concentrarme y mantener el engagement con el video. A alguien más le paso?
si, a mi, debe ser por la voz falsa xd
me cuesta aguantar la voz falsa.
Ya hay sistemas que pueden cambiar velocidad y entonación del texto... Falta una IA que adjudique al texto la emoción correcta en base al contexto. Es como si tuviéramos un montón de frutas verdes y solo hay que esperar a que maduren un poco más algunas para hacer una buena ensalada de frutas.
Se volvió aburrido más rápidamente
x6
el vídeo ha conseguido que entienda la base de algo tan complejo como las redes neuronales en unos pocos minutos. haces una labor de divulgación increíble, gracias
Cuando la IA coja CONSCIENCIA y pueda ser RESPONSABLE de sus actos, nadie podrá ya detenerla...
Esperemos que esto no ocurra. 😙
¡Así es que Meta se está metiendo en el juego full!
Que herramienta tan potente está creando Meta y que lo muestre a la comunidad, muy bien por ellos. Y muy buen vídeo jaja aunque hace falta esos acentos que dan esas emociones. La voz suena muy seria, pero estuvo curioso el ejercicio
El mejor video de .csv
Nunca lo vi tan cómodo frente a la cámara y tan expresivo al hablar.
¡¡Qué alegría ver como nunca deja de mejorar!!
es maravilloso, me siento como cuando antes del 2000 había que conocer los conceptos para conectarte a internet y ahora está al alcance de la mano en un teléfono
Excelente como siempre!! gracias por toda la data!
Muy crack Dot CSV. Este video la rompe!!!
Me voló la cabeza pensar que este modelo de video podria ser el futuro de youtube. No digo que todo el contenido sea visualmente generado por IA, pero si una buena cantidad. Como siempre, excelente tus videos.
Considera que ya hay cadenas de información en algunos países cuyos noticieros,, ya los dan IAs, con el estilo de alguno de sus famosos de noticias, al que han clonado, voz, gestos y a veces también el físico...
Lets gooo! Ya esperaba este video, hermoso
Otro vídeo de DotCsv, tremendo.
jajaja me encanto la ultima parte, esta demás decir que el contenido de este y todos tus videos ¡son geniales!
excelente video amigo gracias por este gran contenido
Es muy épico.
Se me vinieron varias cosas, aunque la del video suena GOD, faltará tiempo para su implementación.
Pero una aplicación que pienso, es ser capaz de hacer investigaciones sobre sucesos criminales, o también en el área médica como tratamiento debla ceguera o sordera.
Se ve muy interesante.
Está super genial el video, pero me gustaría que nos enseñara que programas utilizastes para hacer el avatar digital, mejor dicho todo el video. Saludos desde Medellín Colombia
Igual, x2
Vallan a videos anteriores, desde sus orígenes.
Es un excelente aporte y una excelente investigación saludos desde Bogotá Colombia
JAJAJAJAJAJAJAJAJAAAAAAAAA... excelente el video, la edicion... Y EL FINAL!!!!!! un GENIOOOOOOOO!!!!
Gran info, y que creativo con la flea del video ❤
Que crack... pedazo video
Increíble todo esto !!
Tambien existiran cesgos, por ejemplo que al darle de input una grabacion de voz deacuerdo al acento de la persona haga una descripcion fisica? seria muy interesante si es que se han usado voces para entrenar este modelo
podrías grabar un video del proceso de como hiciste este video con la ia? saludos y excelente contenido!
Jajajajaja es una genialidad!!! muy buen video y como siempre, tremenda información la que compartes.
Me encantan tus videos desde hace años y me encanta esto de la Inteligencia Artificial
Noooooo, porfa necesito tu entonación... desde la locución, tu voz hace que conectemos muy bien con tus videos. Regresa Carlos!!!!!
Muy buen video IA, exelente reemplazo...
Impresionante! sin palabras...
Demasiado bueno el video.
Creo que, como la mayoría, me faltaron los intervalos de tiempo o el timbre de tu voz pero, despues de un minuto dejé de prestarle tanta atención a eso y solo darsela al contenido per se y si, funcionó JAJAJAJAJAJA. Es increíble.
nunca pensé que lo de "el futuro es hoy" se sentiría tan real como en este vídeo, dios mío
Dia que pasa nos sorprende mas y mas...
Muy serio el avatar, podemos darle mas gesticulacion?
Felicidades Carlos DOT y Gracias por la información, recibe abrazos desde Cochabamba Bolivia.
Mis respetos, gracias por tu trabajo..
Vacaciones bien merecidas!!!
Excelente video, el modelo se ve genial y open-source!! 😁👏
Muy buen clon, bastante realista, y las explicaciones excelentes, pero le faltan más variaciones de tono para cambiar el nivel de concentración 💯
Gracias ❤
Debo ver estos videos varias veces
jajaja que genial, aun asi aun se siente lo robotizado
muy...
Es impresionante lo que ya se puede hacer,solo faltan que la voz le añadan mas variaciones de tono y mejores ademanes y gestos mas variados y naturales
Solamente le faltó hacer chistes entre medio de la explicación y me valería como DotCSV 😂
Tremendo video
Un poco más expresivo el avatar y me lo como completo ¡Es entusiasmante estar en este momento de la historia de la tecnología!
Excelente tío te sigo hace rato desde el 2019 cuando empecé a dar clases en un universidad de Colombia me basaba en tus vídeos para las clases, tío como hago un vídeo con AI así como el tuyo para mis clases, tienes un vídeo donde lo expliques
Mira el vídeo de clonación de voz
No le hagas caso al otro sujeto es un troll fui al vídeo que dijo y perdí 20 minutos.... Busque con avatar y me apareció el vídeo de mi clon artificial... Una crítica a doc es que no hace enlace a sus otros videos
flipante el progreso
Con qué IA has hecho el video+audio?
Hola buenos días, Te escribo desde Miami USA, Estoy suscrito a tu canal, Te felicito por tu trabajo es muy bueno. Te hago una consulta, cuando copio y pego un prompt desde Word y algunos PDF en Midjorney, no se copia nada y desde luego tampoco envía o ejecuta nada y tengo que escribirlos con el teclado, porque sucede esto y que debo hacer para poder copiar y pegar los , gracias por tu ayuda, Saludos.
Carlos
En mi opinión, lo más interesante y peligroso a la vez de esta tecnología es que al tener más formas de percibir el mundo, su comprensión del mismo se hará más compleja. Por ejemplo como los humanos tenemos los sentidos: vista, olfato, gusto, tacto, etc. Los cuales now ayudan a percibir el mundo y crear modelos mentales de este. Ahora las inteligencias artificiales podrán hacer lo mismo
Buenas Dot, lo primero darte la enhorabuena por tu perseverancia con la IA. Llevo viendote desde la v3, que tampoco hace tanto.. jajaj
Tenía una duda, ¿cual crees que es la manera correcta de clonar tu voz para poder usarla con otros textos?
Muchas gracias y espero que vaya todo genial, incluida la mudanza xd.
No se si es más impresionante ver como habla el avatar. O el contenido del video. Muy bueno. Aunque el de carne y hueso sigue siendo mejor por ahora.
Increíble 🎉
@dotcsv esta técnica del embedding conjunto seria como aplicar un grafo del conocimiento?
Genial!
El final epico!
Thanks!
¡Gracias!
Cholo tu nunca decepcionas 👏👏👏👏👏👏👏👏👏
Fue muy raro el video, pero la final ya me estaba acostumbrando.
Al principio se nota mucho la diferencia, pero hay partes donde la mente asume que eres tu. Definitivamente le faltan modulaciones, pero en un par de años notar la diferencia va a ser muy difícil. gracias por compartir las actualizaciones de este tipo. Un saludo!
jajajaj me encantó la excusa de la voz.. Que loco todo esto! Pero lo que mas me vuela la cabeza es que todo termina siendo siempre una representación vectorial. Es muy loco!
ok todo genial y muy muy cool peeero, esa del final es Sandra???
Haha me encantó 10/10 👌💯🔥
¿Nos puedes decir que herramienta IA has utilizado para crear el video?? Muchas gracias
Alguien se ha dado cuenta de como la labor de un médico de atención primaria podría ser sustituido por una IA en un futuro. Tono de voz, aspecto general y un montón de parámetros que pueden ser medidos. Pruebas acusticas con un fonendo electrónico. Pruebas diagnósticas de imagen tipo radioradiografías, Tacs, ecografías, Pruebas analíticas, etc.
Esperaba que al final del video, en los creditos pusieras las IAs que usaste para crear este video :(, pero como no lo hiciste harás tutrial?
Se nota que la IA de voz está entrenada con acento LatinoAmericano. Buen vídeo.
No existe un acento Latinoamericano como tampoco existe un acento Europeo
@@angellandazabal6040 Obviamente se refiere e que las pausas y pronunciaciones son distintas a las de España, por lo que se podría decir que son cogidas de latinoamerica a pesar de que en la misma existan diferentes acentos
@@angellandazabal6040 el neutro ?
@@angellandazabal6040: 🤓🤓🤪🤓👆
En el mundo hay dos tipos de Español, el de Sevilla y el Madrid-Toledo, el mas comun en America es el de Sevilla.
Entonación, el siguiente reto de la IA ✈
10/10 el video; pero tengo una pregunta ¿te as enterado de la nueva reincorporación del sistema analógico para el procesamiento de datos como (vectores, matrices, etc) o IAs? veritasium subio un video hablando de ellos pero me gustaria escuchar la opinión de alguien que está más metido en el tema.
Oh sí, recuerdo ese vídeo.
Carlos, estás re duro.
Es demasiado para procesar, asi que voy a ir comentando a medida que me vuela la cabeza:
Siento que hay una relación muy muy fuerte con lo que es Inteligencia de Negocios o BI. Poder manejar la información como si fueran "cubos" de N dimensiones. En BBDD se ve mucho este modelo en estrella para los datawarehouses. Poder almacenar la información a niveles de dimensiones (país, producto, fecha, etc) en un dominio de ventas, siendo la tabla del centro (la tabla de hechos) la venta en si... Pudiendo ver la venta con distintos "ángulos" y ver ventas por país, o venta por productos, o venta por productos por países. Siendo esta "suma de dimensiones" en este ejemplo suma de vectores, haciendo que la industria de la información cambie radicalmente. es como si en el mundo de los datos introdujéramos una estructura de datos nueva que es capaz de almacenar información masiva y que se la consulte de una forma trivial a un costo constante.
Una locura, no se si estoy muy drogado o esto es otro salto gigantesco
7:26 Esta parte tambien siento que va a cambiar por completo los softwares de musica o produccion. Imaginate aplicaciones de streaming de musica a la que le puedas "sumar" la colaboracion de otro artista... sobre un tema de un tercer artista... Entiendo que seria algo muy loco eso... pero con herramientas como esta, solo resta esperar a que se libere algo similar...
Consigamos a Jaime Altosano para hablar de esto... COLABORACHIN 🥰🥰
Que pasada de modelo, ya quiero ver que usos le consiguen dar
Me parto con el final!!😂😂😂
Con qué programa creaste tu avatar para que hablase?
Hola. Hay alguna app para usar Whisper ? Gracias!!
Muy útil para que te genere automáticamente el sonido de los videos de drones.
ya estamos muy cerca a la naturalidad quizas lo unico que hace falta entrenar mas es la voz con los labios la articulacion y velocidad de las palabras con los gestos de la boca y algunas expreciones pero se decer muy munucioso y detallista ademas debe ser un video largo como este pues en una pauta o un mini clip seria inperseptible ..... muy buen trabajo
Que increible que una AI me muestre y enseñe sobre AI
al minuto 2 te olvidas que estas viendo un personaje armado con ia, y salvo por la expresividad que aun le falta bastante, en un par de meses para mejorar eso y ya haces todos tus videos asi y nadie se da cuenta
Que locura!!!!!
Esta buenísimo, pero la voz me genera cierta incomodidad porque se siente muy sintética. Pero es increíble lo que estas haciendo en este canal, gracias.
Ahora me imagino, las horas y horas de historías narradas en radio y pare de contar, en un futuro no muy lejanos las convertiremos en autenticas peliculas. Generar viedos a partir de audio, y un sin fin de posibilidades.
Me gustó, pero siento que le falta un poco más de emoción, algunas frases sí las díce muy bien. Pero la mayoría de las oraciones se escuchan muy apáticas. Ojalá luego se pueda modular el ánimo en la voz.
Genuinamente sublime, en todos los sentidos
Yo ya lo venía diciendo, el tema de los embedings es la verdadera revolución, ya nos está dando cierto control sobre esa caja negra que eran las IAs, no solo eso, nos está permitiendo de verdad abstraer el conocimiento a vectores lo cual va a cambiarlo todo! Por fin tendremos IAs complejas de verdad que puedan adaptarse a muchas tareas, es el detonante que esta tecnología necesita para terminar de explotar
@Alma Marcela gracias por su contribucion a esta conversacion
Qué contentos estáis viendo programar vuestra propia obsolescencia
@@GMPOFloyd la abolición del trabajo es el sueño humedo de la humanidad pero estamos aún a siglos de desarrollo de lograr eso
explotar dices? claro el mundo va explotar literalmente con esto! es como un cataclismo jejejejej!!!
@@tadiclesfomalhaut8871 desde luego, un mundo donde se necesiten trabajar solo 25h semanales en vez de 40h, donde todo sea mucho mas barato y donde ya no se tengan que hacer tareas tediosas, con malos horarios o peligrosas desde luego si que es un cataclismo, quien querría vivir en un mundo así? 🤦🏻🤦🏻 De verdad, el ludismo es algo que jamás entenderé
tienes video para aprender a usar un avatar como has echo? hace poco sacaste el de la voz ese sí lo vi :)
Me ha gustado el vídeo, y esta pronunciación mucho mejor que la tuya original. Voto por que sigas con la AI.
Loquendo no murió, evolucionó
Ver estas cosas me dan ganas de seguir con vida.
WOW eso esta brutal
Cuando hablaste de IMU ya veo a las IA montadas en robots, coches, bikes, ...
jajajajajaja buenisimo! "NO, un pangolin no!"
Impresionante
Vaya, que buen video te mandaste, lo del avatar me voló la cabeza
De grande quiero estar calvo como tu
Brutal!!! Ahora…. Que tal si nos enseñas cómo hiciste tú deepfake con audio y vídeo al tiempo
En poco tiempo, estaría genial entrenar las Ai con películas y documentales.
ufff, de solo imaginar las posibilidades
Un cybor tendría una concepcion y entendimiento del mundo a su alrededor 😮😮😮 y sí que deja mucho que pensar 🙁🙁🙁
4 :18 Esto debió ser más gracioso (por la referencia a TLOTG) de lo que sonó con la voz IA que pusiste Carlos