Crea tu asistente virtual / Whisper Open AI (parte 1)

AMP Tech

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 15 гру 2024

КОМЕНТАРІ • 212

@javierlegon6893 2 роки тому ⁺⁵
💪 Eres grande💪... Este es un gran proyecto. Ya estoy ansioso por ver cómo acaba
@AMPTech 2 роки тому
Gracias!
@agnosticoparatodo 2 роки тому ⁺¹
Este proyecto es el más interesante que vi este año.
@lexcenz 2 роки тому ⁺⁸
Voy a estar muy atento a tu progreso. El algoritmo de UA-cam, me leyó la mente dirigiéndome hacia tu video. Hace unos meces le estoy dando vuelta a una inquietud que se me ha sembrado. Conocí a una mujer muy mayor, que en los últimos años ha perdido la vista. Ella tiene 90 años y es escritora, y no logra adaptarse a las interfaces existentes para personas no videntes. Ella quiere recuperar la independencia para poder escribir sin necesidad de intervención de terceros. Toda la interfaces existentes que le pueden permitir a ella volver a redactar un texto, editarlo y archivarlo, exigen en algún punto que ella use braille y/o se familiarice con un teclado. Su edad avanzada le juega en contra para aprender esto último en un tiempo conveniente, pero su lucidez y su prosa está ahí intacta, solo que muda por el momento. Y bueno esa es mi idea. Espero con ansias tus próximos videos.
@rupardo689 2 роки тому ⁺⁴⁹
Una funcionalidad que siempre he pensado para un asistente virtual es que uno le diga algo del estilo: "enseñame sobre x" y este busque el contenido existente en la web y te de una especie de charla resumida sobre el tema. De pronto me imagino que el asistente googlee las 10 primera paginas del tema, tome el texto y se lo de a un GTP3 (u otro) para que te de los puntos más importantes del tema consultado.
@AMPTech 2 роки тому ⁺¹⁶
Suena muy bien. Voy a pensarlo con gpt j o gpt neo. Para no depender del API de open AI
@gerardo246 2 роки тому ⁺²
Meta sacó algo parecido pero dirigido a cient´ficos, Galactica aunque ya la funaron solo después de 3 días de beta abierta xD
@ChinoSable 2 роки тому ⁺¹
En algún momento use los jars de loquendo con Java pero el reconocimiento de voz siempre fue el problema, ya le había echado el ojo a wisper para solucionar esos detalles, cuando lo probe hacía algunas búsquedas y decia lo primero que te daba el navegador, también te podia decía la ahora 😅 fue bastante divertido, con la IA esto será mas fácil 😍
@pictorres 2 роки тому ⁺³
@@AMPTech Sé que no te gustaría depender de OpenAI, pero con respecto a esto en relación al nuevo short que subiste. ¿No crees que ChatGPT podría ser una buena opción a integrarlo y que ayude con esta funcionalidad?
@AMPTech Рік тому ⁺²
Justo en un inicio no me parecia tanto porque quita la dependencia local. Pero decidí que mejor si lo integro y lo contengo bien para que solo salgan a internet ciertas peticiones y no todo.
Saludos!
@dylanmolinasolis9006 2 роки тому ⁺¹
Pues mira, apenas he visto un minuto de tu video y ya me suscribí. Suerte en el proyecto, estaré atento a las actualizaciones
@jonathanrodriguez7976 2 роки тому ⁺¹
INCREÍBLE! Te deseo éxito en tu proyecto.
Tal vez a muchas personas les guste esto y pueda ser comercial :"D
@cronos8339 2 роки тому ⁺¹
Muy impresionado y emocionado! De ver cómo va tu proyecto
Yo agregaría algo así como un psicólogo integrado", en los proyectos de la comunidad Jetson ví algo que, mientras navegabas con una cámara te decía que páginas te hacían sentir triste o enojado etc, yo agregaría una api para conectarte tu cel, y ver cuando te duermes y te despiertas y conforme a eso te valla preguntando si algo te afectó o así, estarte recordando que estudies ciertos temas de la escuela esto de reactive recall hablado, se me haría súper genial!
@sinonimo8719 2 роки тому
Bua, estp si quiero ver como va avanzando. Ánimos y muchos éxitos!
@emilianoenriquez5637 3 місяці тому
Hermano, que buen video, explicas super bien y muy claro; muchas gracias por el video, llevaba rato soñando con hacer algo así pero no tenia ni idea como podría hacerlo
@videomanjorl 2 роки тому ⁺¹
Es genial y super interesante. La solución de grabar en bloques de pocos segundos suena bien, pero imagino que no es lo ideal para un asistente virtual. Supongo que ya lo resolverás mas adelante. Te felicito y éxito con el proyecto!
@AMPTech 2 роки тому ⁺¹
Estas en lo correcto, no es ideal. Ahorita eso lo tengo para poder ir recopilando la mayor información posible. Pero despues lo que se tiene que hacer es programar un "wake word" como el clasico "Ok google" y una vez que se escucha la frase clave entonces el asistente virtual sabe que viene alguna petición.
Eso lo estaré trabajando.
@mastermaster153 2 роки тому ⁺³
excelente iniciativa, siempre he pensado eso que comentaste, serían mucho más útiles con la suficiente información personal pero darle todavia más datos personales a las empresas, no! , estaré atento a los siguientes videos
@AMPTech 2 роки тому ⁺¹
Gracias! Si, quiero dormir tranquilo sabiendo que solo mi servidor es el que procesa y almacena todos mis datos jaja.
@uaprende3314 5 місяців тому
Que increible. Gracias por estos avances e investigaciónes que haces, ayudan full a la comunidad ❤
@primalemandiazdesofy3918 2 роки тому ⁺⁹
Puedes usar SpeechRecognition del navegador, es lo que yo hice para tener voz a texto en tiempo real.
Un browser super ligero corriendo en segundo plano que transcribe todo lo que escucha y si dejas de hablar todo ese texto lo manda al asistente core (Que puede ser en python) por una peticion http. Es muchisimo mas rapido y funcional.
De esta manera te evitas cortar un comando si justo ocurre cuando se hizo el corte de los 10 segundos y capturas todo el texto y lo mandas a reconocer enseguida
@gibra537 Рік тому
Esto no requiere conexión a internet?
@anthonyp.3856 2 роки тому
Impresionante! Me quede con ganas de ver los videos que siguen.
@jricardom7039 2 роки тому ⁺⁴
Hola, soy odonlogo/dentista y un obstaculo o necesidad que me gustaría satisfacer con una IA para incluir a mi clinica es poder llenar el formulario (historia clinica) sin la necesidad de contaminar teclado o ratón, evitar el gasto guantes plasticos de transferencia para esta labor, asi poder llenar la historia clinica sentado desde la unidad odonlogica y no tener que interrumpir la consulta.
@danielsoler1769 2 роки тому
Encontré este video justo cuando estaba pensando en crear un proyecto asi. Te felicito por tu contenido.
@GermAndroidE 2 роки тому
Genial! Muy buen proyecto, enhorabuena. Es genial que esto salga en modelo abierto.
La IA puede ayudar a los usuarios que quieren usar Linux. Linix es un sistema muy potente pero hay que saber y leer muchos códigos que cuesta mucho entender para los usuarios finales, sobre todo cuando hoy en día es todo tan cómodo como Android o IOS... Pienso que una interfaz de voz puede ayudar a que cualquiera pueda usar Linux, no tengo ni papa de Linux y de hecho cada año tiro la toalla cuando vuelvo a intentar hacer cosas en Linux porque me frustra la documentación infinita de cómo hacer las cosas que con interfaz tradicional ya están resueltas con un click...
Por ejemplo, actualiza los Drivers, actualiza el repositorio o instala esta aplicación, configurar las opciones gráficas, ejecuta tal programa...
@inversionlatam8707 Рік тому
Gracias genio, estaba tratando de armar algo mucho mas simple, que era tener una ia en tu pc, para no comprar token y eso, como tenia una grafica amd no era compatible los modelos, ahora conseguí una nvidia y voy a instalar tu proyecto.
@Au-jc2ew Рік тому ⁺¹
Me parece un proyecto muy interesante, no tengo asistente virtual, y la razón es precisamente la fuga de información privada, así que seguiré con mucho interés tu proyecto.
Saludos.
@miguelalejandroulloaacampo2062 Рік тому
Yo conozco uno que es 100% privado
@gibra537 Рік тому
@@miguelalejandroulloaacampo2062 a cual te refieres?
@miguelalejandroulloaacampo2062 Рік тому
@@gibra537 el mío! busca asistente virtual ion. su reconocimiento de voz es creado por nosotros y usamos llama 2 para el npl ,
@tintintino000 2 роки тому ⁺¹
Me parece un proyecto increíble. Me suscribo y espero nuevos vídeos del tema!
Estoy empezando a estudiar desarrollo de apps web, espero algún día ser capaz de hacer cosas como esta :)
@alejandromaciel6469 Рік тому
Buenas el proyecto me parece espectacular no depender de terceros, estoy en un proyecto donde tengo una raspberry pi en mi auto por el momento quiero controlar con la voz la miltimedia pero seria interesante controlar la alarma de vehciulo luces encendido camaras raderes a futuro, excelente contenido se aprecia mucho su trabajo.
@ellobodeacero 2 роки тому
genial! seria genial un sensor de movimiento con camara y que el el asistente virtual haga la acción al reconocer el gesto
@tobiasgarcia2610 2 роки тому
¡Estimado Alex!. Es en realidad un enorme placer el poder saludarte, he seguido muy de cerca tus implementaciones en tecnologías como Yolo, estaría muy genial si tu asistente hace uso de la detección de objetos en cualquiera de las versiones de Yolo y ayude al cuidado de los niños, me explico de mejor manera. Si determinas una zona de peligro como la cocina, podrías monitorear en tiempo real objetos que representen un peligro para la integridad física del niño, como un cuchillo, una ventana, una copa de vidrio, un tenedor, entre otros, y tu asistente podría notificar al tutor del niño la proximidad entre este objeto de peligro y su niño.
Seguiré de cerca tu proyecto, en realidad llama mucho la atención, gracias por siempre compartir tus conocimientos!
@aperreitar 2 роки тому ⁺³
Se le puede agregar un motor con ruedas para hacerlo móvil y que cuide la casa o te acompañe como una mascota. Una especie como R2D2. Gracias por tu vídeo pues ya estoy matriculado con tu proyecto. Excelente trabajo 👍
@AMPTech 2 роки тому ⁺¹
Esa idea la tengo en mente desde hace unos años. Hasta me arme un carro de radio control y una cámara 3d.
@aperreitar 2 роки тому ⁺²
@@AMPTech Pues, póngalo en práctica para el asistente virtual, en este curso (un axioma) y podriamos tener nuestro amiguito automata móvil simple con IA... Gracias por tu gran trabajo 🤩
@francobianconi9227 2 роки тому ⁺¹
Lo que tengo en mi cabeza hace mucho tiempo es inventario automático. O sea, tú le muestras a la cámara o le dices qué vas a guardar dónde, y que la computadora lo recuerde. Y que después te pueda ayudar a buscarlo.
@sasac.r7819 8 місяців тому
Yo tengo 1, pero funciona por comando de voz, Creo que no necesitas hacer una IA para tener ese programa, saludos.
@capablancastyle 2 роки тому
Gracias!!!, el futuro es ahora!!!, es muy motivante!
@AMPTech 2 роки тому ⁺¹
Me da mucho gusto! A ver como va saliendo!
@FOGSSIETE 2 роки тому ⁺¹
Muy buen proyecto, te felicito inspiras a otros
@AMPTech 2 роки тому
Muchas gracias Fabián!
@gianluquedesimone9660 2 роки тому ⁺¹⁵
Este es uno de los proyectos personales que tengo planeado hacer una vez entre en el mundo de la IA. Este video será de mucha ayuda!
@renieeevaristovelozmorales5234 Рік тому
Espero que vuela a parecer un asistente parecido al gran asistente jarvis, para manejar el computador dialogando con el, todavía los utilizo, pero sería genial si apareciera un asisten te personal con IA y no con comandos escritos elaborados, sería verdaderamente increíble y genial, gracias y gran éxito a su proyecto para el mejoramiento y bien de todos a los nuevo tiempo...
@pmc-rcv 2 роки тому ⁺¹
Estoy al pendienteeeeeeeeeeeeee del proyecto. A mi me gustaría que pudieras controlar las cosas sin hablar. Tipo, un gesto para activar, y luego otro gesto para ejecutar "subir volumen" por ejemplo.
@asaphgameplays 2 роки тому
Wooow amigo, en serio esta muy elaborado tú proyecto, una función que podrías agregar es decirle un destino, y te diga que horario es el mejor para salir, así como mejores rutas, o que puedas agendar a que necesitas llegar a cierta hora y el te programe todo.
@borjagomezrouco 2 роки тому
Lo primero GRACIAS por tu canal, he aprendido mucho contigo y seguro seguire aprendiendo. 2º Seria interesante integrar un registador de listas. Ejemplo, si quieres hacer una lista de la compra que valla creando el archivo y luego pueda enviarte esa lista al telefono o al correo por ejemplo. O un contador de productos habituales en tu nevera, que avise cuando dicho producto baje de un stock determinado.
@AMPTech 2 роки тому
Hola, Muy buena idea, el contador de productos en mi nevera es justo como nació la idea este proyecto. Sin duda alguna voy a integrarlo.
@borjagomezrouco 2 роки тому
@@AMPTech Pues sin duda estaré en vilo con este proyecto, además de las complicaciones informáticas a ver como solventas el trabajo del hardware a baja temperatura, en principio eso es bueno para nosotros pero la contra es la condensación en las lentes...
Estoy impaciente!
@angelvarela9395 2 роки тому
me encante este nuevo proyecto, sige haci
ojala algun dia hacer my propio asistente virtual
@emelenziadivbattory5961 2 роки тому
Me encanta este proyecto, espero que sigas avanzando!!
@AMPTech Рік тому ⁺¹
Muchas gracias! Lo siguiente será el modelo para procesar las palabras que "despiertan" al asistente. Similar al famoso "ok google"
@bryanguzman4051 2 роки тому
Me ha resultado muy interesante tu vídeo y ha despertado mi curiosidad. Mucho animo
@AMPTech 2 роки тому
Muchas gracias!
@jorgeespana482 2 роки тому
Saludos!
Tu canal es oro, contenido super interesante
También soy programador, acabo de poner mi servidor para los mismos propósitos!
@AMPTech 2 роки тому ⁺¹
Hola Jorge!
Muy divertido montar tu propio servidor no? He aprendido un montón y aparte es super útil.
Saludos
@J.D.O.S 2 роки тому ⁺¹
súper el video, me gustaría ver como agregarle una palabra clave para que se active y que además me dijera quién fue el que lo activo. Excelente esta seríe yo hace rato estaba buscando videos sobre este tema para crearme uno parecido para mi casa también.
@AMPTech 2 роки тому
Gracias Juan! Si justo la “wake word” es una de las siguientes cosas
@kiskeyamakers 2 роки тому
Me gusta esto! vamos a darle seguimiento
@joseleonardosanchezvasquez1514 Рік тому
Esta como genial voy a ver la serie
@AMPTech Рік тому
Gracias! Ahi si se te ocurren ideas avisame para ponerlas en la lista de posibles upgrades.
Saludos!
@abiudmarquezmunoz7525 2 роки тому
Justo lo que estabas buscando. ❤️
@kirito99hn 2 роки тому ⁺¹
Hola broo me gusta el proyecto mucho en lo personal la idea es mega genial lo que si te puedo sugerir es los comandos de respuesta despues de todo es un asistente debe de tener respues y creo que hay un proyecto que puede gustarte esta en el canal de Nate gentile en el cual hizo algo similar pero mas compacto y creo que eso se podria integrar muy bien al proyecto
@Antonio-wb9cj 2 роки тому ⁺¹
Saludos, explicas muy bien y el proyecto se ve muy interesante
@AMPTech 2 роки тому
Muchas gracias!
@Plack85 2 роки тому ⁺¹
Amigo, la verdad es que no entendí mucho de lo que hablabas, aun que creo y confió en que tu proyecto será muy bueno. No soy informático ni me dedico a eso pero es un mundillo que me gusta y me llama la atención espero ir viendo tu progreso y aún que esta muy bien solo te pido que no seas tan técnico y nos hables un poco mas terrenal jajaja pá que podamos entender todos saludos y VAMOS.
@AMPTech 2 роки тому
Gracias por el comentario Ivan!
@LeoEspinoza0 2 роки тому
Este proyecto es impresionante y me emociona mucho. Espero con ansias los demás videos.
Si se incorporase un reconocimiento óptico de carácteres no sería lo más útil para el proyecto, pero me parece algo interesante a evaluar.
Gracias por compartir este proyecto y los conocimientos que conlleva 😎😎😎
@claudioviajando6184 2 роки тому
Muy buen video y la forma de explicar lo que estas haciendo es muy clara. Atento ahora a tus videos
@AMPTech 2 роки тому
Muchas gracias! Justo estoy buscando ser claro con la explicación pero que también sea contenido ameno.
@fabiansolis8285 Рік тому ⁺²
Estaria padre que se pudiera usar como jarvis, Es hacer varias partes de ese proceso, solo que lo que le agregaria seria un modulo wifi, una bateria, y un puerto sim para cargar internet y obvio hacerlo lo mas compacto posible y ultima pero no menos importante seria un audífono de conduccion osia.
@AMPTech Рік тому
No se me había ocurrido algo con audífonos de conducción ósea. Me parece muy buena idea!
@henryvladimirfernandez8549 2 роки тому
Esperamos la segunda parte
@spacefull369 2 роки тому ⁺²
Muy buenas ideas las que quieres poner en práctica y también la de los comentarios, yo creo que desde antes de que saliera whisper al público ya teníamos ideas relacionadas.. me gustaría que hicieras un modelo apegado a lo vas hacer pero con una Raspberry o una Jetson Nano.
@AMPTech 2 роки тому ⁺¹
Este asistente virtual lo tengo pensado corriendo en varios dispositivos. Entonces también adaptare algunas cosas ara RPi o Jetson Nano
@lordboss413 2 роки тому ⁺⁶
Y si le pides al asistente cotizaciones de algun producto y luego te presente las mejores opciones... tecnicamente se me ocurre hacerle un scraping de varias fuentes, comparar el de menor valor y luego reponderte con los precios mas optimos. Saludos maestro!
@martinmolina8461 2 роки тому
Muy interesante el proyecto, esperando la segunda parte ⌛
@geckomaker 2 роки тому
Interesante encontrar la manera de hacer el chomp del archivo de audio durante los silencios para que las palabras al inicio y final no queden cortadas. Tal vez con dos procesos? Uno que tire el stream de audio a memoria y otro que vaya sacando los trozos, analizando los silencios y generando los archivos. Bonito bonito proyecto.
@AMPTech 2 роки тому
Justo estoy pensando en como hacer eso. En un inicio pensé que no iba a ser tan complicado, ha resultado ser un poco mas complicado de lo que pensé jaja.
@rcarrasquel.u 2 роки тому ⁺²
Saludos, se ve bastante prometedor tu proyecto y me uno para seguirlo. Existe vosk que también hace el trabajo de stt de forma offline, actualmente uso el modelo small de español y no me ha dado problemas mayores. Puedes pasarle un archivo de audio o utilizar el micrófono. Éxitos en tu proyecto.
@AMPTech 2 роки тому ⁺¹
Hola Ramón, le voy a echar un ojo, ese no lo conozco. Muchas gracias!
@lapapeelcubo9029 2 роки тому
pdt mucho mucho éxito man
@andresbuitrago5408 2 роки тому ⁺¹
Super el proyecto, felicitaciones seria genial que se pueda configurar si tiene un negocio u oficina y genere un conteo de personas y envíe una alerta si tiene un tráfico más alto de lo habitual que sea un asistente para casa y negocio
@miguelalejandroulloaacampo2062 Рік тому
Eso es buena ideaa lo implementare en el mio.
@javiermillatamblay7695 2 роки тому ⁺⁸
Me interesaría que generara, cada una hora, una imagen generada con algún modelo como Midjourney4, utilizando como input las frases que más se repitieron en los script transcritos. Así vas generando un album de fotos diario y puedes hacer retroalimentación diaria de tus emociones y vivencias.
@luis_naar 2 роки тому
me suscribo para ver la continuación del provecto
@alvarodavidjoyohuaman7392 2 роки тому
Simplemente WOW
@sergiovega3115 2 роки тому
Joder, justo lo que queria hacer, nuevo sub
@AMPTech 2 роки тому ⁺¹
Buena coincinendia!
@rodrigol.9128 2 роки тому
Excelente Proyecto!
Esperando con ansias lo que se viene 💪🔥
@AMPTech 2 роки тому
Gracias! Vienen varios videos porque cada vez se me ocurren mas funcionalidades jaja
@rodrigol.9128 2 роки тому
@@AMPTech Excelente! Yo he desarrollado uno, con la poca experiencia que tengo, con funcionalidades cómo, manipular google calendar, enviar mensajes a ciertos contactos, manipular archivos y programas del PC, algunas funciones específicas prediseñadas, reconocimiento facial y alarmas por si alguien se sienta frente a mi PC que no sea yo 😬. En resumen funciones cotidianas, y ahora estaba viendo para cambiarle la voz al asistente para usar las de Amazon, que durante un año es gratuita. La verdad el tema del asistente es un excelente Proyecto, sería interesante integrarle funciones de chatbott y que mediante el asistente converse con el usuario pueda reconocer los comandos sin necesidad de pasarle una palabra clave como Alexa, Ok Google, etc.
Repito, con ansias de ver avanzar este proyecto y aprender en el proceso. Saludos!
@gbrailius4027 8 місяців тому
@@rodrigol.9128Lo corres desde tu PC ?
@Maisonier 2 роки тому ⁺¹
Que maravilla. Yo tengo un servidor viejo (xeon 5660) con truenas (que tiene plex, almacenamiento de películas, fotos familiares) . Sería genial poder integrar todo esto en el servidor.
@AMPTech 2 роки тому ⁺¹
Me atrevo a decir que algunas cosas serían mas sencillas en cualquier servidor con AMD/Intel. Como viste en el video, el trabajar con ARM a veces puede requerir un poco mas de trabajo.
Saludos!
@Equinoxio 2 роки тому
Buen video, algunas sugerencias de seguridad para que llame al 📞911 y similar:
1. Que reconozca algunas *palabras clave* para cuando sea necesario llamar a la policía, *en silencio.*
2. Inclusive, que te pregunte si esta "todo bien" cuando detecte: intrusos, sismos, olor a gas, etc.
3. Los videos de seguridad, deberían subir a la nube rápidamente, cosa de evitar que te roben DVR con las pruebas.
4. La perfección es que los mic y cams estén ocultos, por seguridad, solo tú debes saber (créeme te servirá)
Yo tengo cams en casa, no con IA, pero sí estoy con un sistema de "alerta temprana" por las dudas. Uso iSpy para grabar cuando hay movimientos y Scripts para subir a mi nube privada.
@Equinoxio 2 роки тому
Inclusive, *mirar* a una cámara puntual, podría ser el "disparador", no hay que limitarse al comando de voz.
@dariozambrano2483 Рік тому ⁺²
Me gustaria ver como queda finalizado este super proyecto
@AMPTech Рік тому
Acabo de publicar una actualización. Todavía falta mucho para tener algo final, pero se esta avanzando!
Saludos
@wiffito 2 роки тому ⁺⁴
Tienes dos proyectos open source bastante potentes, llamados Rhasspy y Mycroft para asistentes virtuales. Estaba deseando ver algún proyecto de asistente con Whisper y me parece un acierto. Quizá los otros dos proyectos te den una idea de cómo organizar parte de la estructura de tu asistente, o puedas implementar tus ideas en los ya existentes.
@JorgeLTS1 2 роки тому
Gracias por compartir, me gustaria que al final del desarrollo la podamos utilizar y cada quien ponerle un nombre al asistente, digo para el uso.
@AMPTech 2 роки тому
Justo ando viendo eso porque no me he decidido en que nombre ponerle, asi que mejor que pueda ponerle el que sea jaja
@fpicado1 2 роки тому
Espectacular 💯💯💯
@felipesoto8524 2 роки тому
Hola, es muy muy buen proyecto.... Lo veo complejo, pero si puede aprender mucho de esto. Por ahí, escuche.... Mira imagina que llevas IA a clases para que tome apuntes, luego se la pasas a otra que puedas chatear, y mas con las IA de voces. Podrias preguntar la información de la clase al asistente. Al principio me pareció mucho, luego he visto videos, creo que es interesante y posible.
Saludos
@jorgegaspar3878 2 роки тому
Excelente proyecto !!!
@RonBastidas 2 роки тому
Proyecto super interesante, gracias
@ronaldrojasrodriguez375 Рік тому ⁺¹
Excelente
@eladioss02 2 роки тому
Hola soy nuevo por el canal, he visto ideas interesantes, aqui algunas cosas que me gustaria:
1. Asociar la vos con la persona de modo que pueda dar permisos de operacion y demas, de modo que si quiero agendar o guardar un mensaje sea solo yo quien pueda hacerlo y no mi hermana o sobrina(o el ladron).
2. Dar ordenes o lanzar preguntas a traves de whisper y que la respuesta se muestre en una pantalla, por ejemplo le digo mostrar agenda y que este me lo muestre en el tv o monitor.
3. Puedes dar mas opciones de dispositivos a usar, buscando el dispositivo mas barato o pequeño pero que funcione, por ejemplo para el modelo de whisper que usaste requeria X ram, pero tu dispositivo tenia mucho mas.
Gracias y seguire al pendiente de como se desarrolla el proyecto.
@JohanMosqueraYT Рік тому ⁺²
Excelente!
No sé qué tan viable sea usar más adelante una integración con ChatGPT en el proyecto, o tal vez si a ésa fecha, ya haya un modelo openSource que haga lo mismo que los que está haciendo OpenAI con GPT. Sería genial hacer eso!. Prácticamente se tendría una versión más cercana a Jarvis 😃
@laravindelpixel873 2 роки тому
Gran vídeo, ha sido una suerte encontrar este canal. Incluso sin tener ni idea de programación más o menos he podido montar algo con la explicación que has dado. Estoy trabajando en un proyecto para montar un animatronico con la capacidad de tener un asistente virtual instalado, entonces .... Sería posible, de alguna forma, incorporarlos cámaras para que pueda tener reconocimiento por imagen? Un saludo.
Te has ganado un nuevo sub👍👍
@alguien4099 2 роки тому
Algo que se me ocurre, que tal vez no es útil, pero si curioso xd, es que integres un cuadro con imágenes generadas por IA, por ejemplo: que tengas una especie de cuadro colgado en alguna pared de la casa (que va ser una pantalla) en el cual puedas plasmar lo que digas. Sería como decirle al asistente algo como "alexa, dibuja un caballo zombie en la luna en el cuadro de la sala" y que cambie xd
@cesarkadirtorricovillanuev5638 2 роки тому ⁺⁴
Video interesante, pero ¿Cuales son tus objetivos? ¿Qué quieres que haga tu asistente virtual? ¿Quieres que tenga conversaciones con tigo? ¿Que sirva de activador de dispositivos? ¿Que te permita llenar una base de datos con ideas espontaneas que tengas durante el día? ¿Qué planifique tu calendario? ¿Que encienda las luces de las habitaciones que detecte que hayan personas? Una lista con las cosas que tienes planeado sería interesante.
@spacefull369 2 роки тому
está!!! que permita llenar una hace de datos con ideas, pensamientos, sugerencias, frases, con el objetivo de darle un uso práctico y que nos sea de ayuda en casa, por para alguna fábrica o negoció
@AMPTech 2 роки тому ⁺⁵
Hola Cesar.
Buen punto! voy a documentarlo en un video o articulo. No entré en ese detalle porque quería ser breve, pero sería útil entrar en el detalle. Hay cosas que tengo ya muy bien definidas y otras que necesitaré probar primero para ver su utilidad.
Saludos!
@isaacbenavides111 2 роки тому ⁺⁴
Bro, pregunta de curiosidad.
Harás el proyecto open code? Me encantaría ver el repo con todo lo que haces y todos los avances.
Excelente idea y estoy ansioso por ver los demás vídeos
@MrVincko 2 роки тому
Una funcionalidad que sería útil es el reconocimiento e identificacion de personas, para ver si alguien esta esperando a la entrada de casa dar aviso
@lapapeelcubo9029 2 роки тому
yo estaba haciendo un asistente y pensaba en usar whisper para que mi papá que tiene tendinitis deje de escribir tanto y un asistente así que lo ayude a redactar sus documentos mejor que la mayoría de estos programas sería genial, nunca se me ocurrió meterlo si en una máquina de esas, está cariñosa si (caro) pero pienso que puedo ahorrar para un agx ,🤞ojalá salga bien
@nqual5 Рік тому
Estoy creando un proyecto similiar con Pabbly y apenas voy conectando GPT-3. Puedes crear un flujo de trabajo conectado con Whatsapp y usar una conversacion como tu asistente personal y el pudiera interactuar con una tu agenda.
@marcelocheves 2 роки тому ⁺¹
Gracias por tus videos hermano, queria sabar si será posible que le incluyas una funcionalidad donde al pedirle que abra una hoja excel o check list (tipo lista de compras) y la Ai te vaya diciendo los puntos a chequear, tu le vayas diciendo cuando esta cada punto chequeado y la maquina le haga check a cada punto. Como si tuvieras a alguien dictandote la lista y tu diciendole cuando cada punto esta check y ella pase al siguiente punto. Gracias man.
@juanc277 8 місяців тому
Hola, en mi caso me gustaría poder editarla para uso personal y acompañamiento en jornadas de trabajo, y configurar ciertas formulas para ayudar al calculo dentro de algun proceso establecido, como packing de frutos en las agroexportadoras o en cualquier fabrica
@zorornoa3864 2 роки тому
Hola me fascinó tu idea, me ofrezco como tú "becario" me gustaría mucho trabajar en un proyecto como este para aprender y me gustaría ayudarte en cualquier tipo de trabajo que ocupes respecto al proyecto, obvio sin fines de lucro, espero lo tomes en cuenta y mucho éxito yo sé que será un proyecto genial. 👌🏾
@MaximoFernandezNunez 2 роки тому ⁺¹
A mí me pasa igual, vas a usar los modelos de Nvidia porque te prometen que en las jetson están optimizadisimos. Y después de días peleando, en foros y sin conseguir nada, al final lo tienes que dejar por alguna razón
@AMPTech 2 роки тому
También he visto cosas similares con deepstream. Espero eventualmente poder correr riva en ARM
@MaximoFernandezNunez 2 роки тому ⁺¹
@@AMPTech yo poco a poco voy aprendiendo a usar deepstream, a base de golpes. Espero aprender más y poderte ayudar
@MULIG4N 2 роки тому
@@MaximoFernandezNunez Estas utilizando la versiòn c++ o python?
@MaximoFernandezNunez 2 роки тому
@@MULIG4N Python
@pablohorchmontespulido1433 2 роки тому
Ya la idea mas loca pero costaria algo de dinero es que hicieran un reentreno de GTP-3 para decirle que X ordenes es igual a X instruccion para asi cuando metas el comando gpt-3 lo interprete ... esto serviria para tu en vez de hacer un if cuando diga encender {X} en home assitan encienda X, porque tu puede decir prende, enciende, activa, enchufa, y asi con muchas palabras , el cual gpt.3 podria aprender de tu lenguaje natural para asi si hacerlo bien y no poner un millon de if
@AMPTech 2 роки тому
Buena idea, creo que una manera de reducir costos de esta idea sería utilizar algún modelo como GPT-neo o GPT-J los cuales no requieren de pagar un API para hacer las inferencias.
@carlosmachadom 2 роки тому ⁺²
Por favor podrias compartirnos los presupuestos para comprar los materiales necesarios, enserio me parece muy interesante este proyecto.
Nota: Que tál la funcionalidad de acceder a tus computadoras encenderlas o apagarlas por comandos de voz y puedas ejecutar aplicaciones o navegar en internet
@MULIG4N 2 роки тому ⁺¹
Para los dispositivos Jetson se usa nvidia nemo
@michelleon1050 2 роки тому
Hola, lo que se me ocurre es añadir sensores de movimiento para que sepa cuándo entras o sales.
@jorgefernandez4812 2 роки тому
seria interesante integrarle una camara a la puerta de tu casa que te avise al telefono cuando alguien se acerca, un esp32 con camara deberia funcionar bien
@nandordena 2 роки тому
Supongo que ya lo abran mencionado, pero creo k una de las integraciones más necesarias es la de calendario y tareas (google estaria genial)
@andresdiazmarketingynegoci6714 2 роки тому
Ya solo con lo que acabas de compartir, me acabas de ahorrar un montón de tiempo para traducir mis clases de Trading en inglés
Sin duda te mereces un Super like y hasta más crack
Saludos desde Colombia 🇨🇴
@AMPTech 2 роки тому
Hola Andres. Que bueno que te sirvió! Saludos
@alexispantoja3377 Рік тому
seria muy bueno integrar todos los paquetes en un dispositivo portatil como un celular o un reloj, y asi para poder controlar todas las funciones mas facilmente
@miguell.4424 2 роки тому
me gustaría que... siempre he pensado si una IA, puede leer un archivo de google sheets, analizar los datos, interpretarlos o hacer forecastings basados en una pregunta, ejemplo, "¿El siguiente año cómo serán las ventas en el mes de Agosto?"
@josecarlosa439 Рік тому
Podrias hacer un sofware que con visión artificial , busqueda de objetos, localización de estos, o acciones que hagan, pueda relatar la imagen o el video, tal como lo haria una persona que está observando la escena y diciéndoselo a una persona invidente.
@jefoorcasberro8855 Рік тому
Probablemente llego algo tarde pero vi en un video que un chico hace que cuando le tocan el timbre le llega un mensaje a wpp, estaria bueno implementar que el asistente te avise cuando te tocan timbre.
@faviosergio 2 роки тому
Algo que estaría faltando es la interacción como plataforma, enviar el audio desde el lado del cliente al servidor.
@danielp8642 2 роки тому ⁺¹
increible!! gran video. Tengo un par de preguntas.
1º Se podría implementar una forma de visión por computadora para que con una cámara pueda detectar o clasificar objetos?
2º Se le podría meter algún tipo de text to speech? y si se puede, se le podría cambiar la voz?
Siento mi ignorancia de antemano, soy nuevo en esto y realmente voy dando palos de ciego hasta encontrar la solución.
Un saludo.
@stivenmahecha8560 2 роки тому
Mete gpt chat y alguna conexión con el móvil vía internet, para no tener que estar ligado a un micrófono fijo
@ardillazorrillo1819 2 роки тому
Quizas en vez de hacer que grabe 10 seg, hacer grabaciones mas cortas y compararlas con el nombre del asistente, que funciona como llave. Si se encuentra el nombre del asistente entonces si inicia una grabacion mas larga donde estara el comando. De esa manera se logra que tenga menos retardo. El modelo que se usa para comparar la llave, puede ser mas simple y rapido de ejecutar.
@josedes2000 Рік тому
Excelente esta sería de videos, me ha gustado mucho, pero tengo una duda, En este caso es necesario una Jetson AGX?, por que solo este dispositivo en Amazon cuesta 1990$
@7273638 2 роки тому
Hola! Estoy trabajando en un sistema de seguridad para fincas en donde genere alertas cuando alguna persona aparezca en la camara esp32 y envie el video de lo que encontro, sin embargo he estado leyendo sobre la tecnologia lora debido a que al ser una finca, el wifi no tiene la suficiente covertura en todo el espacio y con la tecnologia lora podria hacer llegar la señal a kilometros, seria genial saber como te imaginas esta solucion ya que la capacidad de lora y de las esp32 es limitada para el procesamiento y envio de datos a la central para notificar a un dispotivo ya que una vez este modelo este funcionando se podria agregar reconomiento de voz e identificacion por sensor de temperatura para las noches oscuras si alguna persona o especie animal pasa por determinado sector, ademas de humedad, temperatura etc, sigo tus videos! muchas gracias por compartir el conocimiento, espero un dia nos pongamos en contacto para conversar mas sobre temas de tecnologia!
@AMPTech 2 роки тому
Hola David, he usado Lora para algunos proyectos, dado su ancho de banda tan chico no es posible que vayas a estar enviando imágenes. Un camino podría ser cargarle un modelo TFLite al ESP32 para que corra algunas predicciones/detecciones (aplica para modelos muy chicos) y el resultado de las detecciones es lo que enviar por LoRa (coordenadas, que se detectó o cualquier otra cosa que requieras)
@zamora322 2 роки тому
Te mamaste, we.

Наступне

Автоматичне відтворення

Parte 2: Creando un asistente virtual personalizado.