Crea tu asistente virtual / Whisper Open AI (parte 1)

Поділитися
Вставка
  • Опубліковано 29 чер 2024
  • Este es el primer video sobre el proyecto para armar mi propio asistente virtual el cual correrá de manera local.
    En este video me enfoco en la implementación de un modelo que convierta audio a texto.
    - 🔊 Si quieres apoyar al canal 🫶 para que haya mas y mejor contenido (ganar-ganar-ganar jaja) puedes hacerlo por Patreon! 🔊
    / amptech_cc
    Sigue el video con los comandos y configuración:
    inteligencia.tech/?p=825
    #whisper #homeassistant #inteligenciaartificial #openai
    0:00 - Intro
    0:48 - Reto
    0:58 - Jetson AGX
    1:12 - Plan
    1:52 - Intento 1
    2:30 - Intento 2
    3:02 - Intento 3 (éxito) Whisper
    3:58 - Instalacion Whisper
    4:58 - Código para procesar en "tiempo real"
    5:30 - Sound device
    6:39 - Resultados
    7:20 - Outro
  • Наука та технологія

КОМЕНТАРІ • 210

  • @anthonyp.3856
    @anthonyp.3856 Рік тому

    Impresionante! Me quede con ganas de ver los videos que siguen.

  • @lexcenz
    @lexcenz Рік тому +7

    Voy a estar muy atento a tu progreso. El algoritmo de UA-cam, me leyó la mente dirigiéndome hacia tu video. Hace unos meces le estoy dando vuelta a una inquietud que se me ha sembrado. Conocí a una mujer muy mayor, que en los últimos años ha perdido la vista. Ella tiene 90 años y es escritora, y no logra adaptarse a las interfaces existentes para personas no videntes. Ella quiere recuperar la independencia para poder escribir sin necesidad de intervención de terceros. Toda la interfaces existentes que le pueden permitir a ella volver a redactar un texto, editarlo y archivarlo, exigen en algún punto que ella use braille y/o se familiarice con un teclado. Su edad avanzada le juega en contra para aprender esto último en un tiempo conveniente, pero su lucidez y su prosa está ahí intacta, solo que muda por el momento. Y bueno esa es mi idea. Espero con ansias tus próximos videos.

  • @dylanmolinasolis9006
    @dylanmolinasolis9006 Рік тому +1

    Pues mira, apenas he visto un minuto de tu video y ya me suscribí. Suerte en el proyecto, estaré atento a las actualizaciones

  • @danielsoler1769
    @danielsoler1769 Рік тому

    Encontré este video justo cuando estaba pensando en crear un proyecto asi. Te felicito por tu contenido.

  • @sinonimo8719
    @sinonimo8719 Рік тому

    Bua, estp si quiero ver como va avanzando. Ánimos y muchos éxitos!

  • @javierlegon6893
    @javierlegon6893 Рік тому +4

    💪 Eres grande💪... Este es un gran proyecto. Ya estoy ansioso por ver cómo acaba

  • @abiudmarquezmunoz7525
    @abiudmarquezmunoz7525 Рік тому

    Justo lo que estabas buscando. ❤️

  • @kiskeyamakers
    @kiskeyamakers Рік тому

    Me gusta esto! vamos a darle seguimiento

  • @claudioviajando6184
    @claudioviajando6184 Рік тому

    Muy buen video y la forma de explicar lo que estas haciendo es muy clara. Atento ahora a tus videos

    • @AMPTech
      @AMPTech  Рік тому

      Muchas gracias! Justo estoy buscando ser claro con la explicación pero que también sea contenido ameno.

  • @fpicado1
    @fpicado1 Рік тому

    Espectacular 💯💯💯

  • @emelenziadivbattory5961
    @emelenziadivbattory5961 Рік тому

    Me encanta este proyecto, espero que sigas avanzando!!

    • @AMPTech
      @AMPTech  Рік тому +1

      Muchas gracias! Lo siguiente será el modelo para procesar las palabras que "despiertan" al asistente. Similar al famoso "ok google"

  • @bryanguzman4051
    @bryanguzman4051 Рік тому

    Me ha resultado muy interesante tu vídeo y ha despertado mi curiosidad. Mucho animo

  • @jorgegaspar3878
    @jorgegaspar3878 Рік тому

    Excelente proyecto !!!

  • @agnosticoparatodo
    @agnosticoparatodo Рік тому +1

    Este proyecto es el más interesante que vi este año.

  • @jonathanrodriguez7976
    @jonathanrodriguez7976 Рік тому +1

    INCREÍBLE! Te deseo éxito en tu proyecto.
    Tal vez a muchas personas les guste esto y pueda ser comercial :"D

  • @fabiansolis8285
    @fabiansolis8285 Рік тому +2

    Estaria padre que se pudiera usar como jarvis, Es hacer varias partes de ese proceso, solo que lo que le agregaria seria un modulo wifi, una bateria, y un puerto sim para cargar internet y obvio hacerlo lo mas compacto posible y ultima pero no menos importante seria un audífono de conduccion osia.

    • @AMPTech
      @AMPTech  Рік тому

      No se me había ocurrido algo con audífonos de conducción ósea. Me parece muy buena idea!

  • @rupardo689
    @rupardo689 Рік тому +46

    Una funcionalidad que siempre he pensado para un asistente virtual es que uno le diga algo del estilo: "enseñame sobre x" y este busque el contenido existente en la web y te de una especie de charla resumida sobre el tema. De pronto me imagino que el asistente googlee las 10 primera paginas del tema, tome el texto y se lo de a un GTP3 (u otro) para que te de los puntos más importantes del tema consultado.

    • @AMPTech
      @AMPTech  Рік тому +14

      Suena muy bien. Voy a pensarlo con gpt j o gpt neo. Para no depender del API de open AI

    • @gerardo246
      @gerardo246 Рік тому +2

      Meta sacó algo parecido pero dirigido a cient´ficos, Galactica aunque ya la funaron solo después de 3 días de beta abierta xD

    • @ChinoSable
      @ChinoSable Рік тому +1

      En algún momento use los jars de loquendo con Java pero el reconocimiento de voz siempre fue el problema, ya le había echado el ojo a wisper para solucionar esos detalles, cuando lo probe hacía algunas búsquedas y decia lo primero que te daba el navegador, también te podia decía la ahora 😅 fue bastante divertido, con la IA esto será mas fácil 😍

    • @pictorres
      @pictorres Рік тому +3

      @@AMPTech Sé que no te gustaría depender de OpenAI, pero con respecto a esto en relación al nuevo short que subiste. ¿No crees que ChatGPT podría ser una buena opción a integrarlo y que ayude con esta funcionalidad?

    • @AMPTech
      @AMPTech  Рік тому +1

      Justo en un inicio no me parecia tanto porque quita la dependencia local. Pero decidí que mejor si lo integro y lo contengo bien para que solo salgan a internet ciertas peticiones y no todo.
      Saludos!

  • @RonBastidas
    @RonBastidas Рік тому

    Proyecto super interesante, gracias

  • @lapapeelcubo9029
    @lapapeelcubo9029 Рік тому

    pdt mucho mucho éxito man

  • @martinmolina8461
    @martinmolina8461 Рік тому

    Muy interesante el proyecto, esperando la segunda parte ⌛

  • @LeoEspinoza0
    @LeoEspinoza0 Рік тому

    Este proyecto es impresionante y me emociona mucho. Espero con ansias los demás videos.
    Si se incorporase un reconocimiento óptico de carácteres no sería lo más útil para el proyecto, pero me parece algo interesante a evaluar.
    Gracias por compartir este proyecto y los conocimientos que conlleva 😎😎😎

  • @Antonio-wb9cj
    @Antonio-wb9cj Рік тому +1

    Saludos, explicas muy bien y el proyecto se ve muy interesante

  • @tintintino000
    @tintintino000 Рік тому +1

    Me parece un proyecto increíble. Me suscribo y espero nuevos vídeos del tema!
    Estoy empezando a estudiar desarrollo de apps web, espero algún día ser capaz de hacer cosas como esta :)

  • @jricardom7039
    @jricardom7039 Рік тому +3

    Hola, soy odonlogo/dentista y un obstaculo o necesidad que me gustaría satisfacer con una IA para incluir a mi clinica es poder llenar el formulario (historia clinica) sin la necesidad de contaminar teclado o ratón, evitar el gasto guantes plasticos de transferencia para esta labor, asi poder llenar la historia clinica sentado desde la unidad odonlogica y no tener que interrumpir la consulta.

  • @angelvarela9395
    @angelvarela9395 Рік тому

    me encante este nuevo proyecto, sige haci
    ojala algun dia hacer my propio asistente virtual

  • @alvarodavidjoyohuaman7392
    @alvarodavidjoyohuaman7392 Рік тому

    Simplemente WOW

  • @capablancastyle
    @capablancastyle Рік тому

    Gracias!!!, el futuro es ahora!!!, es muy motivante!

    • @AMPTech
      @AMPTech  Рік тому +1

      Me da mucho gusto! A ver como va saliendo!

  • @sergiovega3115
    @sergiovega3115 Рік тому

    Joder, justo lo que queria hacer, nuevo sub

    • @AMPTech
      @AMPTech  Рік тому +1

      Buena coincinendia!

  • @javiermillatamblay7695
    @javiermillatamblay7695 Рік тому +8

    Me interesaría que generara, cada una hora, una imagen generada con algún modelo como Midjourney4, utilizando como input las frases que más se repitieron en los script transcritos. Así vas generando un album de fotos diario y puedes hacer retroalimentación diaria de tus emociones y vivencias.

  • @rodrigol.9128
    @rodrigol.9128 Рік тому

    Excelente Proyecto!
    Esperando con ansias lo que se viene 💪🔥

    • @AMPTech
      @AMPTech  Рік тому

      Gracias! Vienen varios videos porque cada vez se me ocurren mas funcionalidades jaja

    • @rodrigol.9128
      @rodrigol.9128 Рік тому

      @@AMPTech Excelente! Yo he desarrollado uno, con la poca experiencia que tengo, con funcionalidades cómo, manipular google calendar, enviar mensajes a ciertos contactos, manipular archivos y programas del PC, algunas funciones específicas prediseñadas, reconocimiento facial y alarmas por si alguien se sienta frente a mi PC que no sea yo 😬. En resumen funciones cotidianas, y ahora estaba viendo para cambiarle la voz al asistente para usar las de Amazon, que durante un año es gratuita. La verdad el tema del asistente es un excelente Proyecto, sería interesante integrarle funciones de chatbott y que mediante el asistente converse con el usuario pueda reconocer los comandos sin necesidad de pasarle una palabra clave como Alexa, Ok Google, etc.
      Repito, con ansias de ver avanzar este proyecto y aprender en el proceso. Saludos!

    • @gbrailius4027
      @gbrailius4027 3 місяці тому

      ​@@rodrigol.9128Lo corres desde tu PC ?

  • @gianluquedesimone9660
    @gianluquedesimone9660 Рік тому +16

    Este es uno de los proyectos personales que tengo planeado hacer una vez entre en el mundo de la IA. Este video será de mucha ayuda!

  • @ellobodeacero
    @ellobodeacero Рік тому

    genial! seria genial un sensor de movimiento con camara y que el el asistente virtual haga la acción al reconocer el gesto

  • @FOGSSIETE
    @FOGSSIETE Рік тому +1

    Muy buen proyecto, te felicito inspiras a otros

    • @AMPTech
      @AMPTech  Рік тому

      Muchas gracias Fabián!

  • @lordboss413
    @lordboss413 Рік тому +6

    Y si le pides al asistente cotizaciones de algun producto y luego te presente las mejores opciones... tecnicamente se me ocurre hacerle un scraping de varias fuentes, comparar el de menor valor y luego reponderte con los precios mas optimos. Saludos maestro!

  • @cronos8339
    @cronos8339 Рік тому +1

    Muy impresionado y emocionado! De ver cómo va tu proyecto
    Yo agregaría algo así como un psicólogo integrado", en los proyectos de la comunidad Jetson ví algo que, mientras navegabas con una cámara te decía que páginas te hacían sentir triste o enojado etc, yo agregaría una api para conectarte tu cel, y ver cuando te duermes y te despiertas y conforme a eso te valla preguntando si algo te afectó o así, estarte recordando que estudies ciertos temas de la escuela esto de reactive recall hablado, se me haría súper genial!

  • @renieeevaristovelozmorales5234
    @renieeevaristovelozmorales5234 11 місяців тому

    Espero que vuela a parecer un asistente parecido al gran asistente jarvis, para manejar el computador dialogando con el, todavía los utilizo, pero sería genial si apareciera un asisten te personal con IA y no con comandos escritos elaborados, sería verdaderamente increíble y genial, gracias y gran éxito a su proyecto para el mejoramiento y bien de todos a los nuevo tiempo...

  • @joseleonardosanchezvasquez1514

    Esta como genial voy a ver la serie

    • @AMPTech
      @AMPTech  Рік тому

      Gracias! Ahi si se te ocurren ideas avisame para ponerlas en la lista de posibles upgrades.
      Saludos!

  • @henryvladimirfernandez8549
    @henryvladimirfernandez8549 Рік тому

    Esperamos la segunda parte

  • @primalemandiazdesofy3918
    @primalemandiazdesofy3918 Рік тому +8

    Puedes usar SpeechRecognition del navegador, es lo que yo hice para tener voz a texto en tiempo real.
    Un browser super ligero corriendo en segundo plano que transcribe todo lo que escucha y si dejas de hablar todo ese texto lo manda al asistente core (Que puede ser en python) por una peticion http. Es muchisimo mas rapido y funcional.
    De esta manera te evitas cortar un comando si justo ocurre cuando se hizo el corte de los 10 segundos y capturas todo el texto y lo mandas a reconocer enseguida

    • @gibra537
      @gibra537 6 місяців тому

      Esto no requiere conexión a internet?

  • @ronaldrojasrodriguez375
    @ronaldrojasrodriguez375 Рік тому +1

    Excelente

  • @inversionlatam8707
    @inversionlatam8707 9 місяців тому

    Gracias genio, estaba tratando de armar algo mucho mas simple, que era tener una ia en tu pc, para no comprar token y eso, como tenia una grafica amd no era compatible los modelos, ahora conseguí una nvidia y voy a instalar tu proyecto.

  • @kirito99hn
    @kirito99hn Рік тому +1

    Hola broo me gusta el proyecto mucho en lo personal la idea es mega genial lo que si te puedo sugerir es los comandos de respuesta despues de todo es un asistente debe de tener respues y creo que hay un proyecto que puede gustarte esta en el canal de Nate gentile en el cual hizo algo similar pero mas compacto y creo que eso se podria integrar muy bien al proyecto

  • @asaphgameplays
    @asaphgameplays Рік тому

    Wooow amigo, en serio esta muy elaborado tú proyecto, una función que podrías agregar es decirle un destino, y te diga que horario es el mejor para salir, así como mejores rutas, o que puedas agendar a que necesitas llegar a cierta hora y el te programe todo.

  • @tobiasgarcia2610
    @tobiasgarcia2610 Рік тому

    ¡Estimado Alex!. Es en realidad un enorme placer el poder saludarte, he seguido muy de cerca tus implementaciones en tecnologías como Yolo, estaría muy genial si tu asistente hace uso de la detección de objetos en cualquiera de las versiones de Yolo y ayude al cuidado de los niños, me explico de mejor manera. Si determinas una zona de peligro como la cocina, podrías monitorear en tiempo real objetos que representen un peligro para la integridad física del niño, como un cuchillo, una ventana, una copa de vidrio, un tenedor, entre otros, y tu asistente podría notificar al tutor del niño la proximidad entre este objeto de peligro y su niño.
    Seguiré de cerca tu proyecto, en realidad llama mucho la atención, gracias por siempre compartir tus conocimientos!

  • @laravindelpixel873
    @laravindelpixel873 Рік тому

    Gran vídeo, ha sido una suerte encontrar este canal. Incluso sin tener ni idea de programación más o menos he podido montar algo con la explicación que has dado. Estoy trabajando en un proyecto para montar un animatronico con la capacidad de tener un asistente virtual instalado, entonces .... Sería posible, de alguna forma, incorporarlos cámaras para que pueda tener reconocimiento por imagen? Un saludo.
    Te has ganado un nuevo sub👍👍

  • @isaacbenavides111
    @isaacbenavides111 Рік тому +4

    Bro, pregunta de curiosidad.
    Harás el proyecto open code? Me encantaría ver el repo con todo lo que haces y todos los avances.
    Excelente idea y estoy ansioso por ver los demás vídeos

  • @aperreitar
    @aperreitar Рік тому +3

    Se le puede agregar un motor con ruedas para hacerlo móvil y que cuide la casa o te acompañe como una mascota. Una especie como R2D2. Gracias por tu vídeo pues ya estoy matriculado con tu proyecto. Excelente trabajo 👍

    • @AMPTech
      @AMPTech  Рік тому +1

      Esa idea la tengo en mente desde hace unos años. Hasta me arme un carro de radio control y una cámara 3d.

    • @aperreitar
      @aperreitar Рік тому +2

      @@AMPTech Pues, póngalo en práctica para el asistente virtual, en este curso (un axioma) y podriamos tener nuestro amiguito automata móvil simple con IA... Gracias por tu gran trabajo 🤩

  • @jorgeespana482
    @jorgeespana482 Рік тому

    Saludos!
    Tu canal es oro, contenido super interesante
    También soy programador, acabo de poner mi servidor para los mismos propósitos!

    • @AMPTech
      @AMPTech  Рік тому +1

      Hola Jorge!
      Muy divertido montar tu propio servidor no? He aprendido un montón y aparte es super útil.
      Saludos

  • @francobianconi9227
    @francobianconi9227 Рік тому +1

    Lo que tengo en mi cabeza hace mucho tiempo es inventario automático. O sea, tú le muestras a la cámara o le dices qué vas a guardar dónde, y que la computadora lo recuerde. Y que después te pueda ayudar a buscarlo.

    • @sasac.r7819
      @sasac.r7819 2 місяці тому

      Yo tengo 1, pero funciona por comando de voz, Creo que no necesitas hacer una IA para tener ese programa, saludos.

  • @pcmind9880
    @pcmind9880 Рік тому +1

    Estoy al pendienteeeeeeeeeeeeee del proyecto. A mi me gustaría que pudieras controlar las cosas sin hablar. Tipo, un gesto para activar, y luego otro gesto para ejecutar "subir volumen" por ejemplo.

  • @mastermaster153
    @mastermaster153 Рік тому +3

    excelente iniciativa, siempre he pensado eso que comentaste, serían mucho más útiles con la suficiente información personal pero darle todavia más datos personales a las empresas, no! , estaré atento a los siguientes videos

    • @AMPTech
      @AMPTech  Рік тому +1

      Gracias! Si, quiero dormir tranquilo sabiendo que solo mi servidor es el que procesa y almacena todos mis datos jaja.

  • @videomanjorl
    @videomanjorl Рік тому +1

    Es genial y super interesante. La solución de grabar en bloques de pocos segundos suena bien, pero imagino que no es lo ideal para un asistente virtual. Supongo que ya lo resolverás mas adelante. Te felicito y éxito con el proyecto!

    • @AMPTech
      @AMPTech  Рік тому +1

      Estas en lo correcto, no es ideal. Ahorita eso lo tengo para poder ir recopilando la mayor información posible. Pero despues lo que se tiene que hacer es programar un "wake word" como el clasico "Ok google" y una vez que se escucha la frase clave entonces el asistente virtual sabe que viene alguna petición.
      Eso lo estaré trabajando.

  • @GermAndroidE
    @GermAndroidE Рік тому

    Genial! Muy buen proyecto, enhorabuena. Es genial que esto salga en modelo abierto.
    La IA puede ayudar a los usuarios que quieren usar Linux. Linix es un sistema muy potente pero hay que saber y leer muchos códigos que cuesta mucho entender para los usuarios finales, sobre todo cuando hoy en día es todo tan cómodo como Android o IOS... Pienso que una interfaz de voz puede ayudar a que cualquiera pueda usar Linux, no tengo ni papa de Linux y de hecho cada año tiro la toalla cuando vuelvo a intentar hacer cosas en Linux porque me frustra la documentación infinita de cómo hacer las cosas que con interfaz tradicional ya están resueltas con un click...
    Por ejemplo, actualiza los Drivers, actualiza el repositorio o instala esta aplicación, configurar las opciones gráficas, ejecuta tal programa...

  • @alejandromaciel6469
    @alejandromaciel6469 Рік тому

    Buenas el proyecto me parece espectacular no depender de terceros, estoy en un proyecto donde tengo una raspberry pi en mi auto por el momento quiero controlar con la voz la miltimedia pero seria interesante controlar la alarma de vehciulo luces encendido camaras raderes a futuro, excelente contenido se aprecia mucho su trabajo.

  • @wiffito
    @wiffito Рік тому +4

    Tienes dos proyectos open source bastante potentes, llamados Rhasspy y Mycroft para asistentes virtuales. Estaba deseando ver algún proyecto de asistente con Whisper y me parece un acierto. Quizá los otros dos proyectos te den una idea de cómo organizar parte de la estructura de tu asistente, o puedas implementar tus ideas en los ya existentes.

  • @J.D.O.S
    @J.D.O.S Рік тому +1

    súper el video, me gustaría ver como agregarle una palabra clave para que se active y que además me dijera quién fue el que lo activo. Excelente esta seríe yo hace rato estaba buscando videos sobre este tema para crearme uno parecido para mi casa también.

    • @AMPTech
      @AMPTech  Рік тому

      Gracias Juan! Si justo la “wake word” es una de las siguientes cosas

  • @spacefull369
    @spacefull369 Рік тому +2

    Muy buenas ideas las que quieres poner en práctica y también la de los comentarios, yo creo que desde antes de que saliera whisper al público ya teníamos ideas relacionadas.. me gustaría que hicieras un modelo apegado a lo vas hacer pero con una Raspberry o una Jetson Nano.

    • @AMPTech
      @AMPTech  Рік тому +1

      Este asistente virtual lo tengo pensado corriendo en varios dispositivos. Entonces también adaptare algunas cosas ara RPi o Jetson Nano

  • @Plack85
    @Plack85 Рік тому +1

    Amigo, la verdad es que no entendí mucho de lo que hablabas, aun que creo y confió en que tu proyecto será muy bueno. No soy informático ni me dedico a eso pero es un mundillo que me gusta y me llama la atención espero ir viendo tu progreso y aún que esta muy bien solo te pido que no seas tan técnico y nos hables un poco mas terrenal jajaja pá que podamos entender todos saludos y VAMOS.

    • @AMPTech
      @AMPTech  Рік тому

      Gracias por el comentario Ivan!

  • @ramoncarrasquel
    @ramoncarrasquel Рік тому +2

    Saludos, se ve bastante prometedor tu proyecto y me uno para seguirlo. Existe vosk que también hace el trabajo de stt de forma offline, actualmente uso el modelo small de español y no me ha dado problemas mayores. Puedes pasarle un archivo de audio o utilizar el micrófono. Éxitos en tu proyecto.

    • @AMPTech
      @AMPTech  Рік тому +1

      Hola Ramón, le voy a echar un ojo, ese no lo conozco. Muchas gracias!

  • @geckomaker
    @geckomaker Рік тому

    Interesante encontrar la manera de hacer el chomp del archivo de audio durante los silencios para que las palabras al inicio y final no queden cortadas. Tal vez con dos procesos? Uno que tire el stream de audio a memoria y otro que vaya sacando los trozos, analizando los silencios y generando los archivos. Bonito bonito proyecto.

    • @AMPTech
      @AMPTech  Рік тому

      Justo estoy pensando en como hacer eso. En un inicio pensé que no iba a ser tan complicado, ha resultado ser un poco mas complicado de lo que pensé jaja.

  • @JohanMosqueraVlog
    @JohanMosqueraVlog Рік тому +2

    Excelente!
    No sé qué tan viable sea usar más adelante una integración con ChatGPT en el proyecto, o tal vez si a ésa fecha, ya haya un modelo openSource que haga lo mismo que los que está haciendo OpenAI con GPT. Sería genial hacer eso!. Prácticamente se tendría una versión más cercana a Jarvis 😃

  • @luis_naar
    @luis_naar Рік тому

    me suscribo para ver la continuación del provecto

  • @felipesoto8524
    @felipesoto8524 Рік тому

    Hola, es muy muy buen proyecto.... Lo veo complejo, pero si puede aprender mucho de esto. Por ahí, escuche.... Mira imagina que llevas IA a clases para que tome apuntes, luego se la pasas a otra que puedas chatear, y mas con las IA de voces. Podrias preguntar la información de la clase al asistente. Al principio me pareció mucho, luego he visto videos, creo que es interesante y posible.
    Saludos

  • @carlosmachadom
    @carlosmachadom Рік тому +2

    Por favor podrias compartirnos los presupuestos para comprar los materiales necesarios, enserio me parece muy interesante este proyecto.
    Nota: Que tál la funcionalidad de acceder a tus computadoras encenderlas o apagarlas por comandos de voz y puedas ejecutar aplicaciones o navegar en internet

  • @marcelocheves
    @marcelocheves Рік тому +1

    Gracias por tus videos hermano, queria sabar si será posible que le incluyas una funcionalidad donde al pedirle que abra una hoja excel o check list (tipo lista de compras) y la Ai te vaya diciendo los puntos a chequear, tu le vayas diciendo cuando esta cada punto chequeado y la maquina le haga check a cada punto. Como si tuvieras a alguien dictandote la lista y tu diciendole cuando cada punto esta check y ella pase al siguiente punto. Gracias man.

  • @zamora322
    @zamora322 Рік тому

    Te mamaste, we.

  • @Equinoxio
    @Equinoxio Рік тому

    Buen video, algunas sugerencias de seguridad para que llame al 📞911 y similar:
    1. Que reconozca algunas *palabras clave* para cuando sea necesario llamar a la policía, *en silencio.*
    2. Inclusive, que te pregunte si esta "todo bien" cuando detecte: intrusos, sismos, olor a gas, etc.
    3. Los videos de seguridad, deberían subir a la nube rápidamente, cosa de evitar que te roben DVR con las pruebas.
    4. La perfección es que los mic y cams estén ocultos, por seguridad, solo tú debes saber (créeme te servirá)
    Yo tengo cams en casa, no con IA, pero sí estoy con un sistema de "alerta temprana" por las dudas. Uso iSpy para grabar cuando hay movimientos y Scripts para subir a mi nube privada.

    • @Equinoxio
      @Equinoxio Рік тому

      Inclusive, *mirar* a una cámara puntual, podría ser el "disparador", no hay que limitarse al comando de voz.

  • @MULIG4N
    @MULIG4N Рік тому +1

    Para los dispositivos Jetson se usa nvidia nemo

  • @eladioss02
    @eladioss02 Рік тому

    Hola soy nuevo por el canal, he visto ideas interesantes, aqui algunas cosas que me gustaria:
    1. Asociar la vos con la persona de modo que pueda dar permisos de operacion y demas, de modo que si quiero agendar o guardar un mensaje sea solo yo quien pueda hacerlo y no mi hermana o sobrina(o el ladron).
    2. Dar ordenes o lanzar preguntas a traves de whisper y que la respuesta se muestre en una pantalla, por ejemplo le digo mostrar agenda y que este me lo muestre en el tv o monitor.
    3. Puedes dar mas opciones de dispositivos a usar, buscando el dispositivo mas barato o pequeño pero que funcione, por ejemplo para el modelo de whisper que usaste requeria X ram, pero tu dispositivo tenia mucho mas.
    Gracias y seguire al pendiente de como se desarrolla el proyecto.

  • @andresbuitrago5408
    @andresbuitrago5408 Рік тому +1

    Super el proyecto, felicitaciones seria genial que se pueda configurar si tiene un negocio u oficina y genere un conteo de personas y envíe una alerta si tiene un tráfico más alto de lo habitual que sea un asistente para casa y negocio

  • @danielp8642
    @danielp8642 Рік тому +1

    increible!! gran video. Tengo un par de preguntas.
    1º Se podría implementar una forma de visión por computadora para que con una cámara pueda detectar o clasificar objetos?
    2º Se le podría meter algún tipo de text to speech? y si se puede, se le podría cambiar la voz?
    Siento mi ignorancia de antemano, soy nuevo en esto y realmente voy dando palos de ciego hasta encontrar la solución.
    Un saludo.

  • @dariozambrano2483
    @dariozambrano2483 Рік тому +2

    Me gustaria ver como queda finalizado este super proyecto

    • @AMPTech
      @AMPTech  Рік тому

      Acabo de publicar una actualización. Todavía falta mucho para tener algo final, pero se esta avanzando!
      Saludos

  • @alguien4099
    @alguien4099 Рік тому

    Algo que se me ocurre, que tal vez no es útil, pero si curioso xd, es que integres un cuadro con imágenes generadas por IA, por ejemplo: que tengas una especie de cuadro colgado en alguna pared de la casa (que va ser una pantalla) en el cual puedas plasmar lo que digas. Sería como decirle al asistente algo como "alexa, dibuja un caballo zombie en la luna en el cuadro de la sala" y que cambie xd

  • @JorgeLTS1
    @JorgeLTS1 Рік тому

    Gracias por compartir, me gustaria que al final del desarrollo la podamos utilizar y cada quien ponerle un nombre al asistente, digo para el uso.

    • @AMPTech
      @AMPTech  Рік тому

      Justo ando viendo eso porque no me he decidido en que nombre ponerle, asi que mejor que pueda ponerle el que sea jaja

  • @MrVincko
    @MrVincko Рік тому

    Una funcionalidad que sería útil es el reconocimiento e identificacion de personas, para ver si alguien esta esperando a la entrada de casa dar aviso

  • @zorornoa3864
    @zorornoa3864 Рік тому

    Hola me fascinó tu idea, me ofrezco como tú "becario" me gustaría mucho trabajar en un proyecto como este para aprender y me gustaría ayudarte en cualquier tipo de trabajo que ocupes respecto al proyecto, obvio sin fines de lucro, espero lo tomes en cuenta y mucho éxito yo sé que será un proyecto genial. 👌🏾

  • @cesarkadirtorricovillanuev5638

    Video interesante, pero ¿Cuales son tus objetivos? ¿Qué quieres que haga tu asistente virtual? ¿Quieres que tenga conversaciones con tigo? ¿Que sirva de activador de dispositivos? ¿Que te permita llenar una base de datos con ideas espontaneas que tengas durante el día? ¿Qué planifique tu calendario? ¿Que encienda las luces de las habitaciones que detecte que hayan personas? Una lista con las cosas que tienes planeado sería interesante.

    • @spacefull369
      @spacefull369 Рік тому

      está!!! que permita llenar una hace de datos con ideas, pensamientos, sugerencias, frases, con el objetivo de darle un uso práctico y que nos sea de ayuda en casa, por para alguna fábrica o negoció

    • @AMPTech
      @AMPTech  Рік тому +5

      Hola Cesar.
      Buen punto! voy a documentarlo en un video o articulo. No entré en ese detalle porque quería ser breve, pero sería útil entrar en el detalle. Hay cosas que tengo ya muy bien definidas y otras que necesitaré probar primero para ver su utilidad.
      Saludos!

  • @nandordena
    @nandordena Рік тому

    Supongo que ya lo abran mencionado, pero creo k una de las integraciones más necesarias es la de calendario y tareas (google estaria genial)

  • @borjagomezrouco
    @borjagomezrouco Рік тому

    Lo primero GRACIAS por tu canal, he aprendido mucho contigo y seguro seguire aprendiendo. 2º Seria interesante integrar un registador de listas. Ejemplo, si quieres hacer una lista de la compra que valla creando el archivo y luego pueda enviarte esa lista al telefono o al correo por ejemplo. O un contador de productos habituales en tu nevera, que avise cuando dicho producto baje de un stock determinado.

    • @AMPTech
      @AMPTech  Рік тому

      Hola, Muy buena idea, el contador de productos en mi nevera es justo como nació la idea este proyecto. Sin duda alguna voy a integrarlo.

    • @borjagomezrouco
      @borjagomezrouco Рік тому

      @@AMPTech Pues sin duda estaré en vilo con este proyecto, además de las complicaciones informáticas a ver como solventas el trabajo del hardware a baja temperatura, en principio eso es bueno para nosotros pero la contra es la condensación en las lentes...
      Estoy impaciente!

  • @Maisonier
    @Maisonier Рік тому +1

    Que maravilla. Yo tengo un servidor viejo (xeon 5660) con truenas (que tiene plex, almacenamiento de películas, fotos familiares) . Sería genial poder integrar todo esto en el servidor.

    • @AMPTech
      @AMPTech  Рік тому +1

      Me atrevo a decir que algunas cosas serían mas sencillas en cualquier servidor con AMD/Intel. Como viste en el video, el trabajar con ARM a veces puede requerir un poco mas de trabajo.
      Saludos!

  • @Au-jc2ew
    @Au-jc2ew Рік тому +1

    Me parece un proyecto muy interesante, no tengo asistente virtual, y la razón es precisamente la fuga de información privada, así que seguiré con mucho interés tu proyecto.
    Saludos.

    • @miguelalejandroulloaacampo2062
      @miguelalejandroulloaacampo2062 Рік тому

      Yo conozco uno que es 100% privado

    • @gibra537
      @gibra537 6 місяців тому

      @@miguelalejandroulloaacampo2062 a cual te refieres?

    • @miguelalejandroulloaacampo2062
      @miguelalejandroulloaacampo2062 6 місяців тому

      @@gibra537 el mío! busca asistente virtual ion. su reconocimiento de voz es creado por nosotros y usamos llama 2 para el npl ,

  • @alexispantoja3377
    @alexispantoja3377 8 місяців тому

    seria muy bueno integrar todos los paquetes en un dispositivo portatil como un celular o un reloj, y asi para poder controlar todas las funciones mas facilmente

  • @josedes2000
    @josedes2000 11 місяців тому

    Excelente esta sería de videos, me ha gustado mucho, pero tengo una duda, En este caso es necesario una Jetson AGX?, por que solo este dispositivo en Amazon cuesta 1990$

  • @juanc277
    @juanc277 3 місяці тому

    Hola, en mi caso me gustaría poder editarla para uso personal y acompañamiento en jornadas de trabajo, y configurar ciertas formulas para ayudar al calculo dentro de algun proceso establecido, como packing de frutos en las agroexportadoras o en cualquier fabrica

  • @jorgefernandez4812
    @jorgefernandez4812 Рік тому

    seria interesante integrarle una camara a la puerta de tu casa que te avise al telefono cuando alguien se acerca, un esp32 con camara deberia funcionar bien

  • @michelleon1050
    @michelleon1050 Рік тому

    Hola, lo que se me ocurre es añadir sensores de movimiento para que sepa cuándo entras o sales.

  • @faviosergio
    @faviosergio Рік тому

    Algo que estaría faltando es la interacción como plataforma, enviar el audio desde el lado del cliente al servidor.

  • @andresdiazmarketingynegoci6714

    Ya solo con lo que acabas de compartir, me acabas de ahorrar un montón de tiempo para traducir mis clases de Trading en inglés
    Sin duda te mereces un Super like y hasta más crack
    Saludos desde Colombia 🇨🇴

    • @AMPTech
      @AMPTech  Рік тому

      Hola Andres. Que bueno que te sirvió! Saludos

  • @pablohorchmontespulido1433
    @pablohorchmontespulido1433 Рік тому

    Ya la idea mas loca pero costaria algo de dinero es que hicieran un reentreno de GTP-3 para decirle que X ordenes es igual a X instruccion para asi cuando metas el comando gpt-3 lo interprete ... esto serviria para tu en vez de hacer un if cuando diga encender {X} en home assitan encienda X, porque tu puede decir prende, enciende, activa, enchufa, y asi con muchas palabras , el cual gpt.3 podria aprender de tu lenguaje natural para asi si hacerlo bien y no poner un millon de if

    • @AMPTech
      @AMPTech  Рік тому

      Buena idea, creo que una manera de reducir costos de esta idea sería utilizar algún modelo como GPT-neo o GPT-J los cuales no requieren de pagar un API para hacer las inferencias.

  • @nqual5
    @nqual5 Рік тому

    Estoy creando un proyecto similiar con Pabbly y apenas voy conectando GPT-3. Puedes crear un flujo de trabajo conectado con Whatsapp y usar una conversacion como tu asistente personal y el pudiera interactuar con una tu agenda.

  • @josecarlosa439
    @josecarlosa439 Рік тому

    Podrias hacer un sofware que con visión artificial , busqueda de objetos, localización de estos, o acciones que hagan, pueda relatar la imagen o el video, tal como lo haria una persona que está observando la escena y diciéndoselo a una persona invidente.

  • @lapapeelcubo9029
    @lapapeelcubo9029 Рік тому

    yo estaba haciendo un asistente y pensaba en usar whisper para que mi papá que tiene tendinitis deje de escribir tanto y un asistente así que lo ayude a redactar sus documentos mejor que la mayoría de estos programas sería genial, nunca se me ocurrió meterlo si en una máquina de esas, está cariñosa si (caro) pero pienso que puedo ahorrar para un agx ,🤞ojalá salga bien

  • @tonirojas
    @tonirojas Рік тому

    Desde que salió whisper estoy trabajando en un proyecto muy parecido pero en windows. Tienes discord? Estaría bien intercambiar info con tu comunidad. GRACIAS POR TU VIDEO

  • @jefoorcasberro8855
    @jefoorcasberro8855 9 місяців тому

    Probablemente llego algo tarde pero vi en un video que un chico hace que cuando le tocan el timbre le llega un mensaje a wpp, estaria bueno implementar que el asistente te avise cuando te tocan timbre.

  • @mrmix3243
    @mrmix3243 Рік тому

    Espectacular video, seriviria con una rasberryPI 4?

    • @Raizazel
      @Raizazel Рік тому +1

      No, lo que el ha montado es una Jetson Orin, la mas potente de todas la Jetson que vale unos 2000€. Está pensada para correr redes neuronales en GPU y la raspberry ni tiene gpu ni potencia de cpu suficiente. Piensa en este proyecto como algo que vas a ver y te va a resultar interesante que como un tutorial. La otra opción sería correr todo en un PC pero minimo te haría falta un PC moderno de al menos 600€.

  • @pictorres
    @pictorres Рік тому +1

    Soy más creativo que programador la verdad, así que no sé qué tan plausible sea hacer esto. Sin embargo, te daré ina idea de optimización que sería utilizar un sensor de movimiento donde esté ubicado el dispositivo con micrófono, para que sólo empiece a grabar cuando estés en la habitación respectiva, y se desactive cuando no haya movimiento en un tiempo, y por cierto, creo que apenas 10 segundos pueden terminar cortando algún comando (si encuentras otro modelo que lo haga en tiempo real sería increíble).
    En fin, es esto:
    Me gustaría ver integrado como asistente a un chatbot al estilo de ChatGPT o Lambda (pero omitiendo la parte en la que me miente para convencer), y es que más que un asistente virtual que solo atiende a comandos muy específicos que le indique previamente, me gustaría tener un "compañero" que me responda por voz de manera fluida, y aún así atienda a mis comandos cuando los reconozca, al mejor estilo de Jarvis en Iron Man... Entiendo que comprimir esto en un tiempo de respuesta bajo, y con recursos reducidos sería complejo, ya que además de Whisper, se necesitaría un generador de chatbot o el mismo ChatGPT, y un transformador de texto a voz (como los nuevos que han salido que pueden hasta representar emociones, Jarvis expresaba sarcasmo o leves tonos de preocupación). Quizás solo se pueda hacer una parte de esto, o qué aún se tenga que hacer en un equipo más potente para lograr una velocidad más óptima, pero sé que estamos más cerca de lograrlo.

    • @AMPTech
      @AMPTech  Рік тому +1

      Esa visión final suena genial. Será cuestión de ir viendo como salen los modulos actuales e irlo mejorando poco a poco.

  • @stivenmahecha8560
    @stivenmahecha8560 Рік тому

    Mete gpt chat y alguna conexión con el móvil vía internet, para no tener que estar ligado a un micrófono fijo

  • @SatellaNNW
    @SatellaNNW Рік тому

    Ya me imagino tener mi propia Asistente iA para hacer tareas y la universidad. Es la compañera que siempre te recuerda las cosas. ¿Sería posible?

  • @xacompany
    @xacompany Рік тому

    ¿Qué tan factible sería hacer un asistente virtual (otro proyecto quizás) con lenguaje de señas, y la respuesta sería encender/apagar luces? o hacer una llamada a un número de urgencias pidiendo ayuda con una voz digitalmente generada. Gracias por el excelente contenido.

  • @NACHOXMC
    @NACHOXMC Рік тому

    Podrias subir alguna carpeta o algun ejecutable que nos instale todo el packege del asistente cuando ll termines, creo que lo que estas haciendo es soñado por muchos y seria de gran ayuda