😮 Cómo Usar ChatGPT Sobre Información Interna De Tu Negocio

DataScience ForBusiness

2 600

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 5 лют 2025
👉 Notebook con el código: datascience4bu...
Esta aplicación de ChatGPT lo cambia todo. Hasta ahora ChatGPT nos ayudaba sobre todo como profesionales, escribiendo texto o código.
Pero estábamos limitados a la información con la que ChatGPT había sido entrenado.
Con lo que te explico en este vídeo ya puedes usar toda la capacidad de ChatGPT para analizar la información interna de la empresa (ten cuidado con las cuestiones de privacidad).
#chatgpt #openaiapi

КОМЕНТАРІ • 141

@yuniorbatista2416 Рік тому ⁺⁵⁵
Seria interesante una segunda parte con la implementación de este codigo como un servicio de chatbot en una página web
@joser100 Рік тому ⁺⁴¹
Gracias por el video... vale como introduccion pero me temo que podria llevar a conclusiones erroneas a gente que quiera usar este metodo para procesar datos de su empresa, ya que esta muy simplificado y con ello pierde aspectos importantes.
El hecho es que LlamaIndex no puede por si mismo crear esos embeddings/vectores y necesita usar el LLM (algun codex de OpenAI como ADA-003 u otro mas avanzado, ya sea de OpenAI u otro LLM) para generar esos embeddings, es decir, hay dos fases con acceso al LLM, en una primera fase tus datos tienen que ser pre-formateados, en tu ejemplo usas un PDF, pero podrias tener video, bases de datos, u otra informacion que este en formatos privados (datos en Jira, CRMs como Salesforce o muchos otros soportes que pueden usarse en el ambito de empresa), hay un trabajo de adaptacion que no lo va a hacer LlamaIndex (ni siquiera con la version 0.6.0 que lanzaron esta madrugada). LangChain (que tambien es Open Source) tiene mejor cobertura para este pre-procesamiento del corpus de datos, el punto fuerte de LlamaIndex esta mas en la indexacion de los embeddings para realizar, posteriormente, la busqueda semantica cuando lances una pregunta.
No voy a alargarme mas ya que lo que queria realmente mencionar es el hecho de que todos los datos que quieras procesar tienen que pasar por OpenAI API en esa fase inicial de creacion de embeddings (a no ser que uses un LLM distinto que sea Open Source y que puedas controlar para que tus datos privados no salgan fuera de tu empresa).
He visto que en el ejemplo has usado un documento publico, pero cuando se trata de informacion de caracter sensible de una empresa (en cualquier soporte) hoy dia yo no la pasaria por los APIs de OpenAI, he visto que mencionas los temas de privacidad, perfecto, pero queria poner este aviso adicional para navegantes...
(hace un par de dias OpenAI abrio la puerta a quitar el uso de la memoria de ChatGPT, esto lo hizo para responder a la presion de la EU, empezando por Italia, sobre esos temas de prevacidad, sobre todo el hecho de que TODO lo que se manda a traves del API puede ser usado por OpenAI para entrenar nuevas versiones, con lo que es posible que si se envian datos de caracter privado, estos puedan aparecer en publico en el futuro, bueno, en el nivel y grado en que los entrenamientos y fine-tunings llegasen a usar esos datos, pero en cualquier caso OpenAI considera que toda esa informacion que se esta pasando por ChatGPT y los APIs les pertenece como parte del dataset para entrenamientos futuros y esto es importante saberlo, el problema es que al quitar la "memoria" se pierde gran parte del valor que nos da ChatGPT...)
En cualquier caso, si este mensaje sirve para alertar sobre el problema de la privacidad de los datos que se comparten con OpenAI, mision cumplida...
@CeroCool212004 Рік тому ⁺³
Excelente apotación, caballero. 👏
@airebreton Рік тому ⁺¹
gracias @joser100 por puntualizar. justamente todo el interés está en usar un LLM distinto a openAI para poder retener los datos. por ejemplo quiero poder ofrecer una consulta en base a datos elegidos por mi, aunque algunos sean públicos, otros son privados, en cualquier caso quiero retener mi trabajo de recopilación para poder monetizar mi servicio y que éste no se regale. lo de que "abran la puerta a quitar la memoria" en openAI no da aún la confianza necesaria para lanzarse a usarlo. alguna sugerencia de qué LLM de código abierto se puede usar para el caso de la consultoría sobre una selección de documentos? en cualquier caso gracias por precisar, porque ya voy más encaminado.vaya bien.
@NWqwerty Рік тому ⁺¹
@@airebreton vicuna, aunque tendria que probar porque no es igual de potente a chatgpt
@Nacho369 Рік тому ⁺¹
Hola Jose, podría escribirle de forma privada por la cuestión que comenta? gracias de antemano
@joser100 Рік тому
@@Nacho369 claro
Рік тому ⁺¹
Magnífica aportación y de gran valor!! Mil gracias Isaac!!
@churtado1984 Рік тому ⁺¹
sos de otro mundo, gracias por cmpartir ... empezare mi semana
@edwardjavier4925 Рік тому ⁺¹
Muy poderoso código, he aprendido un montón. Me volaste la cabeza. Te cuento que el primer error que me salio fue al ejecutar el código de SimpleDirectoryReader para leer el pdf, y le puse el siguiente codigo:
!pip install PyPDF y se arregloooo.
Ahora tengo el siguiente error al hacer mi pregunta
AttributeError Traceback (most recent call last)
in ()
2 pregunta = input('Escribe tu pregunta
') + "Responde en español"
3 respuesta = index.as_query_engine().query(pregunta)
----> 4 for frase in textwrap.wrap(respuesta.response, width=100):
5 print(frase)
/usr/lib/python3.10/textwrap.py in _munge_whitespace(self, text)
152 """
153 if self.expand_tabs:
--> 154 text = text.expandtabs(self.tabsize)
155 if self.replace_whitespace:
156 text = text.translate(self.unicode_whitespace_trans)
AttributeError: 'NoneType' object has no attribute 'expandtabs'
Ojala puedas ayudarme con este error por favor. Saludos y muchas gracias por tu tiempo.
@DataScienceForBusiness Рік тому ⁺¹
lamentablemente en este área las cosas están poco estandarizadas y hay mucho trabajo de "fontanería". lo mejor en esos errores es googlear, la casuística es casi infinita
@watsaysurfschool-cantabria Рік тому ⁺¹
Llevaba mucho tiempo buscando esto, gracias por el aporte.
@JackDaniels-xq2hu Рік тому ⁺²
De locos esto es de vertigo cada vez tienes que aprender más y más para sacar alguna ventaja
@DataScienceForBusiness Рік тому ⁺¹
sí, por un lado eso es bueno si te gusta aprender cosas nuevas, por otro te puede llegar a sobrepasar si intentas llegar a todo en lugar de especializarte
@JuanCarlosSilva-z1w 5 місяців тому ⁺¹
La semana está cerrada... ya estoy en la lista de espera, ojala la abran pronto.
@enriquemartinez3380 Рік тому ⁺⁴
Como siempre muy interesante tus videos Isaac. Aunque parece que ChatGPT cada vez irá ampliando más las ventanas de contexto y que con los pluguins que se está desarrollando y que vendrán cada vez más funcionará como un asistente que hará cualquier tarea que necesitemos, sin duda la necesidad de saber cómo preguntarle y el tener los skills para entender y desarrollar la interacción con él, seguirá siendo algo fundamental. Ejemplo es el concepto de "Prompt Engenieer" como nueva profesión.
@edwarddrago9686 7 місяців тому ⁺¹
Master, gracias por compartir, excelente trabajo
@usuarioift9067 Рік тому ⁺¹
Tuve que hacerle varios cambios al codigo en diciembre del 2023 porque ya no funciona. Aqui les dejo algunos cambios: from llama_index import GPTVectorStoreIndex, SimpleDirectoryReader, LLMPredictor, ServiceContext
index = GPTVectorStoreIndex.from_documents(pdf, service_context = service_context)
Y en el while poner
respuesta = query_engine.query(pregunta)
print(respuesta)
@MartinEnriqueBertello Рік тому ⁺¹
Excelente aporte, y muy bien explicado!
@ThePablete15 Рік тому ⁺¹
Muy interesante, muchas gracias por el video
@higiniofuentes2551 6 місяців тому ⁺¹
Gracias por este video tan útil!
@darahmireh Рік тому ⁺¹
Súper! Te pregunto, si quisiera añadirle un rol, ¿en qué parte del código se integra esa parte?
@DataScienceForBusiness Рік тому ⁺¹
Con lo que tenemos en este ejemplo concreto se lo tendrías que añadir en la pregunta. Pero en langchain hay una funcionalidad un poco más avanzada, que se llama "prompt template" con la que puedes crear prompts más avanzados, meterle cosas como el rol, o hacer que partes del prompt sean dinámicas. busca ese término
@victorhuelvap Рік тому ⁺²
Una pregunta! ¿Sería capaz de interpretar la información que le proporcionas, o solo actúa de "buscador" como en chatpdf? Gracias
@albertdones7727 Рік тому ⁺¹
Muuuy bueno !! Muchas gracias !!
@jorgeantoniocabreragonzale3366 Рік тому ⁺¹
Antes que nada muchas gracias por material compartido. Muy interesante y magistralmente expuesto. Quisiera compartir que intentado reproducir el ejercicio, pero tropiezo con el problema de que el componente GPTSimpleVectorIndex no me reconoce su importación llama-index.
Datos instalacion:
Python 3.11.3
aiohttp==3.8.4
aiosignal==1.3.1
async-timeout==4.0.2
attrs==23.1.0
certifi==2023.5.7
charset-normalizer==3.1.0
colorama==0.4.6
dataclasses-json==0.5.7
frozenlist==1.3.3
greenlet==2.0.2
idna==3.4
langchain==0.0.169
llama-index==0.6.7
marshmallow==3.19.0
marshmallow-enum==1.5.1
multidict==6.0.4
mypy-extensions==1.0.0
numexpr==2.8.4
numpy==1.24.3
openai==0.27.6
openapi-schema-pydantic==1.2.4
packaging==23.1
pandas==2.0.1
pydantic==1.10.7
PyPDF2==3.0.1
python-dateutil==2.8.2
pytz==2023.3
PyYAML==6.0
regex==2023.5.5
requests==2.29.0
six==1.16.0
SQLAlchemy==2.0.13
tenacity==8.2.2
tiktoken==0.4.0
tqdm==4.65.0
typing-inspect==0.8.0
typing_extensions==4.5.0
tzdata==2023.3
urllib3==1.26.15
yarl==1.9.2
@jlueiza Рік тому
reemplazalo por esto index = GPTVectorStoreIndex.from_documents(pdf, service_context=service_context)
@yomismo-64 Рік тому ⁺¹
Te felicito, muy instructivo y bien explicado.
@RicharGonzalez Рік тому
Hola, muchas gracias por el aporte, pero te quiero contar que baje el desarrollo pero no funciono, se queda topado en la lectura de los pdf. ¿que puedo hacer? nota. no se nada de la programación a este nivel.
muchas gracias
@platerplane Рік тому
enorme video, con su explicación teórica previa bastante clara. Muchas gracias!!
@VictorFernandez-wf5lj Рік тому
me temo que da error al ejecutarlo (cannot import name 'GPTSimpleVectorIndex' from 'llama_index'), ha cambiado algo? por ejemplo: "GPTSimpleVectorIndex was renamed to GPTVectorStoreIndex, try removing it from the end of your imports"
@RicharGonzalez Рік тому ⁺⁴
Que impresionante poder usar esta herramienta como la muestras, me encanto tu video y muy bien explicado, realmente quedo muy agradecido por entregar esta información y que podamos prender a este nivel. Muchas gracias.
@leocam840 Рік тому
Que buen video, ahora me queda la duda de si esto se puede implementar en una pagina web pero ya me diste la idea para empezar con algo, gracias buen video!
@DataScienceForBusiness Рік тому
sí se puede, hay un montón de conectores para diferentes tipos de información
@MartinGersbach Рік тому ⁺¹
Excelente capítulo ! ❤
@noeliaferrero1158 Рік тому
Excelente contenido como siempre, muchas grac x compartir! consulta, puede ser que se cambio/actualizo algo en el código? porque hace días que lo intento y no me esta funcionando...
@CamiloOrejuela Рік тому ⁺¹
Muy buen video amigo. ¿Qué tal el tema de analizar datos de Excel con ChatGPT para crear informes? Es posible? Existe alguna herramienta para ello?
@DataScienceForBusiness Рік тому ⁺¹
sí, es posible con herramientas similares a las del vídeo: gptindex, langchain. pero conociendo la implicación de microsoft en openai no creo que tarden mucho en incluirlo de manera nativa y de serie en excel
@Nacho369 Рік тому
Muchas gracias por el aporte. Me descargué el archivo y en el paso "Indexar el contenido de los PDFs" me da error y no consigo solucionarlo. Gracias
@Tulipisthori Рік тому ⁺¹
No sabía de chatpdf gracias
@armandoortega3837 10 місяців тому
Que puedo hacer si hay diferencias entre las políticas de privacidad de mi empresa y las de chat Gpt, como puedo implementar estos modelos personalizados en materia de privacidad?
@javi_v7.0 Рік тому ⁺¹
Gran video, ¡muchas gracias Isaac!
@skullsp 9 місяців тому
Necesito hacer esto mismo pero en una web publica. Hay algun video?
@mite45 Рік тому ⁺¹
Excelente video y aportes Isaac, ya estoy probando para implementaciones con Gradio y/o Flask para mejora de interface. Entiendo que podrían seguir incorporando aplicaciones con Llama y otras librerías para potenciar la App. Gracias Mil.
@katafrakto Рік тому
Muchas gracias por compartir el código y las explicaciones, ¿se pueden usar otros modelos aparte de chatGPT?
@DataScienceForBusiness Рік тому
Sí además del resto de openai también puedes usar de otros vendors como cohere, y tb opensource, por ej de HuggingFace
@camilocespedes1046 Рік тому ⁺²
Hola Isaac, muy buena tu explicación. Una cosa que me llama la atención es la capacidad de automatización que existe en los data job. ¿Crees que las IA reemplazarán en gran parte la labor humana de estos trabajos?
¡Saludos!
@DataScienceForBusiness Рік тому ⁺³
Al revés! creo que estamos en la mayor ventana de oportunidad en este campo en muchos años. En breve voy a publicar un vídeo explicando por qué pienso así.
@alexandrelc4361 Рік тому
Muy interesante tu video, gracias por compartir tus conocimientos. Tengo una pregunta: ¿Chatgpt cobra por los tokens de lectura de documentos o solo cobra por los tokens de solicitud y respuesta?
@DataScienceForBusiness Рік тому
Entiendo que te refieres a la api. Y lo de lectura de documentos supongo que refieres al embeding. Cobra por todo ello, pero son precios y modelos diferentes. En esta página puedes ver los diferentes modelos y sus costes: openai.com/pricing
@rafadipre Рік тому ⁺¹
Buenisimo este video
@andressterenberg6657 Рік тому ⁺¹
muy Buenoooooo!!!
@maltimiras Рік тому
Gracias por el video! Muy interestante. A mi me da error PdfReadError: EOF marker not found independientemente del pdf que le suba....
@maltimiras Рік тому
Igual porque estoy en Mac?
@VictorFernandez-wf5lj Рік тому ⁺¹
Muy interesante, en el directorio de datos, podrían ser otros formatos, no sólo pdf, no?
@DataScienceForBusiness Рік тому ⁺²
Sí, llamaindex tiene un montón de conectores para diferentes formatos
@VictorFernandez-wf5lj Рік тому
Pero en el ejemplo del notebook, no se cita el formato de los documentos en ningún sitio
@aspirezr Рік тому ⁺¹
Muy bueno, muchas gracias.
@brunomarti3308 Рік тому
Impresionante como siempre.
@DataScienceForBusiness Рік тому
gracias!
@CarlosDiazR Рік тому
El tema del calculo, es porque no le hiciste bien la pregunta. Siempre tienes que indicar cómo algo.
"Suma todos los salarios de los consejeros y divide el resultado entre todos los consejeros de la lista para saber cual es el salario medio."
Estoy seguro que te lo dice si se lo dices de esa manera.
@raulalcauza7025 11 місяців тому
Hola.Buen video! Aunque estoy intentando replicarlo en mi VSC, pero no es posible, me sale el siguiente error: from llama_index import GPTVectorStoreIndex, SimpleDirectoryReader, LLMPredictor, ServiceContext ImportError: cannot import name 'GPTVectorStoreIndex' from 'llama_index' (unknown location). He visto que ha surgido con anterioridad, pero es que al usar Google Colab también me ocurre el mismo error. En la documentación no hace referencia a esto, ha cambiado en algo la estructura. Por si alguien puede guiarme un poco. Gracias!
@maoramirez10 Рік тому ⁺¹
Excelente información no se si se me paso por alto en el vídeo pero hay algun límite o cantidad de gigas que podamos subir en formato PDF?
@ivan321pum Рік тому
Creo que eran 2000 páginas o algo así
@DataScienceForBusiness Рік тому
no lo he llevado al límite, pero por cómo funciona entiendo que no. pero ten en cuenta el coste, a más tamaño más coste
@EmilioPerez-n7l Рік тому ⁺¹
muy interesante!
aunque no creo que las empresas vayan a subir sus cuentas/resúmenes al chatgpt para que tenga información privada suya...
@ListaUbU Рік тому
funciona en simultaneo con todos los pdf q uno le suministre? cruza datos entre diferentes pdf?
@DataScienceForBusiness Рік тому
langchain tiene funciones para cargar por ej todos los pdfs que tengas en una carpeta. no es que cruce datos literalmente, pero todo el contenido de los diferentes pdfs va a la misma bbdd vectorial. así que si hay info relevante para la consulta en diferentes pdfs si le llega al modelo llm y luego éste ya decide cómo combinarla para dar la respuesta
@hmendezg Рік тому ⁺¹
Gracias por este video. Tengo dos preguntas: 1) ¿Qué costo por el uso de la API generó el ejemplo? 2) ¿Los datos del contexto quedan al alcance de OpenAI?
@DataScienceForBusiness Рік тому
Muy poco coste, 2 o 3 céntimos. Sí, lo comento en el vídeo y lo repito, cuidado con los datos. Ahora parece que están trabajando en una versión que no se quedará con los datos, pero por el momento parece que sí lo hacen. Hay que leer muy bien la policy.
@icerimuru Рік тому
Nuevo sub c: Gracias por el contenido python es amor ❤
@unobuscando Рік тому
Cómo sacas la información resultante fuera del entorno de programación, por ejemplo en una web, otra aplicación, documento pdf o Word, hoja Excel, etc.?
@Furkunst Рік тому ⁺¹
Como puedo hacer lo mismo con archivo CSV?
@crearelectronica Рік тому
Exelente vídeo... Al utilizar ése servicio la información está en los servidores de ellos o se instala en un servidor propio?
@DataScienceForBusiness Рік тому
En este caso en los de Google y en los de OpenAI
@oscar2651958 Рік тому
Excelente video! Solo un tema, cuando estoy ejecutando en Collab el python, me sale el error
ImportError: cannot import name 'GPTSimpleVectorIndex' from 'llama_index' (/usr/local/lib/python3.10/dist-packages/llama_index/__init__.py)
Alguna idea? creo que fue cambiado el GPTSimpleVectorIndex ?
Agradecere su ayuda ...
@DataScienceForBusiness Рік тому ⁺²
Efectivamente han cambiado la clase. Para arreglarlo en el notebook:
En todos los sitios donde ponía GPTSimpleVectorIndex cambiarlo por GPTVectorStoreIndex
Donde ponía index.query(pregunta) cambiarlo por index.as_query_engine().query(pregunta)
@pablobraojos Рік тому
@@DataScienceForBusiness La primera correcion funciona biem, pero al poner index.query(pregunta) o index.as_query_engine().query(pregunta) da problemas...
Graciasss de antemano
@VictorFernandez-wf5lj Рік тому
@@DataScienceForBusiness me sucedia igual y ya funciona, muchas gracias
@carlosarrasco Рік тому ⁺¹
Una consulta, mencionaste que openai te daba $5, eso significa que el uso de su servicio es limitado hasta un cierto número de consultas? Y luego habria que pagar?
Muchas gracias por el vídeo y la información, se aprecio mucho su esfuerzo!!
@DataScienceForBusiness Рік тому
Correcto, al menos eso te daban en el momento que hice el vídeo, no sé si ahora habrá cambiado. Pasado ese límite ya tienes que meter una tarjeta si quieres seguir usándolo.
@jordannolasco1527 Рік тому
Hola, una pregunta, con la IA, que se puede estudiar para no quedar obsoletos con el tiempo, porque he visto que ya lo está haciendo
@DataScienceForBusiness Рік тому
Gran pregunta. Creo que hay 2 partes: lo que tiene que aprender un profesional, que implica frameworks, librerías, etc. Y lo que tiene que aprender una persona "normal" de cualquier otro trabajo, que implica herramientas finales de usuario como chatgpt, midjourney, etc. Lo apunto para un vídeo
@dandradejose Рік тому
Pero al final has hecho un Google Colab, uno pensaría que terminaría haciendo un GUI como en la explicación del inicio.😢
Probaré usando unas librerías que convierten cuadernos en apps.
@hbmichang Рік тому ⁺¹
Hola buen vídeo! Quería preguntarte en qué lugar puedo seguir estudios de Data Science y/o Inteligencia Artificial, ya sea bootcamp, curso, instituto, universidad, etc para adentrarme más en el tema, claro que empezaré por el recurso que facilitaste, pero luego? Gracias!
@DataScienceForBusiness Рік тому ⁺²
Te recomendaría mi empresa claro. Al final de tu primera semana puedes pedir información sobre el programa Python data science mastery
@bradleysandoval1323 Рік тому
Hola Isaac
Disculpa que te moleste 😅 aparte de data science también impartes cursos adentro de tu bootcamp para data engineer amarrado con Cloud Aws?
No he visto en el programa sobre SQL seguramente lo explicas pero quería quitarme la duda, me gusta mucho la forma en que explicas y nos quitas las dudas 💯
@DataScienceForBusiness Рік тому ⁺²
No, mi especialidad es data science y data analytics. No soy experto en data engineering
@alexhurtadomktd Рік тому
Super interesante, quiero aprender ha hacer esto para conectarlo a un chatbot de Whatsapp. Podria lograrlo a traves de una API? o que ruta deberia seguir?
@DataScienceForBusiness Рік тому
estos servicios suelen operativizarse mediante apis
@alexhurtadomktd Рік тому
@@DataScienceForBusiness Tal ves debo explicarme más. ósea un mejor promt, para lograr una respuesta más satisfactoria.
Yo implemento chatbots con plataformas como chatrace, uchat, manychat, etc estas tiene un bloque que se llama solicitud externa que trabaja a partir de APIS; entonces quisiera realizar la pregunta desde whatsapp, que esta consulta se la entregue en el google colab que acabas de enseñar y que retorno que la respuesta al mismo chatbot para entregarsela al usuario que realizo la consulta, es este escenario conversacional que no se como se podria lograr o que ruta deberia seguir para lograrlo. De antemano agradezco cualquier guia.
@jaimeluna99 Рік тому
Me parece que es una masterclass única y sin igual en todo lo que he buscado. Felicitaciones. Pregunta: como puedo integrar este resultado a una pagina web o teams corporativo? La idea es que los empleados hagan preguntas en un chat y se conecte con lanrespuesta que gera este código. Gracias y saludos.
@DataScienceForBusiness Рік тому ⁺³
Díselo a sistemas, no es muy complicado. Podrían crear una api sobre este script que sea llamada por la búsqueda del usuario en la aplicación y devuelva el resultado en la misma. De nuevo, cuidado con la confidencialidad, revisad bien las políticas de OpenAI y que sea complience con las de la empresa.
@Cieofkgkrlalvie Рік тому
Me falla el paso de 3 from llama_index import GPTSimpleVectorIndex, SimpleDirectoryReader, LLMPredictor, ServiceContext, dice que el GPTSImpleVectorIndex no se puede instalar
@DataScienceForBusiness Рік тому
Efectivamente han cambiado la clase. Para arreglarlo en el notebook:
En todos los sitios donde ponía GPTSimpleVectorIndex cambiarlo por GPTVectorStoreIndex
Donde ponía index.query(pregunta) cambiarlo por index.as_query_engine().query(pregunta)
@Artemius79 Рік тому
Muy buen video, todo el contenido es muy informativo. Tengo experiencia de dos años como desarrollador de software empresarial, en el área de mantenimiento, y viendo el panorama (y para seguir creciendo) he estado analizando un poco sobre este mundo del Data, y mi perfil pareciera encajar más con ingeniería de datos.
Que ruta me recomiendas para lograr avances en esta área?.
De momento no pienso en dejar mi empleo , sino, mejorar mi perfil actual. Muchas gracias de antemano!
@DataScienceForBusiness Рік тому
no es mi especialidad pero sin duda lo siguiente lo vas a necesitar: python, java, bbdd relacionales y sql, big data: ecosistema hadoop y spark, cloud y orquestadores de flujo: airflow, ...
@ERUANNU Рік тому
Existe un error en el codigo y no encuentro como corregirlo. Esta en la linea 3 del cuando se llama a llama_index
@DataScienceForBusiness Рік тому
Efectivamente han cambiado la clase. Para arreglarlo en el notebook:
En todos los sitios donde ponía GPTSimpleVectorIndex cambiarlo por GPTVectorStoreIndex
Donde ponía index.query(pregunta) cambiarlo por index.as_query_engine().query(pregunta)
@bernietgn6406 Рік тому
Gracias por el vídeo. Muy instructivo. Dime, por favor, que ese código para la API es falso y no funciona... 😅
@DataScienceForBusiness Рік тому
sí sí funciona. pica los dígitos uno a uno y comprúebalo. quizá la primera vez no, pero hazlo 10 veces y seguro que va ;-) ...
... nota: por si acaso alguien no lo pilla que no lo intente, era una broma
@judexmx Рік тому
Qué pasa con la información que se carga en relación con la privacidad de la información?
@DataScienceForBusiness Рік тому
lo comento en el vídeo. de momento no recomiendo cargar info sensible. hay iniciativas que están trabajando para mejorar en ese sentido.
@DesarrolloADE17 Рік тому ⁺²
Buen video
@om4le Рік тому
una consulta por que no me deja descargar el notebook de codigos? me dice que no tengo ninguna aplicación que pueda abrirla
@DataScienceForBusiness Рік тому
es un notebook, tienes que abrirlo con Colab, Jupyter, Vscode, etc
@om4le Рік тому
@@DataScienceForBusiness muchas gracias, pude abrirlo y hacer el ejercicio como tú. Solo que me daba error en el Index
@JhonJorgeCcamerccoaYucra Рік тому ⁺¹
si recontra funciona
@leonfinanciero Рік тому
Seria bueno que le metas una enciclopedia de 5000 páginas haber como funciona la cosa.
Saludos amigo.
@RomeoGaete Рік тому
si quisieras ponerlo en una interfaz grafica como lo harías?
@DataScienceForBusiness Рік тому ⁺¹
si es solo para prototipar puedes usar streamlit o gradio. si es nivel más empresarial puedes crear una api que sea llamada por la aplicación web
@franprimolarry Рік тому ⁺¹
Tengo una cuestión, el hecho de importar toda la información de negocio a ChatGPT ¿vulneraría la privacidad de datos?. ¿Cómo podríamos mantener los datos a salvo utilizando ChatGPT?
@DataScienceForBusiness Рік тому ⁺¹
La info que le metes puede ser usada para reentrenar sus modelos (ahora están metiendo opciones para que puedas bloquear esto). Por eso como digo en el vídeo hay que leer bien la política de Openai y saber lo que le metes, tanto en la api como en el propio Chatgpt. En el corto plazo estoy seguro de que las empresas incorporarán versiones propias y locales de LLMs para poder hacer estos usos de forma escalable y segura.
@sgnshogun Рік тому
Hola @@DataScienceForBusiness! Felicidades por el video, super interesante!! Tienes algún enlace o recurso donde explique como montar una LLMs local? Me interesa mucho este punto. Gracias!
@millernavia7697 Рік тому
@@DataScienceForBusiness Hola, genial el video, mil y mil gracias
estoy ejecutando el codigo y en un momento creo que me dio error por creditos, pero no es claro si es de Openia o de google.
RateLimitError: You exceeded your current quota, please check your plan and billing details.
The above exception was the direct cause of the following exception:
sabes que peude ser?
@asieriturriotz271 Рік тому
Muy interesante!
@gogomac Рік тому ⁺¹
Gracias!!
@josevicente632 Рік тому
Excelente video
@cinforray Рік тому ⁺¹
Excelente
@vktop2 Рік тому
Hola muy buien video, pero la verdad no me funciono, subi un PDF de 23 paginas sobre la nube y cada vez que le hago una pregunta me da el error de que mi pregunta genero mas tokens que 4096 y a apesar de que le haga una pregunta muy pequeña de temas que no ocupan mas que un par de parrafos en le PDF me da el mismo error. Saludos
@DataScienceForBusiness Рік тому
ese error también se puede dar por acumulación de preguntas. Es decir, cuando vas haciendo preguntas, aunque sean pequeñas, va formando un contexto de la conversación. si pasas el límite puede dar ese error. si te pasa prueba a salir y empezar otra conversación.
@vktop2 Рік тому
@@DataScienceForBusiness Muchas gracias por la respuesta ya encontre lo que fallaba el archivo PDF era muy grande, pero puse un archivo PDF más pequeño y funcionó y lei que es una limitación del modelo que actualmente solo funciona con 4097 tokens y los tokens, lo que recomiendan es partir los archivos grandes en archivos más pequeños. Gracias, saludos
@Nukeid Рік тому ⁺¹
Hubiese sido instructivo si a la consulta que no pudo responder sobre "media de sueldos de consejeros", se cambiaba la forma de preguntar en: "busca la tabla de consejeros, suma los números el total de cada consejero y divídelo por la cantidad de consejeros". En estos modelos todavía hay aspectos que mejorar. Con la aceleración que tienen en pocos años más las interacciones serán más sencillas.
@juanmaromero1590 Рік тому ⁺¹
Cuando le haces la ultima pregunta.... que resuma los principales riesgos. Primero habria que ver que el resumen de cada riesgo este bien hecho, pero supongamos que lo hizo correctamente. El problema es ...como definió que esos 3 riesgos son los mas importantes y no otros que esten en el documento. Tendria que usar unas operaciones logicas que el modelo todavia no posee... Se podria pedir que nos liste y resuma los riesgos y nosotros decidir cuales son los mas importantes
@cesarcomanducci4098 Рік тому
Se podrá hacer con excel?
@DataScienceForBusiness Рік тому ⁺¹
Si te refieres al motor de NLP obviamente no. Si te refieres a que excel sea el cliente desde el que haces la consulta, no lo he probado, pero a priori creo que si creas una api para el modelo y la llamas desde power query funcionaría.
@Tulipisthori Рік тому
Con excel se le puede ordenar generar código visualbasic y hacer macros de programación. En mi opinión hay que ser MUY ESPECÍFICO con lo que se quiere, identificar las variables y espectativas. Lee varios códigos de programación
@leonfinanciero Рік тому
Tiene aún algunas fallas, pero seguro con el tiempo perfeccionan más a estas maqinas.
@adan8657 Рік тому
No he estado en una cueva, más bien he querido meterme en una.😢
Es broma, hay que adaptarse a los cambios más que nunca.
@MG-bm5oj Рік тому
Nadie tiene este error:
DependencyError: PyCryptodome is required for AES algorithm
@CristhoferTravieso Рік тому ⁺²
Cuidado que openAI es dueño de todo lo que sí ingrese a chatgpt , ya pasó que se fiktro codigo de un software
@NickBPalomino Рік тому
tienes el link de esa noticia? me interesa
@scdnet Рік тому
Muy largo el video, no se entiende nada. Muy agotador
@Pepitopagadoble Рік тому
Hola gracias por el video muy bueno! me sale un error cuando ejecuto, la indexaciones de los contenidos de los pdf. Tiene que ver con que se supone que excedi los limites de la API, pero cuando reviso en opein AI no tengo usado nada de los $18 que tengo disponible: WARNING:llama_index.llms.openai_utils:Retrying llama_index.embeddings.openai.get_embeddings in 0.13479332341987815 seconds as it raised RateLimitError: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}.
---------------------------------------------------------------------------
@alfredocentarini6241 Рік тому
nose por que no funciona en visualCode🥲
@DataScienceForBusiness Рік тому
Posiblemente no sea visualcode si no tu entorno local. Creo que lo había comentado en el vídeo (quizá lo quité en la edición final para hacerlo más corto) pero recomiendo hacerlo en Colab pq estos temas tan nuevos suelen dar problemas de "fontanería", q normalmente Google los tiene mejor resueltos que un usuario en local.
@alfredocentarini6241 Рік тому
@@DataScienceForBusiness si, pense lo mimso, en colab funciona muy bien. gracias

Наступне

Автоматичне відтворення