😮 Cómo Usar ChatGPT Sobre Información Interna De Tu Negocio

DataScience ForBusiness

มุมมอง 76 926

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 3 ม.ค. 2025

ความคิดเห็น •

@yuniorbatista2416 ปีที่แล้ว ⁺⁵⁵
Seria interesante una segunda parte con la implementación de este codigo como un servicio de chatbot en una página web
@joser100 ปีที่แล้ว ⁺⁴¹
Gracias por el video... vale como introduccion pero me temo que podria llevar a conclusiones erroneas a gente que quiera usar este metodo para procesar datos de su empresa, ya que esta muy simplificado y con ello pierde aspectos importantes.
El hecho es que LlamaIndex no puede por si mismo crear esos embeddings/vectores y necesita usar el LLM (algun codex de OpenAI como ADA-003 u otro mas avanzado, ya sea de OpenAI u otro LLM) para generar esos embeddings, es decir, hay dos fases con acceso al LLM, en una primera fase tus datos tienen que ser pre-formateados, en tu ejemplo usas un PDF, pero podrias tener video, bases de datos, u otra informacion que este en formatos privados (datos en Jira, CRMs como Salesforce o muchos otros soportes que pueden usarse en el ambito de empresa), hay un trabajo de adaptacion que no lo va a hacer LlamaIndex (ni siquiera con la version 0.6.0 que lanzaron esta madrugada). LangChain (que tambien es Open Source) tiene mejor cobertura para este pre-procesamiento del corpus de datos, el punto fuerte de LlamaIndex esta mas en la indexacion de los embeddings para realizar, posteriormente, la busqueda semantica cuando lances una pregunta.
No voy a alargarme mas ya que lo que queria realmente mencionar es el hecho de que todos los datos que quieras procesar tienen que pasar por OpenAI API en esa fase inicial de creacion de embeddings (a no ser que uses un LLM distinto que sea Open Source y que puedas controlar para que tus datos privados no salgan fuera de tu empresa).
He visto que en el ejemplo has usado un documento publico, pero cuando se trata de informacion de caracter sensible de una empresa (en cualquier soporte) hoy dia yo no la pasaria por los APIs de OpenAI, he visto que mencionas los temas de privacidad, perfecto, pero queria poner este aviso adicional para navegantes...
(hace un par de dias OpenAI abrio la puerta a quitar el uso de la memoria de ChatGPT, esto lo hizo para responder a la presion de la EU, empezando por Italia, sobre esos temas de prevacidad, sobre todo el hecho de que TODO lo que se manda a traves del API puede ser usado por OpenAI para entrenar nuevas versiones, con lo que es posible que si se envian datos de caracter privado, estos puedan aparecer en publico en el futuro, bueno, en el nivel y grado en que los entrenamientos y fine-tunings llegasen a usar esos datos, pero en cualquier caso OpenAI considera que toda esa informacion que se esta pasando por ChatGPT y los APIs les pertenece como parte del dataset para entrenamientos futuros y esto es importante saberlo, el problema es que al quitar la "memoria" se pierde gran parte del valor que nos da ChatGPT...)
En cualquier caso, si este mensaje sirve para alertar sobre el problema de la privacidad de los datos que se comparten con OpenAI, mision cumplida...
@CeroCool212004 ปีที่แล้ว ⁺³
Excelente apotación, caballero. 👏
@airebreton ปีที่แล้ว ⁺¹
gracias @joser100 por puntualizar. justamente todo el interés está en usar un LLM distinto a openAI para poder retener los datos. por ejemplo quiero poder ofrecer una consulta en base a datos elegidos por mi, aunque algunos sean públicos, otros son privados, en cualquier caso quiero retener mi trabajo de recopilación para poder monetizar mi servicio y que éste no se regale. lo de que "abran la puerta a quitar la memoria" en openAI no da aún la confianza necesaria para lanzarse a usarlo. alguna sugerencia de qué LLM de código abierto se puede usar para el caso de la consultoría sobre una selección de documentos? en cualquier caso gracias por precisar, porque ya voy más encaminado.vaya bien.
@NWqwerty ปีที่แล้ว ⁺¹
@@airebreton vicuna, aunque tendria que probar porque no es igual de potente a chatgpt
@Nacho369 ปีที่แล้ว ⁺¹
Hola Jose, podría escribirle de forma privada por la cuestión que comenta? gracias de antemano
@joser100 ปีที่แล้ว
@@Nacho369 claro
@watsaysurfschool-cantabria ปีที่แล้ว ⁺¹
Llevaba mucho tiempo buscando esto, gracias por el aporte.
@enriquemartinez3380 ปีที่แล้ว ⁺⁴
Como siempre muy interesante tus videos Isaac. Aunque parece que ChatGPT cada vez irá ampliando más las ventanas de contexto y que con los pluguins que se está desarrollando y que vendrán cada vez más funcionará como un asistente que hará cualquier tarea que necesitemos, sin duda la necesidad de saber cómo preguntarle y el tener los skills para entender y desarrollar la interacción con él, seguirá siendo algo fundamental. Ejemplo es el concepto de "Prompt Engenieer" como nueva profesión.
@edwardjavier4925 ปีที่แล้ว ⁺¹
Muy poderoso código, he aprendido un montón. Me volaste la cabeza. Te cuento que el primer error que me salio fue al ejecutar el código de SimpleDirectoryReader para leer el pdf, y le puse el siguiente codigo:
!pip install PyPDF y se arregloooo.
Ahora tengo el siguiente error al hacer mi pregunta
AttributeError Traceback (most recent call last)
in ()
2 pregunta = input('Escribe tu pregunta
') + "Responde en español"
3 respuesta = index.as_query_engine().query(pregunta)
----> 4 for frase in textwrap.wrap(respuesta.response, width=100):
5 print(frase)
/usr/lib/python3.10/textwrap.py in _munge_whitespace(self, text)
152 """
153 if self.expand_tabs:
--> 154 text = text.expandtabs(self.tabsize)
155 if self.replace_whitespace:
156 text = text.translate(self.unicode_whitespace_trans)
AttributeError: 'NoneType' object has no attribute 'expandtabs'
Ojala puedas ayudarme con este error por favor. Saludos y muchas gracias por tu tiempo.
@DataScienceForBusiness ปีที่แล้ว ⁺¹
lamentablemente en este área las cosas están poco estandarizadas y hay mucho trabajo de "fontanería". lo mejor en esos errores es googlear, la casuística es casi infinita
@JackDaniels-xq2hu ปีที่แล้ว ⁺²
De locos esto es de vertigo cada vez tienes que aprender más y más para sacar alguna ventaja
@DataScienceForBusiness ปีที่แล้ว ⁺¹
sí, por un lado eso es bueno si te gusta aprender cosas nuevas, por otro te puede llegar a sobrepasar si intentas llegar a todo en lugar de especializarte
ปีที่แล้ว ⁺¹
Magnífica aportación y de gran valor!! Mil gracias Isaac!!
@darahmireh ปีที่แล้ว ⁺¹
Súper! Te pregunto, si quisiera añadirle un rol, ¿en qué parte del código se integra esa parte?
@DataScienceForBusiness ปีที่แล้ว ⁺¹
Con lo que tenemos en este ejemplo concreto se lo tendrías que añadir en la pregunta. Pero en langchain hay una funcionalidad un poco más avanzada, que se llama "prompt template" con la que puedes crear prompts más avanzados, meterle cosas como el rol, o hacer que partes del prompt sean dinámicas. busca ese término
@churtado1984 ปีที่แล้ว ⁺¹
sos de otro mundo, gracias por cmpartir ... empezare mi semana
@JuanCarlosSilva-z1w 4 หลายเดือนก่อน ⁺¹
La semana está cerrada... ya estoy en la lista de espera, ojala la abran pronto.
@RicharGonzalez ปีที่แล้ว ⁺⁴
Que impresionante poder usar esta herramienta como la muestras, me encanto tu video y muy bien explicado, realmente quedo muy agradecido por entregar esta información y que podamos prender a este nivel. Muchas gracias.
@edwarddrago9686 6 หลายเดือนก่อน ⁺¹
Master, gracias por compartir, excelente trabajo
@MartinEnriqueBertello 11 หลายเดือนก่อน ⁺¹
Excelente aporte, y muy bien explicado!
@usuarioift9067 ปีที่แล้ว ⁺¹
Tuve que hacerle varios cambios al codigo en diciembre del 2023 porque ya no funciona. Aqui les dejo algunos cambios: from llama_index import GPTVectorStoreIndex, SimpleDirectoryReader, LLMPredictor, ServiceContext
index = GPTVectorStoreIndex.from_documents(pdf, service_context = service_context)
Y en el while poner
respuesta = query_engine.query(pregunta)
print(respuesta)
@higiniofuentes2551 5 หลายเดือนก่อน ⁺¹
Gracias por este video tan útil!
@ThePablete15 ปีที่แล้ว ⁺¹
Muy interesante, muchas gracias por el video
@victorhuelvap ปีที่แล้ว ⁺²
Una pregunta! ¿Sería capaz de interpretar la información que le proporcionas, o solo actúa de "buscador" como en chatpdf? Gracias
@VictorFernandez-wf5lj ปีที่แล้ว ⁺¹
Muy interesante, en el directorio de datos, podrían ser otros formatos, no sólo pdf, no?
@DataScienceForBusiness ปีที่แล้ว ⁺²
Sí, llamaindex tiene un montón de conectores para diferentes formatos
@VictorFernandez-wf5lj ปีที่แล้ว
Pero en el ejemplo del notebook, no se cita el formato de los documentos en ningún sitio
@yomismo-64 ปีที่แล้ว ⁺¹
Te felicito, muy instructivo y bien explicado.
@albertdones7727 ปีที่แล้ว ⁺¹
Muuuy bueno !! Muchas gracias !!
@Tulipisthori ปีที่แล้ว ⁺¹
No sabía de chatpdf gracias
@jorgeantoniocabreragonzale3366 ปีที่แล้ว ⁺¹
Antes que nada muchas gracias por material compartido. Muy interesante y magistralmente expuesto. Quisiera compartir que intentado reproducir el ejercicio, pero tropiezo con el problema de que el componente GPTSimpleVectorIndex no me reconoce su importación llama-index.
Datos instalacion:
Python 3.11.3
aiohttp==3.8.4
aiosignal==1.3.1
async-timeout==4.0.2
attrs==23.1.0
certifi==2023.5.7
charset-normalizer==3.1.0
colorama==0.4.6
dataclasses-json==0.5.7
frozenlist==1.3.3
greenlet==2.0.2
idna==3.4
langchain==0.0.169
llama-index==0.6.7
marshmallow==3.19.0
marshmallow-enum==1.5.1
multidict==6.0.4
mypy-extensions==1.0.0
numexpr==2.8.4
numpy==1.24.3
openai==0.27.6
openapi-schema-pydantic==1.2.4
packaging==23.1
pandas==2.0.1
pydantic==1.10.7
PyPDF2==3.0.1
python-dateutil==2.8.2
pytz==2023.3
PyYAML==6.0
regex==2023.5.5
requests==2.29.0
six==1.16.0
SQLAlchemy==2.0.13
tenacity==8.2.2
tiktoken==0.4.0
tqdm==4.65.0
typing-inspect==0.8.0
typing_extensions==4.5.0
tzdata==2023.3
urllib3==1.26.15
yarl==1.9.2
@jlueiza ปีที่แล้ว
reemplazalo por esto index = GPTVectorStoreIndex.from_documents(pdf, service_context=service_context)
@platerplane ปีที่แล้ว
enorme video, con su explicación teórica previa bastante clara. Muchas gracias!!
@mite45 ปีที่แล้ว ⁺¹
Excelente video y aportes Isaac, ya estoy probando para implementaciones con Gradio y/o Flask para mejora de interface. Entiendo que podrían seguir incorporando aplicaciones con Llama y otras librerías para potenciar la App. Gracias Mil.
@Furkunst ปีที่แล้ว ⁺¹
Como puedo hacer lo mismo con archivo CSV?
@javi_v7.0 ปีที่แล้ว ⁺¹
Gran video, ¡muchas gracias Isaac!
@EmilioPerez-n7l ปีที่แล้ว ⁺¹
muy interesante!
aunque no creo que las empresas vayan a subir sus cuentas/resúmenes al chatgpt para que tenga información privada suya...
@MartinGersbach ปีที่แล้ว ⁺¹
Excelente capítulo ! ❤
@skullsp 8 หลายเดือนก่อน
Necesito hacer esto mismo pero en una web publica. Hay algun video?
@CamiloOrejuela ปีที่แล้ว ⁺¹
Muy buen video amigo. ¿Qué tal el tema de analizar datos de Excel con ChatGPT para crear informes? Es posible? Existe alguna herramienta para ello?
@DataScienceForBusiness ปีที่แล้ว ⁺¹
sí, es posible con herramientas similares a las del vídeo: gptindex, langchain. pero conociendo la implicación de microsoft en openai no creo que tarden mucho en incluirlo de manera nativa y de serie en excel
@camilocespedes1046 ปีที่แล้ว ⁺²
Hola Isaac, muy buena tu explicación. Una cosa que me llama la atención es la capacidad de automatización que existe en los data job. ¿Crees que las IA reemplazarán en gran parte la labor humana de estos trabajos?
¡Saludos!
@DataScienceForBusiness ปีที่แล้ว ⁺³
Al revés! creo que estamos en la mayor ventana de oportunidad en este campo en muchos años. En breve voy a publicar un vídeo explicando por qué pienso así.
@leocam840 ปีที่แล้ว
Que buen video, ahora me queda la duda de si esto se puede implementar en una pagina web pero ya me diste la idea para empezar con algo, gracias buen video!
@DataScienceForBusiness ปีที่แล้ว
sí se puede, hay un montón de conectores para diferentes tipos de información
@RicharGonzalez ปีที่แล้ว
Hola, muchas gracias por el aporte, pero te quiero contar que baje el desarrollo pero no funciono, se queda topado en la lectura de los pdf. ¿que puedo hacer? nota. no se nada de la programación a este nivel.
muchas gracias
@armandoortega3837 9 หลายเดือนก่อน
Que puedo hacer si hay diferencias entre las políticas de privacidad de mi empresa y las de chat Gpt, como puedo implementar estos modelos personalizados en materia de privacidad?
@Nacho369 ปีที่แล้ว
Muchas gracias por el aporte. Me descargué el archivo y en el paso "Indexar el contenido de los PDFs" me da error y no consigo solucionarlo. Gracias
@noeliaferrero1158 ปีที่แล้ว
Excelente contenido como siempre, muchas grac x compartir! consulta, puede ser que se cambio/actualizo algo en el código? porque hace días que lo intento y no me esta funcionando...
@aspirezr ปีที่แล้ว ⁺¹
Muy bueno, muchas gracias.
@brunomarti3308 ปีที่แล้ว
Impresionante como siempre.
@DataScienceForBusiness ปีที่แล้ว
gracias!
@maltimiras ปีที่แล้ว
Gracias por el video! Muy interestante. A mi me da error PdfReadError: EOF marker not found independientemente del pdf que le suba....
@maltimiras ปีที่แล้ว
Igual porque estoy en Mac?
@maoramirez10 ปีที่แล้ว ⁺¹
Excelente información no se si se me paso por alto en el vídeo pero hay algun límite o cantidad de gigas que podamos subir en formato PDF?
@ivan321pum ปีที่แล้ว
Creo que eran 2000 páginas o algo así
@DataScienceForBusiness ปีที่แล้ว
no lo he llevado al límite, pero por cómo funciona entiendo que no. pero ten en cuenta el coste, a más tamaño más coste
@ListaUbU ปีที่แล้ว
funciona en simultaneo con todos los pdf q uno le suministre? cruza datos entre diferentes pdf?
@DataScienceForBusiness ปีที่แล้ว
langchain tiene funciones para cargar por ej todos los pdfs que tengas en una carpeta. no es que cruce datos literalmente, pero todo el contenido de los diferentes pdfs va a la misma bbdd vectorial. así que si hay info relevante para la consulta en diferentes pdfs si le llega al modelo llm y luego éste ya decide cómo combinarla para dar la respuesta
@CarlosDiazR ปีที่แล้ว
El tema del calculo, es porque no le hiciste bien la pregunta. Siempre tienes que indicar cómo algo.
"Suma todos los salarios de los consejeros y divide el resultado entre todos los consejeros de la lista para saber cual es el salario medio."
Estoy seguro que te lo dice si se lo dices de esa manera.
@katafrakto ปีที่แล้ว
Muchas gracias por compartir el código y las explicaciones, ¿se pueden usar otros modelos aparte de chatGPT?
@DataScienceForBusiness ปีที่แล้ว
Sí además del resto de openai también puedes usar de otros vendors como cohere, y tb opensource, por ej de HuggingFace
@rafadipre ปีที่แล้ว ⁺¹
Buenisimo este video
@VictorFernandez-wf5lj ปีที่แล้ว
me temo que da error al ejecutarlo (cannot import name 'GPTSimpleVectorIndex' from 'llama_index'), ha cambiado algo? por ejemplo: "GPTSimpleVectorIndex was renamed to GPTVectorStoreIndex, try removing it from the end of your imports"
@andressterenberg6657 ปีที่แล้ว ⁺¹
muy Buenoooooo!!!
@jordannolasco1527 ปีที่แล้ว
Hola, una pregunta, con la IA, que se puede estudiar para no quedar obsoletos con el tiempo, porque he visto que ya lo está haciendo
@DataScienceForBusiness ปีที่แล้ว
Gran pregunta. Creo que hay 2 partes: lo que tiene que aprender un profesional, que implica frameworks, librerías, etc. Y lo que tiene que aprender una persona "normal" de cualquier otro trabajo, que implica herramientas finales de usuario como chatgpt, midjourney, etc. Lo apunto para un vídeo
@alexandrelc4361 ปีที่แล้ว
Muy interesante tu video, gracias por compartir tus conocimientos. Tengo una pregunta: ¿Chatgpt cobra por los tokens de lectura de documentos o solo cobra por los tokens de solicitud y respuesta?
@DataScienceForBusiness ปีที่แล้ว
Entiendo que te refieres a la api. Y lo de lectura de documentos supongo que refieres al embeding. Cobra por todo ello, pero son precios y modelos diferentes. En esta página puedes ver los diferentes modelos y sus costes: openai.com/pricing
@RomeoGaete ปีที่แล้ว
si quisieras ponerlo en una interfaz grafica como lo harías?
@DataScienceForBusiness ปีที่แล้ว ⁺¹
si es solo para prototipar puedes usar streamlit o gradio. si es nivel más empresarial puedes crear una api que sea llamada por la aplicación web
@carlosarrasco ปีที่แล้ว ⁺¹
Una consulta, mencionaste que openai te daba $5, eso significa que el uso de su servicio es limitado hasta un cierto número de consultas? Y luego habria que pagar?
Muchas gracias por el vídeo y la información, se aprecio mucho su esfuerzo!!
@DataScienceForBusiness ปีที่แล้ว
Correcto, al menos eso te daban en el momento que hice el vídeo, no sé si ahora habrá cambiado. Pasado ese límite ya tienes que meter una tarjeta si quieres seguir usándolo.
@crearelectronica ปีที่แล้ว
Exelente vídeo... Al utilizar ése servicio la información está en los servidores de ellos o se instala en un servidor propio?
@DataScienceForBusiness ปีที่แล้ว
En este caso en los de Google y en los de OpenAI
@icerimuru ปีที่แล้ว
Nuevo sub c: Gracias por el contenido python es amor ❤
@alexhurtadomktd ปีที่แล้ว
Super interesante, quiero aprender ha hacer esto para conectarlo a un chatbot de Whatsapp. Podria lograrlo a traves de una API? o que ruta deberia seguir?
@DataScienceForBusiness ปีที่แล้ว
estos servicios suelen operativizarse mediante apis
@alexhurtadomktd ปีที่แล้ว
@@DataScienceForBusiness Tal ves debo explicarme más. ósea un mejor promt, para lograr una respuesta más satisfactoria.
Yo implemento chatbots con plataformas como chatrace, uchat, manychat, etc estas tiene un bloque que se llama solicitud externa que trabaja a partir de APIS; entonces quisiera realizar la pregunta desde whatsapp, que esta consulta se la entregue en el google colab que acabas de enseñar y que retorno que la respuesta al mismo chatbot para entregarsela al usuario que realizo la consulta, es este escenario conversacional que no se como se podria lograr o que ruta deberia seguir para lograrlo. De antemano agradezco cualquier guia.
@hmendezg ปีที่แล้ว ⁺¹
Gracias por este video. Tengo dos preguntas: 1) ¿Qué costo por el uso de la API generó el ejemplo? 2) ¿Los datos del contexto quedan al alcance de OpenAI?
@DataScienceForBusiness ปีที่แล้ว
Muy poco coste, 2 o 3 céntimos. Sí, lo comento en el vídeo y lo repito, cuidado con los datos. Ahora parece que están trabajando en una versión que no se quedará con los datos, pero por el momento parece que sí lo hacen. Hay que leer muy bien la policy.
@unobuscando ปีที่แล้ว
Cómo sacas la información resultante fuera del entorno de programación, por ejemplo en una web, otra aplicación, documento pdf o Word, hoja Excel, etc.?
@om4le ปีที่แล้ว
una consulta por que no me deja descargar el notebook de codigos? me dice que no tengo ninguna aplicación que pueda abrirla
@DataScienceForBusiness ปีที่แล้ว
es un notebook, tienes que abrirlo con Colab, Jupyter, Vscode, etc
@om4le ปีที่แล้ว
@@DataScienceForBusiness muchas gracias, pude abrirlo y hacer el ejercicio como tú. Solo que me daba error en el Index
@oscar2651958 ปีที่แล้ว
Excelente video! Solo un tema, cuando estoy ejecutando en Collab el python, me sale el error
ImportError: cannot import name 'GPTSimpleVectorIndex' from 'llama_index' (/usr/local/lib/python3.10/dist-packages/llama_index/__init__.py)
Alguna idea? creo que fue cambiado el GPTSimpleVectorIndex ?
Agradecere su ayuda ...
@DataScienceForBusiness ปีที่แล้ว ⁺²
Efectivamente han cambiado la clase. Para arreglarlo en el notebook:
En todos los sitios donde ponía GPTSimpleVectorIndex cambiarlo por GPTVectorStoreIndex
Donde ponía index.query(pregunta) cambiarlo por index.as_query_engine().query(pregunta)
@pablobraojos ปีที่แล้ว
@@DataScienceForBusiness La primera correcion funciona biem, pero al poner index.query(pregunta) o index.as_query_engine().query(pregunta) da problemas...
Graciasss de antemano
@VictorFernandez-wf5lj ปีที่แล้ว
@@DataScienceForBusiness me sucedia igual y ya funciona, muchas gracias
@ERUANNU ปีที่แล้ว
Existe un error en el codigo y no encuentro como corregirlo. Esta en la linea 3 del cuando se llama a llama_index
@DataScienceForBusiness ปีที่แล้ว
Efectivamente han cambiado la clase. Para arreglarlo en el notebook:
En todos los sitios donde ponía GPTSimpleVectorIndex cambiarlo por GPTVectorStoreIndex
Donde ponía index.query(pregunta) cambiarlo por index.as_query_engine().query(pregunta)
@jaimeluna99 ปีที่แล้ว
Me parece que es una masterclass única y sin igual en todo lo que he buscado. Felicitaciones. Pregunta: como puedo integrar este resultado a una pagina web o teams corporativo? La idea es que los empleados hagan preguntas en un chat y se conecte con lanrespuesta que gera este código. Gracias y saludos.
@DataScienceForBusiness ปีที่แล้ว ⁺³
Díselo a sistemas, no es muy complicado. Podrían crear una api sobre este script que sea llamada por la búsqueda del usuario en la aplicación y devuelva el resultado en la misma. De nuevo, cuidado con la confidencialidad, revisad bien las políticas de OpenAI y que sea complience con las de la empresa.
@hbmichang ปีที่แล้ว ⁺¹
Hola buen vídeo! Quería preguntarte en qué lugar puedo seguir estudios de Data Science y/o Inteligencia Artificial, ya sea bootcamp, curso, instituto, universidad, etc para adentrarme más en el tema, claro que empezaré por el recurso que facilitaste, pero luego? Gracias!
@DataScienceForBusiness ปีที่แล้ว ⁺²
Te recomendaría mi empresa claro. Al final de tu primera semana puedes pedir información sobre el programa Python data science mastery
@bradleysandoval1323 ปีที่แล้ว
Hola Isaac
Disculpa que te moleste 😅 aparte de data science también impartes cursos adentro de tu bootcamp para data engineer amarrado con Cloud Aws?
No he visto en el programa sobre SQL seguramente lo explicas pero quería quitarme la duda, me gusta mucho la forma en que explicas y nos quitas las dudas 💯
@DataScienceForBusiness ปีที่แล้ว ⁺²
No, mi especialidad es data science y data analytics. No soy experto en data engineering
@dandradejose ปีที่แล้ว
Pero al final has hecho un Google Colab, uno pensaría que terminaría haciendo un GUI como en la explicación del inicio.😢
Probaré usando unas librerías que convierten cuadernos en apps.
@Cieofkgkrlalvie ปีที่แล้ว
Me falla el paso de 3 from llama_index import GPTSimpleVectorIndex, SimpleDirectoryReader, LLMPredictor, ServiceContext, dice que el GPTSImpleVectorIndex no se puede instalar
@DataScienceForBusiness ปีที่แล้ว
Efectivamente han cambiado la clase. Para arreglarlo en el notebook:
En todos los sitios donde ponía GPTSimpleVectorIndex cambiarlo por GPTVectorStoreIndex
Donde ponía index.query(pregunta) cambiarlo por index.as_query_engine().query(pregunta)
@judexmx ปีที่แล้ว
Qué pasa con la información que se carga en relación con la privacidad de la información?
@DataScienceForBusiness ปีที่แล้ว
lo comento en el vídeo. de momento no recomiendo cargar info sensible. hay iniciativas que están trabajando para mejorar en ese sentido.
@Artemius79 ปีที่แล้ว
Muy buen video, todo el contenido es muy informativo. Tengo experiencia de dos años como desarrollador de software empresarial, en el área de mantenimiento, y viendo el panorama (y para seguir creciendo) he estado analizando un poco sobre este mundo del Data, y mi perfil pareciera encajar más con ingeniería de datos.
Que ruta me recomiendas para lograr avances en esta área?.
De momento no pienso en dejar mi empleo , sino, mejorar mi perfil actual. Muchas gracias de antemano!
@DataScienceForBusiness ปีที่แล้ว
no es mi especialidad pero sin duda lo siguiente lo vas a necesitar: python, java, bbdd relacionales y sql, big data: ecosistema hadoop y spark, cloud y orquestadores de flujo: airflow, ...
@raulalcauza7025 10 หลายเดือนก่อน
Hola.Buen video! Aunque estoy intentando replicarlo en mi VSC, pero no es posible, me sale el siguiente error: from llama_index import GPTVectorStoreIndex, SimpleDirectoryReader, LLMPredictor, ServiceContext ImportError: cannot import name 'GPTVectorStoreIndex' from 'llama_index' (unknown location). He visto que ha surgido con anterioridad, pero es que al usar Google Colab también me ocurre el mismo error. En la documentación no hace referencia a esto, ha cambiado en algo la estructura. Por si alguien puede guiarme un poco. Gracias!
@cesarcomanducci4098 ปีที่แล้ว
Se podrá hacer con excel?
@DataScienceForBusiness ปีที่แล้ว ⁺¹
Si te refieres al motor de NLP obviamente no. Si te refieres a que excel sea el cliente desde el que haces la consulta, no lo he probado, pero a priori creo que si creas una api para el modelo y la llamas desde power query funcionaría.
@Tulipisthori ปีที่แล้ว
Con excel se le puede ordenar generar código visualbasic y hacer macros de programación. En mi opinión hay que ser MUY ESPECÍFICO con lo que se quiere, identificar las variables y espectativas. Lee varios códigos de programación
@franprimolarry ปีที่แล้ว ⁺¹
Tengo una cuestión, el hecho de importar toda la información de negocio a ChatGPT ¿vulneraría la privacidad de datos?. ¿Cómo podríamos mantener los datos a salvo utilizando ChatGPT?
@DataScienceForBusiness ปีที่แล้ว ⁺¹
La info que le metes puede ser usada para reentrenar sus modelos (ahora están metiendo opciones para que puedas bloquear esto). Por eso como digo en el vídeo hay que leer bien la política de Openai y saber lo que le metes, tanto en la api como en el propio Chatgpt. En el corto plazo estoy seguro de que las empresas incorporarán versiones propias y locales de LLMs para poder hacer estos usos de forma escalable y segura.
@sgnshogun ปีที่แล้ว
Hola @@DataScienceForBusiness! Felicidades por el video, super interesante!! Tienes algún enlace o recurso donde explique como montar una LLMs local? Me interesa mucho este punto. Gracias!
@millernavia7697 ปีที่แล้ว
@@DataScienceForBusiness Hola, genial el video, mil y mil gracias
estoy ejecutando el codigo y en un momento creo que me dio error por creditos, pero no es claro si es de Openia o de google.
RateLimitError: You exceeded your current quota, please check your plan and billing details.
The above exception was the direct cause of the following exception:
sabes que peude ser?
@vktop2 ปีที่แล้ว
Hola muy buien video, pero la verdad no me funciono, subi un PDF de 23 paginas sobre la nube y cada vez que le hago una pregunta me da el error de que mi pregunta genero mas tokens que 4096 y a apesar de que le haga una pregunta muy pequeña de temas que no ocupan mas que un par de parrafos en le PDF me da el mismo error. Saludos
@DataScienceForBusiness ปีที่แล้ว
ese error también se puede dar por acumulación de preguntas. Es decir, cuando vas haciendo preguntas, aunque sean pequeñas, va formando un contexto de la conversación. si pasas el límite puede dar ese error. si te pasa prueba a salir y empezar otra conversación.
@vktop2 ปีที่แล้ว
@@DataScienceForBusiness Muchas gracias por la respuesta ya encontre lo que fallaba el archivo PDF era muy grande, pero puse un archivo PDF más pequeño y funcionó y lei que es una limitación del modelo que actualmente solo funciona con 4097 tokens y los tokens, lo que recomiendan es partir los archivos grandes en archivos más pequeños. Gracias, saludos
@asieriturriotz271 ปีที่แล้ว
Muy interesante!
@JhonJorgeCcamerccoaYucra ปีที่แล้ว ⁺¹
si recontra funciona
@DesarrolloADE17 ปีที่แล้ว ⁺²
Buen video
@bernietgn6406 ปีที่แล้ว
Gracias por el vídeo. Muy instructivo. Dime, por favor, que ese código para la API es falso y no funciona... 😅
@DataScienceForBusiness ปีที่แล้ว
sí sí funciona. pica los dígitos uno a uno y comprúebalo. quizá la primera vez no, pero hazlo 10 veces y seguro que va ;-) ...
... nota: por si acaso alguien no lo pilla que no lo intente, era una broma
@gogomac ปีที่แล้ว ⁺¹
Gracias!!
@josevicente632 ปีที่แล้ว
Excelente video
@leonfinanciero ปีที่แล้ว
Seria bueno que le metas una enciclopedia de 5000 páginas haber como funciona la cosa.
Saludos amigo.
@Nukeid ปีที่แล้ว ⁺¹
Hubiese sido instructivo si a la consulta que no pudo responder sobre "media de sueldos de consejeros", se cambiaba la forma de preguntar en: "busca la tabla de consejeros, suma los números el total de cada consejero y divídelo por la cantidad de consejeros". En estos modelos todavía hay aspectos que mejorar. Con la aceleración que tienen en pocos años más las interacciones serán más sencillas.
@juanmaromero1590 ปีที่แล้ว ⁺¹
Cuando le haces la ultima pregunta.... que resuma los principales riesgos. Primero habria que ver que el resumen de cada riesgo este bien hecho, pero supongamos que lo hizo correctamente. El problema es ...como definió que esos 3 riesgos son los mas importantes y no otros que esten en el documento. Tendria que usar unas operaciones logicas que el modelo todavia no posee... Se podria pedir que nos liste y resuma los riesgos y nosotros decidir cuales son los mas importantes
@cinforray ปีที่แล้ว ⁺¹
Excelente
@CristhoferTravieso ปีที่แล้ว ⁺²
Cuidado que openAI es dueño de todo lo que sí ingrese a chatgpt , ya pasó que se fiktro codigo de un software
@NickBPalomino ปีที่แล้ว
tienes el link de esa noticia? me interesa
@MG-bm5oj ปีที่แล้ว
Nadie tiene este error:
DependencyError: PyCryptodome is required for AES algorithm
@leonfinanciero ปีที่แล้ว
Tiene aún algunas fallas, pero seguro con el tiempo perfeccionan más a estas maqinas.
@adan8657 ปีที่แล้ว
No he estado en una cueva, más bien he querido meterme en una.😢
Es broma, hay que adaptarse a los cambios más que nunca.
@scdnet ปีที่แล้ว
Muy largo el video, no se entiende nada. Muy agotador
@Pepitopagadoble ปีที่แล้ว
Hola gracias por el video muy bueno! me sale un error cuando ejecuto, la indexaciones de los contenidos de los pdf. Tiene que ver con que se supone que excedi los limites de la API, pero cuando reviso en opein AI no tengo usado nada de los $18 que tengo disponible: WARNING:llama_index.llms.openai_utils:Retrying llama_index.embeddings.openai.get_embeddings in 0.13479332341987815 seconds as it raised RateLimitError: Error code: 429 - {'error': {'message': 'You exceeded your current quota, please check your plan and billing details.', 'type': 'insufficient_quota', 'param': None, 'code': 'insufficient_quota'}}.
---------------------------------------------------------------------------
@alfredocentarini6241 ปีที่แล้ว
nose por que no funciona en visualCode🥲
@DataScienceForBusiness ปีที่แล้ว
Posiblemente no sea visualcode si no tu entorno local. Creo que lo había comentado en el vídeo (quizá lo quité en la edición final para hacerlo más corto) pero recomiendo hacerlo en Colab pq estos temas tan nuevos suelen dar problemas de "fontanería", q normalmente Google los tiene mejor resueltos que un usuario en local.
@alfredocentarini6241 ปีที่แล้ว
@@DataScienceForBusiness si, pense lo mimso, en colab funciona muy bien. gracias

ต่อไป

เล่นอัตโนมัติ

Cómo usar CHATGPT (api) sobre la base de datos de tu Empresa [Y te regalo la APP]