He visto varios tutoriales al respecto y este ha sido el mejor de todos!!!!! sobrepasa a los demas por muchos, super sencillo y claro, sobretodo para mi que no soy experta en computadores
Bueno, esa función la tengo en el celular y llevo meses utilizándola y funciona muy bien, todo es buena dicción y hacerlo más bien a un ritmo adecuado. Geniales tus videos, seguimos aprendiendo.
@@luisrincon2444 En mi caso tengo Android. Activas el teclado para enviar texto, por ejemplo en WhatsApp, en el mismo ves un micrófono, es diferente al de enviar mensaje de audio, lo activas y dictas tu texto, los haces con buena dicción, seleccionas, copias y pegas.
@@sandratrujillo2047 hola sandra quiero utilizar esta herramienta para practicar mi ingles y conectar el texto con chat gpt para que me muestre los errores gramaticales, como usas las herramienta desde tu telefono, que medio de los que explicaron en el video usas ?
Muchas gracias por este video. Fue muy útil. Una pregunta. ¿Sabes cuál es el límite gratis de Replicate? Porque después de un par de audios (más o menos largos) me notifica que el límite gratis expiró, pero no sé si se renueva o algo así. Gracias de antemano. Saludos.
Saludos cordiales estimado Xavier. Excelente y funcional la 1era opción, lo que si no dice si tiene una cantidad limitada de uso, como el caso de Replicate, que solo permite 3 veces. La opción de Google Colab no abre o no se conecta el cuaderno, podrías por favor revisar si aún esta activo dicho cuaderno/enlace. Muy agradecido por tu video, muy claro y didáctico, ha sido de mucha utilidad. Un fuerte abrazo.
Hola Sofía, voy a revisarlo. El vídeo es del momento en que salió Whisper y es posible que el cuaderno haya cambiado. Intentaré subir un tutorial nuevo y actualizado pronto.
Muchas gracias por su orientación, realicé el proceso, pero debo preguntar si hay un límite de espacio, ya que pase un archivo de sonido, pero no lo hizo en su totalidad
Muchas gracias por el tutorial. Tengo que transcribir un audio y da error al subir el archivo de audio.mp3 - he cortado el audio incluso a solo 10 minutos, ni aun por esas. ¿que estoy haciendo mal?. Saludos.
gracias por el video. Consulta que alternativas conoces a google traductor, necesito algo mejor que puede ayuda a transcribir y traducir videos del ingles al español y no solo de youtube. Gracias,
¿Te refieres a un lugar donde subirlas para que se puedan consultar públicamente, uso propio o algo específico para imágenes con IA? Para lo primero creo que Flickr debería servirte, para lo segundo en principio Google Photos debería guardar las imágenes en el formato original en que las subas y para lo tercero, pues la verdad es que no tengo ninguno localizado.
Gran tutorial, pero por favor, reescala la ventana para que podamos verlo en dispositivos más pequeños, estoy en un portátil de 15" y me cuesta mucho leer los textos.
Yo he podido traducir varios audios pero ahora no me aparece submit y no me deja subir un audio... por qué es esto??? he introducido varios audios y ahora no consigo que me deje.. a qué se debe?
Ostras, replicate no lo genera en texto plano? Si te lo genera en format correcto sería simplemente copiar, pegarlo en un blog de notas y guardarlo como .srt. Pero no sé si a través de replicate genera el formato correcto.
Gran aporte! Lo vamos a investigar, porque el siguiente paso es ejecutarlo en local. Es una herramienta menos vistosa que Stable Diffusion, pero más útil en tareas del día a día habituales.
Hola Dani, Whisper como tal puede servir para esta función, de hecho, puedes probar como lo hace "al revés" en la tercera herramienta del Colab de DotsCSV. Lo que aún no tengo localizada ninguna herramienta de "producción" o más dirigida al usuario final para realizar este tipo de tareas. Pero con lo rápido que avanza esto seguro que no tardan en salir.
Gracias Xavier, me parece genial esta herramienta. La he usado dos veces, la primera sin problema, la segunda me ha pedido que introduzca mi email y una contraseña y después de recibir un código e introducirlo.... me ha salido una pantalla diciendo que replicate puede acceder a mis correos personales!! Personal user data Email addresses (read-only) This application will be able to read your private email addresses. Esto es un poco sospechoso, no?
En principio no, asegúrate que la cuenta de gmail que usas en Colab sea la misma que tienes activa en el navegador. Es lo único que se me ocurre que pueda generar conflicto.
Hola Xavier, si lo que quiero es traducir un texto en ingles a español, como sería el comando? en el que has puesto solo pone de español a ingles. Muchas gracias!
La opción en google colab me funciona, pero la transcripción aparece sin signos de puntuación, como comas y puntos. ¿Me puede decir alguien qué puede estar pasando para que no aparezcan? Gracias
Hola. Muy buen vídeo, muchas gracias. ¿Alguien sabría si con la opción de Google Colab se puede predeterminar el idioma en el que va a estar el audio en vez de que lo detecte whisper?
Hola Matías, por parte del whisper no debería haberlo, pero al ejecutarse en Colab y Replicate es posible que el uso de sus servidores esté restringido a cierto tiempo y pueden interrumpir el servicio. Pero creo que es cuestión de probar, con el tiempo de ejecución que permite Colab cuando entrenamos Stable Diffusion debería ser más que suficiente para transcribir audios muy largos.
@@nahiara2295 Usas la opcion de " colab" q plantea Xavier en el video (Minuto 4.14). Importante que ejecute la primera celda que carga librerias. Luego subis el audio a transcribir y copias direccion en la celda con opcion "solo trascribir audio al idioma original". Ejecutas la celda y listo
Si puedes proporcionarle el audio de un vídeo (aquí habría que verse como extraer el audio de los videos de vimeo) hace la transcripción sin problema. Por lo que diría que de un modo u otro debería ser posible.
Hola Vladimir, Whisper es Open Source, por lo que es muy posible que hayan implementado la solución. Nosotros aún no lo hemos probado, pero debería ser posible hacer lo mismo en local. Nos informamos y vemos si podemos traer algo más de información sobre el tema.
yo tengo la función de subtitular con la api de Google que genera subtítulos en TH-cam pero lo tengo en una aplicación externa que usa esa función de Google
Hola, podrías indicarme como descargar los archivos que genera replicate? Hasta ahora no he encontrado como descargar el archivo srt o la transcripción, solo con copiar y pegar.
Hola Xavier estoy utilizando la herramienta pero solo me deja transcribir 30 segundos, puedes hacer un tutorial es como realizar este paso pero para más tiempo? Saludos y buen video
Sí, sería cuestión de combinar herramientas ya existentes (whisper+ChatGPT+Microsoft Azure), lo que no sé es si alguien ha montado ya un aplicativo para hacerlo.
Lo hace de lujo, sólo que me detecta el audio en gallego 🤣 ¿hay alguna manera de forzarlo a que lo transcriba en áspalo siempre? Muchas gracias por el video
Creo que se puede seleccionar el idioma, al menos en la aplicaición de replicate te permite marcarlo. Lo que no sé es cuales son los idiomas del selector disponibles.
Hola Victor, para usar la API o desarrollar con ellas hay que pagar, para usar las demos públicas, hasta ahora, yo no he tenido ni tan siquiera que registrarme. Se puede acceder a ellas como si de un espacio más de HuggingFace se tratase.
Sí, de hecho esto en principio, la tecnología de Whisper ya debería permitirlo, aunque creo que de momento solo está disponible para hacerlo al revés, de otros idiomas al inglés.
Hola, He estado usando la herramienta con Google Colab y funciona muy bien; sin embargo últimamente me aparece este aviso: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly...... No he encontrado que puede significar ¿Alguien sabe? Saludos
Una pasada. Transcribo audios de media hora de duración, con una transcripción perfecta. Me ahorra muchísimas horas de trabajo.
He visto varios tutoriales al respecto y este ha sido el mejor de todos!!!!! sobrepasa a los demas por muchos, super sencillo y claro, sobretodo para mi que no soy experta en computadores
Bueno, esa función la tengo en el celular y llevo meses utilizándola y funciona muy bien, todo es buena dicción y hacerlo más bien a un ritmo adecuado. Geniales tus videos, seguimos aprendiendo.
Muchas gracias Sandra!
Como la tienes?
@@luisrincon2444 En mi caso tengo Android. Activas el teclado para enviar texto, por ejemplo en WhatsApp, en el mismo ves un micrófono, es diferente al de enviar mensaje de audio, lo activas y dictas tu texto, los haces con buena dicción, seleccionas, copias y pegas.
@@sandratrujillo2047 hola sandra quiero utilizar esta herramienta para practicar mi ingles y conectar el texto con chat gpt para que me muestre los errores gramaticales, como usas las herramienta desde tu telefono, que medio de los que explicaron en el video usas ?
Gracias Xavier, lo use hoy y me lo hizo genial, agradecida por tú apoyo ☺️
Xavier ¿No conoces otra página o herramienta que transcriba sin límite de tiempo y totalmente gratis por casualidad?
Muchas gracias por este video. Fue muy útil. Una pregunta. ¿Sabes cuál es el límite gratis de Replicate? Porque después de un par de audios (más o menos largos) me notifica que el límite gratis expiró, pero no sé si se renueva o algo así. Gracias de antemano. Saludos.
Saludos cordiales estimado Xavier. Excelente y funcional la 1era opción, lo que si no dice si tiene una cantidad limitada de uso, como el caso de Replicate, que solo permite 3 veces. La opción de Google Colab no abre o no se conecta el cuaderno, podrías por favor revisar si aún esta activo dicho cuaderno/enlace. Muy agradecido por tu video, muy claro y didáctico, ha sido de mucha utilidad. Un fuerte abrazo.
Buenas, Xavier:
El enlace de Google Colab me da problemas, no sé si ha pasado alguna cosa. Enhorabuena por el vídeo.
Que hacer si sale Whisper comand not found?
Mi respeto, tremenda ayuda, te ganaste un suscriptor más, lo máximo
muchas gracias.
Hasta cuantos minutos te permite subir
el colab me da error de credenciales
Hola!! No me deja seleccionar el texto para pegar mi ruta copiado como en el minuto 5:38 !!!
Hola Sofía, voy a revisarlo. El vídeo es del momento en que salió Whisper y es posible que el cuaderno haya cambiado. Intentaré subir un tutorial nuevo y actualizado pronto.
@@XavierMitjana gracias por su respuesta!! estaré pendiente!!!
Podrías hacer un vídeo de como ejecutarlo en local?
Lo tenemos en la lista de pendientes. 😉
excelente video estimado, simple y muy facil de usar.
hola, si quiero transcribir una entrevista o video, cómo puedo hacerlo?
Hola, lo probé y funciona muy bien. Pero para audios largos, como una entrevista de media hora, pide pago😥😥
Muchas gracias por su orientación, realicé el proceso, pero debo preguntar si hay un límite de espacio, ya que pase un archivo de sonido, pero no lo hizo en su totalidad
Muchas gracias por el tutorial. Tengo que transcribir un audio y da error al subir el archivo de audio.mp3 - he cortado el audio incluso a solo 10 minutos, ni aun por esas. ¿que estoy haciendo mal?. Saludos.
Hola, en qué pagina podría contratar la licencia original
gracias por el video. Consulta que alternativas conoces a google traductor, necesito algo mejor que puede ayuda a transcribir y traducir videos del ingles al español y no solo de youtube. Gracias,
xavier una pregunta rapida, coces alguna buena pagina donde puedas subir tu imágenes creadas en la máxima calidad posible?
¿Te refieres a un lugar donde subirlas para que se puedan consultar públicamente, uso propio o algo específico para imágenes con IA? Para lo primero creo que Flickr debería servirte, para lo segundo en principio Google Photos debería guardar las imágenes en el formato original en que las subas y para lo tercero, pues la verdad es que no tengo ninguno localizado.
@@XavierMitjana gracias. estaria bueno que en un futuro hagas un video explicando como usar bien img2img, realmente es confuso.
Gran tutorial, pero por favor, reescala la ventana para que podamos verlo en dispositivos más pequeños, estoy en un portátil de 15" y me cuesta mucho leer los textos.
Muchas gracias por el consejo. Como verás, en los siguientes tutoriales intento hacerlo. Aunque a veces se me olvida. 😅
Yo he podido traducir varios audios pero ahora no me aparece submit y no me deja subir un audio... por qué es esto??? he introducido varios audios y ahora no consigo que me deje.. a qué se debe?
Excelentes Datas!!
Ostras, replicate no lo genera en texto plano? Si te lo genera en format correcto sería simplemente copiar, pegarlo en un blog de notas y guardarlo como .srt. Pero no sé si a través de replicate genera el formato correcto.
Geniales soluciones, muchas gracias por el video con la explicación tan sencilla.
Sí m sale whisper not found?
solo por añadir, pude usar el .ipynb de Dot csv de forma local cambiando algunas cositas, super comodo ademas de generarte los tiempos en .srt
Gran aporte! Lo vamos a investigar, porque el siguiente paso es ejecutarlo en local. Es una herramienta menos vistosa que Stable Diffusion, pero más útil en tareas del día a día habituales.
Esto me interesa. ¿Se le podría poner por ejemplo una dirección de youtube y que te genere los subtítulos?
@@dbarrasa técnicamente creo que sí, ahora falta que alguien desarrolle el aplicativo, pero justo para cosas como estás está pensado.
Hola @Xavier Mitjana, no me permite entrar al google collab en 2024, tendrás alguna solución?
En el gpt de chatgpr versión de pago, ha fallado, tanto con archivos ogg de telegram, opus de whatsapp y mp3 de mi grabadora, estoy haciendo algo mal?
Sirve para traducir audio libros del ingles al castellano?
Hola Dani, Whisper como tal puede servir para esta función, de hecho, puedes probar como lo hace "al revés" en la tercera herramienta del Colab de DotsCSV. Lo que aún no tengo localizada ninguna herramienta de "producción" o más dirigida al usuario final para realizar este tipo de tareas. Pero con lo rápido que avanza esto seguro que no tardan en salir.
lo pudiste hacer bro? yo ahce años estaba buscando algo asi
Pues a mi no me va, no hace clic para subir el archivo de audio...
Hola Xavier, ¿es posible implementar el whisper de modo off line para reducir el tiempo de procesamiento con archivos de gran tamaño o larga duración?
Sí, aunque nosotros no lo hemos buscado y no sé si alguien lo ha implementado, pero sí se puede ejecutar en un Colab, puede ejecutarse online.
Podría usar voz a texto en bing chat con Whisper? En mi móvil. Que puedo hacer pues tengo deficiencia visual. Grácias
Gracias Xavier, me parece genial esta herramienta. La he usado dos veces, la primera sin problema, la segunda me ha pedido que introduzca mi email y una contraseña y después de recibir un código e introducirlo.... me ha salido una pantalla diciendo que replicate puede acceder a mis correos personales!! Personal user data
Email addresses (read-only)
This application will be able to read your private email addresses.
Esto es un poco sospechoso, no?
Que raro, en principio se puede usar sin correo electrónico. Al menos des del ordenador.
@@XavierMitjana la primera vez que lo usé fue sin correo, pero hoy me pedido que me registre a través de GitHub... 😞
Hay algún Ia para transcribir podcast?
Te refieres a alguna que te separe los diferentes interlocutores? Para eso puedes usar happyscribe. Aunque es de pago.
hoy todas piden plata, existe a agosto 2024 alguna que sea 100% gratuita?
Excelente video, gracias. ¿Que tan factible sería (hablando de dificultad e integración) utilizar Whisper para hacer esto mismo, pero en tiempo real?
Genial, la segunda y la tercera son muy buenas opciones.
Hola, Xavier, me da problemas de credenciales en Colab, ¿es necesaria alguna acción adicional?
En principio no, asegúrate que la cuenta de gmail que usas en Colab sea la misma que tienes activa en el navegador. Es lo único que se me ocurre que pueda generar conflicto.
Hola Xavier, si lo que quiero es traducir un texto en ingles a español, como sería el comando? en el que has puesto solo pone de español a ingles. Muchas gracias!
La opción en google colab me funciona, pero la transcripción aparece sin signos de puntuación, como comas y puntos. ¿Me puede decir alguien qué puede estar pasando para que no aparezcan? Gracias
Muchas gracias, me sirvió mucho.
Hola. Muy buen vídeo, muchas gracias. ¿Alguien sabría si con la opción de Google Colab se puede predeterminar el idioma en el que va a estar el audio en vez de que lo detecte whisper?
eres uno de los mejores, gracias.
Hay alguna limitación en cuanto a duración o tamaño en los archivos mp3 para pasar a texto?
Hola Matías, por parte del whisper no debería haberlo, pero al ejecutarse en Colab y Replicate es posible que el uso de sus servidores esté restringido a cierto tiempo y pueden interrumpir el servicio. Pero creo que es cuestión de probar, con el tiempo de ejecución que permite Colab cuando entrenamos Stable Diffusion debería ser más que suficiente para transcribir audios muy largos.
acabo de transcribir un audio de 22 min en colab, oka
@@OlayonChingon Hola fabi, me contas exactamente como lo hiciste? Yo tambien estoy intentando convertir audios largos. Me seria de ayuda
@@nahiara2295 Usas la opcion de " colab" q plantea Xavier en el video (Minuto 4.14). Importante que ejecute la primera celda que carga librerias. Luego subis el audio a transcribir y copias direccion en la celda con opcion "solo trascribir audio al idioma original". Ejecutas la celda y listo
Hola, como estas? Estoy buscando transcribir video qe están en vimeo, es posible con esta app?
Si puedes proporcionarle el audio de un vídeo (aquí habría que verse como extraer el audio de los videos de vimeo) hace la transcripción sin problema. Por lo que diría que de un modo u otro debería ser posible.
y si lo quiero usar pero en un video de google drive?
Hola Vladimir, Whisper es Open Source, por lo que es muy posible que hayan implementado la solución. Nosotros aún no lo hemos probado, pero debería ser posible hacer lo mismo en local. Nos informamos y vemos si podemos traer algo más de información sobre el tema.
amigo, te pregunto donde puedo encontrar un tutorial para instalar whisper en Subtitle Edit
como como? eso se puede?
sigue siendo open source? a un amigo que la intento usar en una aplicacion de unity le restringio su uso porque supero el limite de usos.
El modelo de whisper es open source, pero los servicios que lo utilizan pueden ser de pago.
yo tengo la función de subtitular con la api de Google que genera subtítulos en TH-cam pero lo tengo en una aplicación externa que usa esa función de Google
Hola, podrías indicarme como descargar los archivos que genera replicate? Hasta ahora no he encontrado como descargar el archivo srt o la transcripción, solo con copiar y pegar.
Creo que a través de replicate solo se puede hacer así, copiando y pegando.
@@XavierMitjana muchas gracias.
Cómo se puede traducir del inglés al español?
Deberías pasarlo por un software de traducción tipo deepl Xavi.
Excelente video muchas gracias
Hola Xavier estoy utilizando la herramienta pero solo me deja transcribir 30 segundos, puedes hacer un tutorial es como realizar este paso pero para más tiempo?
Saludos y buen video
Es otra de las cosas que tenemos pendiente en la lista. A ver si me voy organizando y voy sacando deberes. 😉
th-cam.com/video/JuMEmF-2FsA/w-d-xo.html
Buenas herramientas, gracias.
Gracias Xavier!
Se puede hacer que en vez de escribir en chat gpt se le pregunté por medio de Audio y la IA responda también por Audio?
Sí, sería cuestión de combinar herramientas ya existentes (whisper+ChatGPT+Microsoft Azure), lo que no sé es si alguien ha montado ya un aplicativo para hacerlo.
Lo hace de lujo, sólo que me detecta el audio en gallego 🤣 ¿hay alguna manera de forzarlo a que lo transcriba en áspalo siempre? Muchas gracias por el video
Creo que se puede seleccionar el idioma, al menos en la aplicaición de replicate te permite marcarlo. Lo que no sé es cuales son los idiomas del selector disponibles.
Funcionó cuatro veces en replicate y se acabo la historia. Creo q es pq hay q pagar. Estoy en lo cierto?. Gracias por el video
genial gracias !!!
replicate no es gratis tengo que pagar con tarjeta ?? o alguien lo usa ilimitado al rato me pidio pago ejje
Hola Victor, para usar la API o desarrollar con ellas hay que pagar, para usar las demos públicas, hasta ahora, yo no he tenido ni tan siquiera que registrarme. Se puede acceder a ellas como si de un espacio más de HuggingFace se tratase.
@@XavierMitjana gracias si las probe y todas ok, solo esa era mi duda
Amigo necesitas tratar el audio de tus videos con Adobe Podcast o algo parecido urgente.
Estás viendo un vídeo antiguo. 😉 Échale una escucha a los últimos.
A este paso se podrían traducir videos de TH-cam de diferentes idiomas al español no :) ?
Sí, de hecho esto en principio, la tecnología de Whisper ya debería permitirlo, aunque creo que de momento solo está disponible para hacerlo al revés, de otros idiomas al inglés.
no funciona :(
falta el de subtitle edit
Con eso se clona mi voz
No, esta herramienta no es para crear voces, es para lo contrario, generar transcripciones.
Hola,
He estado usando la herramienta con Google Colab y funciona muy bien; sin embargo últimamente me aparece este aviso: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly......
No he encontrado que puede significar
¿Alguien sabe?
Saludos