Las épocas en modelos de voces se refiere al número de iteraciones que se realiza durante el proceso de entrenamiento de un modelo de reconocimiento de voz
Bro gracias! Excelente tuto! Sabes si de esta misma manera puedo hacer, por ejemplo, que la voz de un amigo suene como la mía? Te leo y de nuevo, muchas gracias, haces un excelente trabajo!!!
Sabes a que se quiere referir el applio con esto?: UserWarning: Grad strides do not match bucket view strides. This may indicate grad was not created according to the gradient layout contract, or that the param's strides changed since DDP was constructed. This is not an error, but may impair performance.
Qué gran tutorial!! El mejor sin duda!! Ojalá me puedas ayudar, tengo una duda y es el saber si ¿Para cada voz hay que crear una carpeta como database? ¿O es suficiente creando una general que por ejemplo ponga "voces" y luego crear dentro de ella las carpetas con el audio y nombre de él actor, cantante, etc? Es para guardar las descargas pth e index de dicho cantante junto con el archivo wav de entrenamiento y tenerlo controlado en la misma carpeta para futuros entrenamientos. ¿O para entrenar no puede estar junto el archivo wav y el pth e Index? Ante todo muuuuchas gracias de nuevo!!
Los archivos de audio al estar en una misma carpeta puede que se haga una voz con todos los audios irreconocible la carpeta donde se guardan los modelos es la carpeta de applio dentro de la carpeta logs
Muchas gracias por contestar y encima tan rápido!!! Entiendo que los archivos pth e Index no debo descargarlos ya que quedan guardados en la carpeta log. Pero no entiendo la parte de donde tener todo reunido para no tener carpetas de voces y voces por el escritorio jajaj Es decir tener una carpeta que se llame "voces IA" por ejemplo y dentro de esa carpeta crear más carpetas con el nombre por ejemplo de cada actor, cantante etc que estés entrenando. Y luego a la hora de la ruta de entrenamiento pues seleccionaría la ruta de la carpeta del actor, cantante etc que estaría a su vez dentro de la carpeta general de "voces IA" que creé al principio. Jajj es un lío como me explico, ojalá me entiendas XD jaja y muchíiiiiisimas gracias de verdad!!!!
Muuuuchas gracias jo!!! Soy hipervergonzoso y encima parece que te esté haciendo un examen XD Ya no te molesto más que me sabe fatal pero me mata la duda de si tengo el audio wav con la voz del cantante afinada, con efectos, eq,compresión etc en FL Studio ¿Debería de desmarcar las tres casillas donde pone "Audio cutting", "process effects" y "Noise reduction"? ¿O se refiere a desmarcarlas sólo si ha sido tratada en cuanto al "Database"? Ya si que no molesto más dios mío que vergüenza XD Ante MUCHAS GRACIAS DE CORAZÓN Pdta: Aunque ya quizás noi me contestes jjaj 😆❤️❤️❤️❤️
hola. tengo este problema, no genera index demoro como 5 a 7 minutos a 100 epocas mi tarjeta de video es un rtx 4060 8 gb ( An error occurred extracting the index: need at least one array to concatenate If you are running this code in a virtual environment, make sure you have enough GPU available to generate the Index file.)
Una pregunta, yo descargué el index de la voz de acapela pero no el pth porque se me salió error en el applio, aunque aún no lo he probado y eso que he seguido los pasos de tu video. Una consulta, se tiene que aparecer el pth también obligatoriamente o solo con el index basta???
UNA consulta , tengo un audio con una cancion cantada por mi , no canto muy bien , el tema es que quiero ver si existe algo profesional para oir mi cancion con mi voz en inlges ?''' ya que no se cantar en inlges
Amigo necesito ayuda!! Cuando voy a entrenar applio me dice que actualmente no se admiten el entrenamiento debido a una ausencia del GPU. Para activar la pestaña de entrenamiento, vaya a la pestaña de configuracion y habilite la opcion "gpu falsa". Como la habilito bro?
TENGO INSTALADO RCV EN MI COMPUTADORA PORTATIL. HE CLONADO MI VOZ PORQUE QUIERO HACER AUDIOLIBROS CON ELLA. PERO NO ENCUENTRO EN DONDE INGRESAR EL TEXTO DE LOS LIBROS PARA QUE SE GENERE EL AUDIO CON MI VOZ CLONADA. PUEDE DECIRME EN QUE PARTE O COMO PUEDO HACER ESO?
muy buen video tengo una duda es que meti la pata y seme lleno el disco local C donde encuentro la ubicacion del peso generado por el entrenamiento? no llego a finalizar por que lo cancele
Jajaja si me pasó también por eso les mostré solo guardando el último modelo para borrar la carpeta del modelo tienes buscar en la carpeta de applio dentro se encuentra una carpeta llamada logs ahí encuentras los modelos creados elige el modelo que quieras borrar y listo recuerda también borrar de la papelera de reciclaje 👍
@@elfendergioz muchas gracias salvaste mi PC, por cierto que buen tutorial, una pregunta mas, la IA de mi voz en momento no sabe pronunciar la R y parece hablando como chino, tienes idea de como solucionarlo bro? gracias por tu atención se te agradece
Gracias por el video! Pregunta: 1. Cuanto tiempo debe durar el audio de mi voz o personaje de serie o película, para poder crear un modelo bastante decente? 3min 5min 10min? 2. Cuantas épocas aconsejas entrenar el modelo para, de igual manera, se escuche bastante decente? usaste 50 al inicio, luego 100 en reentrenamiento, pero entre más mejor supongo no? Gracias por el tutorial!
8 a 10 minutos ya queda perfecto si haces de más tiempo mejora más pero sabes que va a demorar más tiempo y la GPU calienta un poco las épocas puedes ir entrenando las que tú quieras máximo 1000 épocas claro checando que no suene robótica
Un modelo puedes entrenar de 500 a 800 epocas pero como explique en el vídeo en applio puedes entrenar y reentrenar un modelo por ejemplo si entrenas a 50 epocas el reentrenamiento sería a 100 epocas y así después 150 así sucesivamente
Hola, muy interesante y me encanta este proceso. Lástima que a pesar de seguir con todos los procesos que usted menciona en el vídeo, no he podido continuar porque mi computadora no es compatible. En la primera pantalla negra similar al símbolo de sistema CMD, me sale esto escrito en ingles : An error occurred connecting to Discord: Could not find Discord installed and running on this machine. A pesar de eso, se me abrió normal la otra pantalla del programa Applio, seguí para probar y aun así me funcionaba siguiendo los procesos que usted muestra en su vídeo. Luego en la parte Número de GPU no estaba el numero 0 como usted lo tiene, simplemente había un signo menos o sea así - le puse el numero 0 como usted lo tiene, y abajo en "Información de GPU" observo que pone escrito en ingles "Unfortunately, there is no compatible GPU available to support your training". Total, que he tenido que abandonar todo. Para mi es una lástima muy grande, porque a pesar de mis 63 años de edad aún me siento jóven, yo tenía mucha ilusión de poner una acapela cantando mi madre que en paz descanse y otra acapela de mi hermana, de ambas voces que pasé de cassette en wav, para hacerles cantar las canciones que solían cantar, y no ha podido ser posible. Tendré que esperar, a ver si sale mas adelante otro método con menos recursos, o a ver si en otro momento pudiese yo comprarme otro portátil mas potente. Si usted, o cualquier otra persona me lo pudiese hacer le estaría muy agradecido, a cambio le haría los duetos que quisiera de artistas que le guste . Es un método que hago manualmente con un editor de audio sin inteligencia artificial, solamente esta la uso para separar la voz de la música y el resto lo hago manual. Gracias por sus vídeos de instalación ,y de este otro en clonar la voz son geniales pues lo explica usted todo con detalle, y a la perfección. Gracias y Saludos!
como se hace si quiero la voz de un cantande un cantante como hago para solo tener la voz del cantante o si quiero hacer la voz de un personaje de una serie como hago
Hola, muchas gracias lo explicas muy bien la verdad, solo tengo un problema, empece a procesar mi data set, pero creo que le meti demasiados audios le pude 21 de 1 hora cada uno y despues pense que no era necesario y queria reducir cada audio a 10 minutos, pero tambien me di cuenta de que se comio casi 70gb de almacenamiento pero no se donde se guardaron esos archivos o donde puedo recuperar esos 70gb de almacenamiento, sabes algo al respecto?
Lo solucione o se soluciono solo, lo unico que hize fue detener el programa, y reiniciar el pc, imagino que todo ese espacio eran archivos temporales o algo por el estilo, porque no los encontraba por ningun lado
Yo puse uno solo directo por qué solo me detectaba uno de todos los audios divididos en fragmentos y pues cheque al momento de el procesado en applio igual se separan en fragmentos si tú quieres separarlos y checa que si detecten todos los audios de la carpeta 👍
06:41 - Deu Erro aqui An error occurred extracting the index: need at least one array to concatenate If you are running this code in a virtual environment, make sure you have enough GPU available to generate the Index fil :(
Uso modelos descargados de applio que dicen ser español latino, pero cuando transformo mi voz yo escucho que el audio que habla es ingles, o tiene ciertos acentos en ingles, como mejoraria eso?
@@elfendergioz jaja pues osea mi voz, soy ecuatoriana no tengo acento inglés, y solo digo Holi me llamo Dayana y hoy es domingo, pero eso todo sale con acento inglés:'(
Hola Fender, al dar convertir siempre me termina saliendo "error de conexion". Tambien intente utilizar el texto a voz y me termina saliendo otro error. Necesito ayuda. Desde ya gracias y que dios te bendiga
Hola alguien me puede ayudar a resolver el problema en applio hago el mismo paso para entrenar voces en este mismo video luego me dirijo a inferencia y busco el modelo no me sale pero el archivo índice si me sale quien me ayuda por favor
Entrenando mi modelo de 2 horas y media de recursos, 👀 500 epocas: Llevamos 39k segundos y lleva 31% completado, seguiremos informando xD Tiempo transcurrido: 10 horas y 50 minutos Tiempo restante para el 100%: 24 horas y 10 minutos Porcentaje completado: 31% Porcentaje restante: 69% Edit 2: Solo fue una epoca lo que entrenó, significa que para que entrene las 500 epocas tardará 2 años xDD, ahora veo que este programa te deja literalmente hacer cosas imposibles. Edit 3: Hemos reducido los recursos de 3 horas a 45 minutos y hemos bajado las epocas de 500 a 100, basandonos en calculos del último entrenamiento tenemos un cálculo de 3 dias y 15 horas para el modelo terminado.
No exageres con los audios con que pongas 8 a 10 máximo 15 minutos de audio eso si de buena calidad basta se demora menos y una PC más o menos decente bueno la gráfica es lo más importante
@@elfendergioz Ah es una pc del 2012, la mayoría de juego los corre entre 15 y 20 fps jaja, su tarjeta madre no acepta ni rams ddr4, ni tarjetas gráficas o bueno muy viejas y lentas, lo unico bueno esque tiene una SSD así que para tareas nunca se a trabado, en cuanto al recurso siento que es la parte mas importante, si quisiera limitarme a pocos minutos lo habría hecho en esos sitios automáticos.
@@elfendergioz Acabo de llegar a la conclusión de que dios me odia xD a pesar de que reduje todo eso, el entrenamiento aún asi tarda casi 12 horas por epoca, para que tarde 1.3 días considerando esa duración debería solo poner 1.5 minutos de recurso, lo cuál ya no me conviene, sonará muy robótico, como sea al menos lo intenté, lo volveré a intentar con una pc mas potente después, gracias por el tutorial, lo guardaré hasta entonces.
@@elfendergioz gracias!, lo probaré en otra ocasión, bro te comparto las características de mi pc por si te sirve de referencia para los que jugamos con nuestra tostadora xD El procesador Intel Celeron N2840 es un procesador móvil de bajo consumo de energía, lanzado en el tercer trimestre de 2014, con las siguientes características: - Número de núcleos: 2 - Número de hilos: 2 - Frecuencia de reloj base: 2.16 GHz - Frecuencia de reloj turbo máxima: 2.58 GHz - Caché: 1 MB - Litografía: 22 nm - TDP: 7,5 W - Memoria: DDR3L 1333, 8 GB máximo, 2 canales - Gráficos: Intel HD Graphics, 311 MHz base, 792 MHz turbo - Tecnologías: Intel 64, Enhanced Intel SpeedStep, Intel Smart Connect, Execute Disable Bit, Intel Virtualization Technology ¹.
@@elfendergioz si, lo hice pero no me generó el modelo, pero usé un video tuyo que pusiste en descripción y me resultó, asi que gracias bro, me sirvieron tus videos :D
@@elfendergioz Voy a intentarlo nuevamente. Tengo una última pregunta: Sabes hacer videos gráficos? He visto algunos canales de tiktok que narran una historia y tienen un vídeo tipo 3D que muestra la historia. Por decir, un accidente en un ascensor, el vídeo es uno de un accidente, pero creado. Te agradezco mucho y ya he visto caso todos tus videos, pero voy a volver a verlos, porque a la primera no me sales las cosas como dices. Jajajaja
@@d3vastat3ddd. Hay que buscar aúnque algunas IAs son de pagá las gratis por ejemplo hice video de una que se llama veedio puedes probarla es gratis yo también voy a ver si se puede con esa
Yo tengo una GPU de Nvidia RtX 2060 SUPER, La demora depende del tiempo que elijas en audio del dataset yo use como 5 minutos se demoró como unos 15 o 20 minutos solo 50 épocas Como ejemplo puede demorar más si le dejas 500 épocas
Ya que tengas abierto applio en el apartado de descarga pega el link del modelo y le das a descargar después vuelves a inferencia y le das en actualizar 👍
Si vas a hacer un tutorial hazlo bien, como que en otro video vas a explicar cual epoch usar y encima les dices que entrenen su modelo como si hacer 1000 epocas fuera mejor que hacer 10, menos mal yo ya se usarlo pero la pobre gente que te ve y se toma horas procesando un modelo haciendo cientos de epochs para que sin saberlo solo necesitaban hacer 20 y usan la epoca 1000 pensando que es la mejor cuando incluso podria ser la peor
Lo iba hacer pero no va alcanzar memoria si entrenas a 1000 épocas por qué pesa bastante el modelo con cada época guardada lo de las épocas es por qué demora mucho y si entrenas constantemente puedes cargarte la gráfica
@elfendergioz no, no me refiero a eso, me refiero a que dices que en otro video les dirás como elegir la mejor época, como vas a omitir eso y aparte hacer creer que entre más entrenamiento mejor, puede que alguien haga 300 épocas de un modelo que a lo mejor con 30 bastaba y peor aun que la mejor epoca sea la 15 y el este usando la 300 porque piensa que entre más mejor y puede que la 300 sea la peor de todas porque ya esta sobreentrenado el modelo
applio no sirve no imita la voz como lo hace topmedia o elevenlabs no me gusta applio rvc ni nada de eso a parte es lento y el resultado es una cagada top media es rapido y lo hace 99% bien
OLEEEE TÚ ! MIL GRACIAS ! eres el primero que me ha resuelto todas las dudas y además de darnos las herramientas necesarias
usted si se da a entender, he encontrado "guías" que parece que hablan en chino aun hablando español....
Esto está brutal hermano
Gran video.
¿Qué es y para qué sirve las "épocas"?
Las épocas en modelos de voces se refiere al número de iteraciones que se realiza durante el proceso de entrenamiento de un modelo de reconocimiento de voz
Bro gracias! Excelente tuto! Sabes si de esta misma manera puedo hacer, por ejemplo, que la voz de un amigo suene como la mía? Te leo y de nuevo, muchas gracias, haces un excelente trabajo!!!
Si quieres que suene como la tuya usa tu voz para crear el modelo de voz
Sabes a que se quiere referir el applio con esto?:
UserWarning: Grad strides do not match bucket view strides. This may indicate grad was not created according to the gradient layout contract, or that the param's strides changed since DDP was constructed. This is not an error, but may impair performance.
Dice q no es un error pero puede afectar el rendimiento no se si sera al modelo o la PC q gráfica y cpu tienes
Amigo gracias por el tutorial, en que páginas puedo usar mi voz clonada para hacer texto a voz? 👏👏
En Applio también tiene un apartado de texto a voz
Qué gran tutorial!! El mejor sin duda!! Ojalá me puedas ayudar, tengo una duda y es el saber si ¿Para cada voz hay que crear una carpeta como database? ¿O es suficiente creando una general que por ejemplo ponga "voces" y luego crear dentro de ella las carpetas con el audio y nombre de él actor, cantante, etc? Es para guardar las descargas pth e index de dicho cantante junto con el archivo wav de entrenamiento y tenerlo controlado en la misma carpeta para futuros entrenamientos. ¿O para entrenar no puede estar junto el archivo wav y el pth e Index? Ante todo muuuuchas gracias de nuevo!!
Los archivos de audio al estar en una misma carpeta puede que se haga una voz con todos los audios irreconocible la carpeta donde se guardan los modelos es la carpeta de applio dentro de la carpeta logs
Muchas gracias por contestar y encima tan rápido!!! Entiendo que los archivos pth e Index no debo descargarlos ya que quedan guardados en la carpeta log. Pero no entiendo la parte de donde tener todo reunido para no tener carpetas de voces y voces por el escritorio jajaj Es decir tener una carpeta que se llame "voces IA" por ejemplo y dentro de esa carpeta crear más carpetas con el nombre por ejemplo de cada actor, cantante etc que estés entrenando. Y luego a la hora de la ruta de entrenamiento pues seleccionaría la ruta de la carpeta del actor, cantante etc que estaría a su vez dentro de la carpeta general de "voces IA" que creé al principio. Jajj es un lío como me explico, ojalá me entiendas XD jaja y muchíiiiiisimas gracias de verdad!!!!
Eso si puedes pero igual cada audio separado por carpetas con el nombre de cada voz
Muuuuchas gracias jo!!! Soy hipervergonzoso y encima parece que te esté haciendo un examen XD Ya no te molesto más que me sabe fatal pero me mata la duda de si tengo el audio wav con la voz del cantante afinada, con efectos, eq,compresión etc en FL Studio ¿Debería de desmarcar las tres casillas donde pone "Audio cutting", "process effects" y "Noise reduction"? ¿O se refiere a desmarcarlas sólo si ha sido tratada en cuanto al "Database"? Ya si que no molesto más dios mío que vergüenza XD Ante MUCHAS GRACIAS DE CORAZÓN Pdta: Aunque ya quizás noi me contestes jjaj 😆❤️❤️❤️❤️
Chécalo si tiene la opción úsala
hola. tengo este problema, no genera index demoro como 5 a 7 minutos a 100 epocas mi tarjeta de video es un rtx 4060 8 gb ( An error occurred extracting the index: need at least one array to concatenate
If you are running this code in a virtual environment, make sure you have enough GPU available to generate the Index file.)
Una pregunta, yo descargué el index de la voz de acapela pero no el pth porque se me salió error en el applio, aunque aún no lo he probado y eso que he seguido los pasos de tu video. Una consulta, se tiene que aparecer el pth también obligatoriamente o solo con el index basta???
pero tus audios de entrenamiento de cuantos minutos fue? me parece increible
3 a 5 minutos puedes hacer cantado para covers y si quieres hacer solo para hablar solo hablado
si estas constipado cuando grabas la muestra de voz para entrenar al modelo luego las voces que generen suenan también como si estás constipado??
Grabén con tu voz lo mejor posible para que quede perfecto el modelo espérate a estar mejor
podrias hacer un tutuorial como se hace un dataset de un cantante no se como se hace gracias
Ya les hago tutorial con la voz de algún personaje
UNA consulta , tengo un audio con una cancion cantada por mi , no canto muy bien , el tema es que quiero ver si existe algo profesional para oir mi cancion con mi voz en inlges ?''' ya que no se cantar en inlges
Tienes que cantar en inglés
Amigo necesito ayuda!! Cuando voy a entrenar applio me dice que actualmente no se admiten el entrenamiento debido a una ausencia del GPU. Para activar la pestaña de entrenamiento, vaya a la pestaña de configuracion y habilite la opcion "gpu falsa".
Como la habilito bro?
Si tienes amd no funciona creo
Si tienes amd no funciona creo
@@ghostv8951 si ya me di cuenta. necesito rtx. pero el otro tutorial mas reciente si me anduvo
una duda no me aparece el modelo de voz solo me aparece el index, como podria arreglarlo
No se entreno talvez por qué si demora cuando entrena
TENGO INSTALADO RCV EN MI COMPUTADORA PORTATIL. HE CLONADO MI VOZ PORQUE QUIERO HACER AUDIOLIBROS CON ELLA. PERO NO ENCUENTRO EN DONDE INGRESAR EL TEXTO DE LOS LIBROS PARA QUE SE GENERE EL AUDIO CON MI VOZ CLONADA. PUEDE DECIRME EN QUE PARTE O COMO PUEDO HACER ESO?
En esta app puedes usar en el apartado de tts todavía no he subido video ya estare subiendo en estos días 👍
Pero quiero clonar mi voz para poderutilizarlo en la lectura de guiones de posdcast.. Me ayudas por favor
Ya estaré subiendo video solo q restaure la PC pendiente al canal
muy buen video tengo una duda es que meti la pata y seme lleno el disco local C donde encuentro la ubicacion del peso generado por el entrenamiento? no llego a finalizar por que lo cancele
Jajaja si me pasó también por eso les mostré solo guardando el último modelo para borrar la carpeta del modelo tienes buscar en la carpeta de applio dentro se encuentra una carpeta llamada logs ahí encuentras los modelos creados elige el modelo que quieras borrar y listo recuerda también borrar de la papelera de reciclaje 👍
@@elfendergioz muchas gracias salvaste mi PC, por cierto que buen tutorial, una pregunta mas, la IA de mi voz en momento no sabe pronunciar la R y parece hablando como chino, tienes idea de como solucionarlo bro? gracias por tu atención se te agradece
Vocaliza bien las palabras al grabar para que quede un dataset correcto y la IA detecte de mejor manera
@@elfendergioz Muchas gracias te lo agradezco
Gracias por el video!
Pregunta:
1. Cuanto tiempo debe durar el audio de mi voz o personaje de serie o película, para poder crear un modelo bastante decente? 3min 5min 10min?
2. Cuantas épocas aconsejas entrenar el modelo para, de igual manera, se escuche bastante decente? usaste 50 al inicio, luego 100 en reentrenamiento, pero entre más mejor supongo no?
Gracias por el tutorial!
8 a 10 minutos ya queda perfecto si haces de más tiempo mejora más pero sabes que va a demorar más tiempo y la GPU calienta un poco las épocas puedes ir entrenando las que tú quieras máximo 1000 épocas claro checando que no suene robótica
@@elfendergioz Mas tiempo a menos epoca o como seria cumpa? si tengo mi DATASET de 8 por ejemplo tendria que mandar menos epoca o 50 ?
Un modelo puedes entrenar de 500 a 800 epocas pero como explique en el vídeo en applio puedes entrenar y reentrenar un modelo por ejemplo si entrenas a 50 epocas el reentrenamiento sería a 100 epocas y así después 150 así sucesivamente
@tvanime6747 también puedes poner de 100 en 100 o 200 en 200
Muy bueno! Si quisiera al ultimo traducir la voz de español a ingles se podria con algun software? Qje recomendarias en ese caso?
Solo sube el audio con la voz en inglés traducir no se puede si quieres para covers si es solo para voz ya ando buscando
@@elfendergioz Solo me interesa traducir la voz
Cómo vas a traducir un audio tienes que buscar un cover en inglés
Este tipo de modelo se puede adaptar a código Python para Speech recognition?
Puedes probar si sabes
Hola, muy interesante y me encanta este proceso. Lástima que a pesar de seguir con todos los procesos que usted menciona en el vídeo, no he podido continuar porque mi computadora no es compatible. En la primera pantalla negra similar al símbolo de sistema CMD, me sale esto escrito en ingles :
An error occurred connecting to Discord: Could not find Discord installed and running on this machine. A pesar de eso, se me abrió normal la otra pantalla del programa Applio, seguí para probar y aun así me funcionaba siguiendo los procesos que usted muestra en su vídeo.
Luego en la parte Número de GPU no estaba el numero 0 como usted lo tiene, simplemente había un signo menos o sea así - le puse el numero 0 como usted lo tiene, y abajo en "Información de GPU" observo que pone escrito en ingles "Unfortunately, there is no compatible GPU available to support your training". Total, que he tenido que abandonar todo. Para mi es una lástima muy grande, porque a pesar de mis 63 años de edad aún me siento jóven, yo tenía mucha ilusión de poner una acapela cantando mi madre que en paz descanse y otra acapela de mi hermana, de ambas voces que pasé de cassette en wav, para hacerles cantar las canciones que solían cantar, y no ha podido ser posible. Tendré que esperar, a ver si sale mas adelante otro método con menos recursos, o a ver si en otro momento pudiese yo comprarme otro portátil mas potente. Si usted, o cualquier otra persona me lo pudiese hacer le estaría muy agradecido, a cambio le haría los duetos que quisiera de artistas que le guste . Es un método que hago manualmente con un editor de audio sin inteligencia artificial, solamente esta la uso para separar la voz de la música y el resto lo hago manual.
Gracias por sus vídeos de instalación ,y de este otro en clonar la voz son geniales pues lo explica usted todo con detalle, y a la perfección. Gracias y Saludos!
Si acabo de ver eso solo funciona con GPUs de Nvidia
Buena información, puedo entrenar mi voz para ponerla en una pista musical?
Si viste el vídeo si se puede ahí también les dejé en la descripción para que hagan musica con ia y con la IA de applio convertir a tu voz
@@elfendergioz gracias
hay una forma de usar applio sin gpu para entrenar los modelos de voz?, es que no tengo una tarjeta grafica por ahora
@@PinkuRyu en la descripción video de cómo crear un modelo de voz funciona en móvil y PC
amigo una consulta , el archivo index que funcion tiene? yo aun no noto diferencia cuando los activo?
Puedes usar solo pth si quieres
para convertir texto a voz, cual es el limite que te dan, se puede hacer de manera ilimitada ?
Prueba bro ya que todavía no grabó usando txt
como se hace si quiero la voz de un cantande un cantante como hago para solo tener la voz del cantante o si quiero hacer la voz de un personaje de una serie como hago
Ya estáre haciendo video para crear un dataset con las voces que tú quieras
A mi me crea el pth pero no me generó un index,a que se puede deber?
Dale a generar index y espera a que se guarde
Hola, muchas gracias lo explicas muy bien la verdad, solo tengo un problema, empece a procesar mi data set, pero creo que le meti demasiados audios le pude 21 de 1 hora cada uno y despues pense que no era necesario y queria reducir cada audio a 10 minutos, pero tambien me di cuenta de que se comio casi 70gb de almacenamiento pero no se donde se guardaron esos archivos o donde puedo recuperar esos 70gb de almacenamiento, sabes algo al respecto?
Lo solucione o se soluciono solo, lo unico que hize fue detener el programa, y reiniciar el pc, imagino que todo ese espacio eran archivos temporales o algo por el estilo, porque no los encontraba por ningun lado
Los modelos se guardan en la carpeta logs que se encuentra dentro de la carpeta de applio
buenas , que puedo hacer si no se me crea el archivo index aunque me haya puesto que se ha generado ? un saludo
Dale en actualizar ahí debe aparecer
@ le doy pero sigue sin irme , me lo desinstale y todo pero no se me crea ell archivo
hola buenas, no se genera el index, que podria estar pasando?
Cuánto se demoró el entrenamiento?
Pregunta, es cierto que debo separar el audio del dataset en fragmentos de 10 segundos?
Yo puse uno solo directo por qué solo me detectaba uno de todos los audios divididos en fragmentos y pues cheque al momento de el procesado en applio igual se separan en fragmentos si tú quieres separarlos y checa que si detecten todos los audios de la carpeta 👍
Alguna forma de que no se caiga la página porque llega cierto tiempo en el que ya estás entrenando tu modelo de voz se cae
No me ha pasado pero si pruebas entrenando a 50 epocas y después reentrena de 50 en 50
@@elfendergiozy cómo reentreno bro
En el vídeo mismo explique Bro 👍
CHola. Cuando le doy a convertir la cancion con mi voz me aparece error y no la genera.
Si tienes GPU
También puedes checar el último video otro método ese funciona con CPU y GPU 👍
06:41 - Deu Erro aqui
An error occurred extracting the index: need at least one array to concatenate
If you are running this code in a virtual environment, make sure you have enough GPU available to generate the Index fil
:(
Si tienes GPU o lo que tarjeta gráfica
@@elfendergioz Eu tenho um Notebook com AMD Rayzen 5 5500U Radeon Graphics com 8G de RAM
Las GPU de AMD me dicen q no les detecta solo las de Nvidia
Uso modelos descargados de applio que dicen ser español latino, pero cuando transformo mi voz yo escucho que el audio que habla es ingles, o tiene ciertos acentos en ingles, como mejoraria eso?
No son Español latino checa bien
@@elfendergioz que lo chquee bien incluso descargue varias pero lo mismo, sale aceto de ingles, osea las "S" suenan como si fuera ingles
Y que audios estás usando para convertir
A veces depende de qué audios estamos convirtiendo
@@elfendergioz jaja pues osea mi voz, soy ecuatoriana no tengo acento inglés, y solo digo Holi me llamo Dayana y hoy es domingo, pero eso todo sale con acento inglés:'(
Hola Fender, al dar convertir siempre me termina saliendo "error de conexion". Tambien intente utilizar el texto a voz y me termina saliendo otro error. Necesito ayuda. Desde ya gracias y que dios te bendiga
Si tienes GPU
@@elfendergioz ¿que es y como la chequeo?
La tarjeta gráfica de la PC por ejemplo las de Nvidia rtx son las q funciona correctamente las de AMD no es funcionando bien
Chale bro... Y una GTX crees q funcione?
Prueba
Hola alguien me puede ayudar a resolver el problema en applio hago el mismo paso para entrenar voces en este mismo video luego me dirijo a inferencia y busco el modelo no me sale pero el archivo índice si me sale quien me ayuda por favor
Dale actualizar
Brot te hablé por Instagram
@@elfendergioz si pero sigue igual 🟰 cheeks el instagram
Tengo una duda mientras mas epocas es mejor o no?
Si pero demasiadas también se vuelve un poco robótica cuando notes algo así usa el entrenamiento anterior
Amigo necesito un entrenamiento pero mi computadora no cumple los requisitos. Podría generarme uno de ellos y llegar a algún acuerdo de pago
En la descripción un método para crear modelos de voz que funciona en navegador y puedes usar en móvil y PC
Este tutorial lo hiciste con tu voz clonada ?
Si pero solo la música que convertí sería ilógico Hacer el tutorial hablando con mi voz y convertir a mi voz con la IA solo para texto a voz
Bro tengo un problema al entrenar la voz en la ultima parte donde dice actualizar voz no se atualiza
Q GPU tienes?
@@elfendergioz nose la verdad?
Si no te funciona en la descripción hay un vídeo de una IA que funciona en móvil y PC
@@elfendergioz bro sigo sin poder me dice que el archivo no se encuentra en el sitio
Si estás haciendo bien los pasos Bro yo lo puedo usar normalmente
mmn no se segui los pasos y no me genero nada por
Si tienes GPU si funciona mejor las de Nvidia ya que las de AMD dejaron de dar soporte
A mí no se me genera el pth porque será?
Sigue bien los pasos Bro funciona bien recuerda que si demora entrenar
@@elfendergioz hice todo, pero será porque no tengo tarjeta gráfica?
Es necesario una GPU si este método no te funciona checa la descripción ahí deje un método para clonar una voz desde móvil y PC
@@elfendergioz dice q se recomienda gpu pero que se pude usar una cpu. Funcionará?
Me pasa lo mismo, tampoco tengo gpu, seguro es por eso
cuanto tiempo de la grabacion de voz sería lo recomendado ? o da igual que meta un audio de 5 o 30 minutos ?
Si pones más tiempo de audio más va a demorar en entrenar
@@elfendergioz mi pregunta hiva a cuanto sería el tiempo mínimo que debería tener el audio
5 mínimo de ahí puedes usarlo hasta 20 o más demora mucho tiempo en entrenar
@@elfendergioz ok, muchas gracias
Crees que podría en celular?
En la descripción
No he podido instalar applio 😢 mi laptop AMD creo no es posible
No es posible pero puedes Crear tu modelo de voz en navegador funciona en móvil y PC de bajos recursos
@elfendergioz disculpa amigo y que recomiendas para clonar los audios en pc que ya no sea kits ia
Checa replay ai es una app para PC prueba cuánto se demora ya q funciona con CPU
Sirve para español de España?
Para todo acento bro
Entrenando mi modelo de 2 horas y media de recursos, 👀 500 epocas:
Llevamos 39k segundos y lleva 31% completado, seguiremos informando xD
Tiempo transcurrido: 10 horas y 50 minutos
Tiempo restante para el 100%: 24 horas y 10 minutos
Porcentaje completado: 31%
Porcentaje restante: 69%
Edit 2: Solo fue una epoca lo que entrenó, significa que para que entrene las 500 epocas tardará 2 años xDD, ahora veo que este programa te deja literalmente hacer cosas imposibles.
Edit 3: Hemos reducido los recursos de 3 horas a 45 minutos y hemos bajado las epocas de 500 a 100, basandonos en calculos del último entrenamiento tenemos un cálculo de 3 dias y 15 horas para el modelo terminado.
No exageres con los audios con que pongas 8 a 10 máximo 15 minutos de audio eso si de buena calidad basta se demora menos y una PC más o menos decente bueno la gráfica es lo más importante
@@elfendergioz Ah es una pc del 2012, la mayoría de juego los corre entre 15 y 20 fps jaja, su tarjeta madre no acepta ni rams ddr4, ni tarjetas gráficas o bueno muy viejas y lentas, lo unico bueno esque tiene una SSD así que para tareas nunca se a trabado, en cuanto al recurso siento que es la parte mas importante, si quisiera limitarme a pocos minutos lo habría hecho en esos sitios automáticos.
@@elfendergioz Acabo de llegar a la conclusión de que dios me odia xD a pesar de que reduje todo eso, el entrenamiento aún asi tarda casi 12 horas por epoca, para que tarde 1.3 días considerando esa duración debería solo poner 1.5 minutos de recurso, lo cuál ya no me conviene, sonará muy robótico, como sea al menos lo intenté, lo volveré a intentar con una pc mas potente después, gracias por el tutorial, lo guardaré hasta entonces.
Bro checa la descripción del vídeo hay otro método que funciona en navegador y puedes usar en móvil y PC
@@elfendergioz gracias!, lo probaré en otra ocasión, bro te comparto las características de mi pc por si te sirve de referencia para los que jugamos con nuestra tostadora xD
El procesador Intel Celeron N2840 es un procesador móvil de bajo consumo de energía, lanzado en el tercer trimestre de 2014, con las siguientes características:
- Número de núcleos: 2
- Número de hilos: 2
- Frecuencia de reloj base: 2.16 GHz
- Frecuencia de reloj turbo máxima: 2.58 GHz
- Caché: 1 MB
- Litografía: 22 nm
- TDP: 7,5 W
- Memoria: DDR3L 1333, 8 GB máximo, 2 canales
- Gráficos: Intel HD Graphics, 311 MHz base, 792 MHz turbo
- Tecnologías: Intel 64, Enhanced Intel SpeedStep, Intel Smart Connect, Execute Disable Bit, Intel Virtualization Technology ¹.
Amigo no esta la página de aplio
Ya lo acabo de dejar pero si no sabes cómo ejecutar deje tutorial como instalar 👍
no me aparece el modelo,. creo que es por que no tengo gpu, Que deberia de hacer? :C
En la descripción del vídeo hay otro método
@@elfendergioz Ah no, si tengo una gpu pero me dice ese error, sabes por que sera?
Bueno GPU es la tarjeta gráfica de la PC recomendado las de Nvidia si no tienes una usa el método que deje en la descripción
Ayuda, no se me genera el modelo, entrene la voz a 100 y a 200 épocas y no se genera
Cuánto se demoró el entrenamiento
@@elfendergioz alrededor de 20 minutos
Bro checa bien el vídeo si entreno si debe guardar el modelo
Recuerda darle actualizar para q aparezca el modelo
@@elfendergioz si, lo hice pero no me generó el modelo, pero usé un video tuyo que pusiste en descripción y me resultó, asi que gracias bro, me sirvieron tus videos :D
QUE SE SUPONE QUE SON LAS EPOCAS?
EL RESTO SE ENTIENDE PERFECTAMENTE
Son las épocas de entrenamiento de tu modelo
Pregunta se puede en Android ya que no cuento con PC
Si checa la descripción de este vídeo Hay un método que Funciona en Móvil y PC
@@elfendergiozmuchas gracias bro saludo
Pilas solo abre los links en tu móvil funciona perfectamente
Hola, yo hice todo lo de applio, pero no cuando bajo el archivo de Discord, no me sale en applio, luego de actualizar.
Checa bien el vídeo el modelo descargado mueve a la carpeta logs que se encuentra en la carpeta de applio en el vídeo mismo se muestra
@@elfendergioz Todo eso hice y cuando actualizo no me sale agregado. Lo he intentado con muchos archivos del discord.
@d3vastat3ddd. Hoy agregue algunos modelos todo normal recuerda descomprimir las carpetas de los modelos y esa carpeta agregar a logs
@@elfendergioz Voy a intentarlo nuevamente. Tengo una última pregunta: Sabes hacer videos gráficos? He visto algunos canales de tiktok que narran una historia y tienen un vídeo tipo 3D que muestra la historia. Por decir, un accidente en un ascensor, el vídeo es uno de un accidente, pero creado. Te agradezco mucho y ya he visto caso todos tus videos, pero voy a volver a verlos, porque a la primera no me sales las cosas como dices. Jajajaja
@@d3vastat3ddd. Hay que buscar aúnque algunas IAs son de pagá las gratis por ejemplo hice video de una que se llama veedio puedes probarla es gratis yo también voy a ver si se puede con esa
que tarjeta grafica tenes y cuanto te demoro a vos
Yo tengo una GPU de Nvidia RtX 2060 SUPER, La demora depende del tiempo que elijas en audio del dataset yo use como 5 minutos se demoró como unos 15 o 20 minutos solo 50 épocas Como ejemplo puede demorar más si le dejas 500 épocas
Tienes el mismo problema de todos los vídeos, eso no se puede usar en el tts por lo tanto no sirve
De hecho estoy checando esa opción me parece interesante pendiente al canal
@@elfendergioz si llegas a lograrlo serias el primero en youtube en lograrlo porque nadie lo ha logrado
Como lo guardo como .zip?
Ya que tengas abierto applio en el apartado de descarga pega el link del modelo y le das a descargar después vuelves a inferencia y le das en actualizar 👍
el tema es que lei todos los comentarios y Nadie lo logró .
Se nesesita una PC decente ya que para Crear un modelo es necesario una tarjeta gráfica recomendada de Nvidia
Si vas a hacer un tutorial hazlo bien, como que en otro video vas a explicar cual epoch usar y encima les dices que entrenen su modelo como si hacer 1000 epocas fuera mejor que hacer 10, menos mal yo ya se usarlo pero la pobre gente que te ve y se toma horas procesando un modelo haciendo cientos de epochs para que sin saberlo solo necesitaban hacer 20 y usan la epoca 1000 pensando que es la mejor cuando incluso podria ser la peor
Lo iba hacer pero no va alcanzar memoria si entrenas a 1000 épocas por qué pesa bastante el modelo con cada época guardada lo de las épocas es por qué demora mucho y si entrenas constantemente puedes cargarte la gráfica
@elfendergioz no, no me refiero a eso, me refiero a que dices que en otro video les dirás como elegir la mejor época, como vas a omitir eso y aparte hacer creer que entre más entrenamiento mejor, puede que alguien haga 300 épocas de un modelo que a lo mejor con 30 bastaba y peor aun que la mejor epoca sea la 15 y el este usando la 300 porque piensa que entre más mejor y puede que la 300 sea la peor de todas porque ya esta sobreentrenado el modelo
Y el link
En la descripción
Que son las épocas ? No lo dijo...El proceso no es 🧓 realmente
La épocas de entrenamiento de nuestro modelo
Soy músico. Es mucho mejor y mas profesional que replay . 😮
Compara cuál te da mejor resultado
applio no sirve no imita la voz como lo hace topmedia o elevenlabs no me gusta applio rvc ni nada de eso a parte es lento y el resultado es una cagada top media es rapido y lo hace 99% bien
7:22 no me aparece mi modelo de voz
que hago? estoy en el celular ayudenme plis :,v llevo meses buscando un tutorial q funcione
Este método funciona solo en PC en la descripción Hay un método que funciona en móvil y PC ya q es en navegador
@@elfendergioz
Gracias :'3