Clonación de Voz: De Audio a TTS en 18 Minutos | Tutorial Completo

แชร์
ฝัง
  • เผยแพร่เมื่อ 2 ม.ค. 2025

ความคิดเห็น • 20

  • @lvidalio
    @lvidalio 8 หลายเดือนก่อน +2

    Gran video! Muchas gracias!

  • @Diego.Ojeda_
    @Diego.Ojeda_ หลายเดือนก่อน

    Bro, podrias hacer un tutorial de como convertir archivos del modelo de Applio (Index y Pth) compatibles con tu programa (oxx, json), sería muy util

  • @UCQCbeSS3M-FRKU9XhYKmnUg
    @UCQCbeSS3M-FRKU9XhYKmnUg 3 หลายเดือนก่อน

    Lástima que no se pueda usar las 2 GPUs para entrenar de manera más eficiente. No sé si esto se deba a que para Piper y el notebook se están usando unas versiones antiguas de PyTorch y otros módulos como Lightning. Para datasets de 2 o más horas será bastante lento. Y cuidado con Numpy 2.0, que no funcionará el cuaderno si se instala esa versión. Yo personalmente uso el modo save & run, no el modo interactivo, ya que así no tengo que interactuar con la página cada 30 minutos. Es algo más manual en cuanto a algunas cosas, pero ya se hizo costumbre.

  • @ernestoflores3873
    @ernestoflores3873 4 หลายเดือนก่อน

    Laburaso hermano! Disculpa sabes por que cuando extraigo el tar.gz me extrae solo un archivo onnx.json?? Me falta el onnx en si

    • @hircoir
      @hircoir  4 หลายเดือนก่อน +1

      Usa el espacio de Huggingface, posiblemente se actualizó el proyecto y por ende se rompió todo: huggingface.co/spaces/HirCoir/Kaggle-Piper-onnx-export-and-inference

    • @ernestoflores3873
      @ernestoflores3873 4 หลายเดือนก่อน +1

      @@hircoir Gracias hermano, funciono! Te jodo con una última cosa jaja, a mi me copa esto de la ia, en especial esto del tts. Recomendas algún curso, repo para leer, o algo para aprender más sobre el tema?

    • @hircoir
      @hircoir  3 หลายเดือนก่อน +1

      @@ernestoflores3873 Te recomiendo leer acerca de Tacotron, CoquiTTS, etc... Como tal no puedo recomendar algo en específico pero lo anterior mencionado son tecnologías para el entrenamiento de modelos de voz

    • @ernestoflores3873
      @ernestoflores3873 3 หลายเดือนก่อน

      @@hircoir Gracias bro, voy a verlo! Suerte en tus proyectos!

  • @EsetNodplus
    @EsetNodplus 4 หลายเดือนก่อน

    ya no funciona en codigo para clonar voz en kragle....

  • @EsetNodplus
    @EsetNodplus 4 หลายเดือนก่อน

    Ya no Funciona el Metodo en kragle, no puedo clonar mi voz. Reviselo Porfavor. Gracias

    • @hircoir
      @hircoir  4 หลายเดือนก่อน

      @@EsetNodplus Puedes decirme cuál es el error?
      Recuerda que el máximo de segundos por cada audio debe de ser menor a 10 segundos, de lo contrario al momento de iniciar el entrenamiento este dará un error diciendo que se quedó sin memoria la infancia

    • @EsetNodplus
      @EsetNodplus 4 หลายเดือนก่อน

      @@hircoir DEPRECATION: pytorch-lightning 1.7.7 has a non-standard dependency specifier torch>=1.9.*. pip 24.0 will enforce this behaviour change. A possible replacement is to upgrade to a newer version of pytorch-lightning or contact the author to suggest that they release a version with a conforming dependency specifiers. Discussion can be found at

    • @EsetNodplus
      @EsetNodplus 4 หลายเดือนก่อน

      ImportError: numpy.core.multiarray failed to import

    • @hircoir
      @hircoir  4 หลายเดือนก่อน

      @@EsetNodplus Esta noche le echaré una revisada al código, gracias por avisar 😁

    • @EsetNodplus
      @EsetNodplus 4 หลายเดือนก่อน

      @@hircoir eso seria genial. Gracias...

  • @EsetNodplus
    @EsetNodplus 4 หลายเดือนก่อน

    alguna solución amigos ?

  • @gustavotsantander4495
    @gustavotsantander4495 4 หลายเดือนก่อน

    Buen aporte, pero recomiendo usar su producto y reemplazar el audio robótico. Debería tener más me gusta.

    • @hircoir
      @hircoir  4 หลายเดือนก่อน

      @@gustavotsantander4495 Hola!, no entendí a que te refieres con lo del producto 🤔

  • @centrokairos-arg
    @centrokairos-arg 4 หลายเดือนก่อน

    vas muy rapido y no se entiende que decis!!! esa voz artificial que usas no deja entender bien que queres decir