интересный доклад, но утверждение, что Yandex Speechkit для VTT работает "сильно лучше виспера", имхо, крайне сомнительное возможно, что для задач, которые решал автор доклада это утверждение истинно, но для решения задачи транскрибации видео я остановился на виспере, тк WER у него (large-v3 / large-v3-turbo) сильно ниже чем у решения от Яндекса справедливости ради стоит сказать, что у Яндекса, с моей точки зрения, тоже есть более сильные стороны, а именно, куда более точные word-level таймстампы
Забавные костюмчики у всех тут 😊
Демка с общением с Эйнштейном офигенная!
интересный доклад, но утверждение, что Yandex Speechkit для VTT работает "сильно лучше виспера", имхо, крайне сомнительное
возможно, что для задач, которые решал автор доклада это утверждение истинно, но для решения задачи транскрибации видео я остановился на виспере, тк WER у него (large-v3 / large-v3-turbo) сильно ниже чем у решения от Яндекса
справедливости ради стоит сказать, что у Яндекса, с моей точки зрения, тоже есть более сильные стороны, а именно, куда более точные word-level таймстампы