Generowanie mowy i synchronizacja z obrazem - Przemysław Ślużyński
ฝัง
- เผยแพร่เมื่อ 30 พ.ย. 2024
- Szanowni Państwo,
Serdecznie zapraszamy na nagranie seminarium Katedry Akustyki które odbyło się 26 listopada 2024r. o godz. 11.30 w Audytorium im. Prof. Szczepana Szczeniowskiego w formie hybrydowej.
Referat wygłosił Pan mgr Przemysław Ślużyński z Katedry Akustyki, Wydziału Fizyki UAM.
Tytuł referatu:
Generowanie mowy i synchronizacja z obrazem w praktyce - czy komputery mogą mówić tak naturalnie jak ludzie?
Streszczenie:
W dzisiejszym świecie technologia AI odgrywa coraz większą rolę w wielu dziedzinach, wkraczając w rejony zarezerwowane dotychczas wyłącznie dla człowieka. Celem tego seminarium jest przedstawienie zastosowań algorytmów AI w generowaniu naturalnie brzmiącej mowy w języku polskim, omówienie korzyści i wyzwań związanych z wykorzystaniem tych algorytmów w badaniach naukowych i tworzeniu testów odsłuchowych. Przybliżę zagadnienia związane z generowaniem mowy przy użyciu algorytmów AI, problemy związane z trenowaniem modeli AI oraz pokażę możliwości synchronicznego łączenia wygenerowanej mowy z obrazem.