E thấy phần mềm SUBTITLE EDIT có tính năng TTS, có cần thiết phải dùng TTS của balabolka không, TTS cái nào tốt hơn? và các phần mềm AI STT trên github cũng thấy tích hợp trong phần mềm SUBTITLE EDIT, có cần thiết phải dùng phần mềm ngoài từ github không, STT cái nào tốt hơn?
Phía dưới là bản google dịch từ tiếng Anh nhé, CPP thì được chính nhóm subtitle edit phát triển, cài đặt đơn giản đỡ lằng nhằng, chất lượng khá tốt. Chính xác thì máy móc nó chỉ đến mức nào thôi, vẫn phải dùng "A.I bằng cơm". Phụ đề nhiều thì nên dùng youtube lấy, vì sau youtube là data center của google và con bard, subtitle chạy 30 phút thì youtube nó chạy chỉ 1 phút. bạn cần tìm hiểu thêm về dự án thì vào đây github.com/SubtitleEdit/subtitleedit/discussions sau đây là bản dịch: Whisper CPP là một công cụ được xây dựng tùy chỉnh sử dụng mô hình OpenAI Whisper để nhận dạng giọng nói. Nó được biết đến với tốc độ và độ chính xác, nhưng nó cũng sử dụng nhiều bộ nhớ hơn. WhisperX là một công cụ nguồn mở cũng sử dụng mô hình OpenAI Whisper. Nó chậm hơn một chút so với Whisper CPP, nhưng nó sử dụng ít bộ nhớ hơn và hỗ trợ nhiều mô hình Whisper. S3T là một công cụ thương mại sử dụng Google Cloud Speech-to-Text. Nó được biết đến với độ chính xác và hỗ trợ nhiều ngôn ngữ, nhưng nó có thể tốn kém. Vosk là một công cụ mã nguồn mở sử dụng CMU Sphinx. Đó là một lựa chọn tốt cho những người dùng muốn có một công cụ mã nguồn mở và nhẹ, nhưng nó có thể không chính xác như một số tùy chọn khác. DeepSpeech là một công cụ mã nguồn mở sử dụng Mozilla DeepSpeech. Nó là một công cụ đầy hứa hẹn với độ chính xác cao, nhưng nó vẫn đang được phát triển và có thể không ổn định như một số lựa chọn khác. Cuối cùng, công cụ tốt nhất cho bạn sẽ phụ thuộc vào nhu cầu và sở thích cụ thể của bạn. Nếu bạn đang tìm kiếm bản chép lời nhanh nhất và chính xác nhất thì WhisperX hoặc S3T là những lựa chọn tốt. Nếu bạn đang tìm kiếm một công cụ mã nguồn mở và nhẹ thì Vosk hoặc DeepSpeech là những lựa chọn tốt. Và nếu bạn đang tìm kiếm trải nghiệm tích hợp nhất với Subtitle Edit thì Whisper CPP là một lựa chọn tốt.
@@icttapilu ytb nó trích xuất phụ đề củ chuối lắm, sub gốc đã sai thì dịch sao đúng được, nói chung là tệ hơn capcut, thử đăng 1 video lên ytb rồi xem sub nó tạo tự động sai bét nhè, sai nhiều hơn so với sub mà capcut tạo ra
@@hoathinhhaychanel01 Bản miễn phí vẫn có những hạn chế , bản thương mại nếu nó sai có thể gọi lại thằng lấy tiền rồi chửi :). Các công cụ vẫn đang phát triển, họ đưa ra những bản miễn phí để mình làm chuột bạch và lấy phản hồi, sửa lỗi. Còn bản ngon họ cất để bán !!! "S3T là một công cụ thương mại sử dụng Google Cloud Speech-to-Text. Nó được biết đến với độ chính xác và hỗ trợ nhiều ngôn ngữ, nhưng nó có thể tốn kém."
bạn dùng thử whisper của Open A.I trên máy ảo google chắc chắn là nhanh hơn. Tuy nhiên đồ miễn phí thì nó cũng có hạn. th-cam.com/video/9iB9WFTX2NA/w-d-xo.html
Bạn hiups mình vs.capcut mình ko co 2 giọng đọc nam vs nữ.để đọc tiếng việt.mình xài win 10.có phải giống như bạn nói.lúc đầu clip.khi cài SE ko.mong bạn rep ạ.tk
Mình cũng chưa gặp nên ko biết lỗi ở đâu. Bạn cài trên windows gì (7,10,11)... hay Mac. Hiện tại mình đang dùng trên win11 thì ko thấy lỗi như vậy. VÌ ko tái hiện được lỗi, nên chưa biết tại sao.
Bạn muốn up lên youtube à? Bạn chỉ cần dùng ttrang tunestotube.com trang đó nó up thẳng mp3 lên youtube, thành file .mp4 với nền đen. Nếu cần .mp4 thì bạn down về nhé. Ngoài ra nếu bạn search up audio lên youtube thì còn nhiều trang nữa.
@@icttapilu E cảm ơn a đã phản hồi ạ! Nhưng hiện tại e làm subtitle theo dạng lyrics bài hát, nên muốn bỏ mp3 vào phần mềm rồi xuất file nền đen từ phần mềm subtitle edit thì có xuất được ko ạ?
Whisper chính là một dự án của Open AI rồi bạn nhé. Nó được train bởi OPEN AI nhé. Bạn quan tâm đến API nếu bạn muốn ứng dụng cái này để phát triển sản phầm của riêng bạn. Đăng ký cho developer ở đây openai.com/product thông tin thêm về dự án whisper openai.com/research/whisper
đã từng dùng Wishper so sánh với capcut, file phụ đề xuất ra cũng chẳng mấy chính xác hơn, nhưng thời gian convert quá lâu so với capcut
nhưng capcut cần trả phí
huhu lâu thiệt tận 36p ` file
E thấy phần mềm SUBTITLE EDIT có tính năng TTS, có cần thiết phải dùng TTS của balabolka không, TTS cái nào tốt hơn?
và các phần mềm AI STT trên github cũng thấy tích hợp trong phần mềm SUBTITLE EDIT, có cần thiết phải dùng phần mềm ngoài từ github không, STT cái nào tốt hơn?
sao phải chọn CPP mà không chọn mấy cái kia vậy ad? cái nào sẽ chính xác hơn ah?
Phía dưới là bản google dịch từ tiếng Anh nhé, CPP thì được chính nhóm subtitle edit phát triển, cài đặt đơn giản đỡ lằng nhằng, chất lượng khá tốt. Chính xác thì máy móc nó chỉ đến mức nào thôi, vẫn phải dùng "A.I bằng cơm". Phụ đề nhiều thì nên dùng youtube lấy, vì sau youtube là data center của google và con bard, subtitle chạy 30 phút thì youtube nó chạy chỉ 1 phút.
bạn cần tìm hiểu thêm về dự án thì vào đây github.com/SubtitleEdit/subtitleedit/discussions
sau đây là bản dịch:
Whisper CPP là một công cụ được xây dựng tùy chỉnh sử dụng mô hình OpenAI Whisper để nhận dạng giọng nói. Nó được biết đến với tốc độ và độ chính xác, nhưng nó cũng sử dụng nhiều bộ nhớ hơn.
WhisperX là một công cụ nguồn mở cũng sử dụng mô hình OpenAI Whisper. Nó chậm hơn một chút so với Whisper CPP, nhưng nó sử dụng ít bộ nhớ hơn và hỗ trợ nhiều mô hình Whisper.
S3T là một công cụ thương mại sử dụng Google Cloud Speech-to-Text. Nó được biết đến với độ chính xác và hỗ trợ nhiều ngôn ngữ, nhưng nó có thể tốn kém.
Vosk là một công cụ mã nguồn mở sử dụng CMU Sphinx. Đó là một lựa chọn tốt cho những người dùng muốn có một công cụ mã nguồn mở và nhẹ, nhưng nó có thể không chính xác như một số tùy chọn khác.
DeepSpeech là một công cụ mã nguồn mở sử dụng Mozilla DeepSpeech. Nó là một công cụ đầy hứa hẹn với độ chính xác cao, nhưng nó vẫn đang được phát triển và có thể không ổn định như một số lựa chọn khác.
Cuối cùng, công cụ tốt nhất cho bạn sẽ phụ thuộc vào nhu cầu và sở thích cụ thể của bạn. Nếu bạn đang tìm kiếm bản chép lời nhanh nhất và chính xác nhất thì WhisperX hoặc S3T là những lựa chọn tốt. Nếu bạn đang tìm kiếm một công cụ mã nguồn mở và nhẹ thì Vosk hoặc DeepSpeech là những lựa chọn tốt. Và nếu bạn đang tìm kiếm trải nghiệm tích hợp nhất với Subtitle Edit thì Whisper CPP là một lựa chọn tốt.
@@icttapilu ytb nó trích xuất phụ đề củ chuối lắm, sub gốc đã sai thì dịch sao đúng được, nói chung là tệ hơn capcut, thử đăng 1 video lên ytb rồi xem sub nó tạo tự động sai bét nhè, sai nhiều hơn so với sub mà capcut tạo ra
@@hoathinhhaychanel01 Bản miễn phí vẫn có những hạn chế , bản thương mại nếu nó sai có thể gọi lại thằng lấy tiền rồi chửi :). Các công cụ vẫn đang phát triển, họ đưa ra những bản miễn phí để mình làm chuột bạch và lấy phản hồi, sửa lỗi. Còn bản ngon họ cất để bán !!!
"S3T là một công cụ thương mại sử dụng Google Cloud Speech-to-Text. Nó được biết đến với độ chính xác và hỗ trợ nhiều ngôn ngữ, nhưng nó có thể tốn kém."
@@icttapilu ad biết công cụ nào lấy sub cứng trên video tốt không ah?
bạn dùng thử whisper của Open A.I trên máy ảo google chắc chắn là nhanh hơn. Tuy nhiên đồ miễn phí thì nó cũng có hạn.
th-cam.com/video/9iB9WFTX2NA/w-d-xo.html
Bạn hiups mình vs.capcut mình ko co 2 giọng đọc nam vs nữ.để đọc tiếng việt.mình xài win 10.có phải giống như bạn nói.lúc đầu clip.khi cài SE ko.mong bạn rep ạ.tk
Hay quá.
giao diện phần mềm mucj video ko có show dòng audio to text..., A chỉ giúp show ở đâu ạ
Mình cũng chưa gặp nên ko biết lỗi ở đâu. Bạn cài trên windows gì (7,10,11)... hay Mac. Hiện tại mình đang dùng trên win11 thì ko thấy lỗi như vậy. VÌ ko tái hiện được lỗi, nên chưa biết tại sao.
A ơi, cho e hỏi là phần mềm này có bỏ mỗi mp3 vào rồi xuất ra nền đen như black screen ko ạ?
Bạn muốn up lên youtube à? Bạn chỉ cần dùng ttrang tunestotube.com trang đó nó up thẳng mp3 lên youtube, thành file .mp4 với nền đen. Nếu cần .mp4 thì bạn down về nhé. Ngoài ra nếu bạn search up audio lên youtube thì còn nhiều trang nữa.
@@icttapilu E cảm ơn a đã phản hồi ạ! Nhưng hiện tại e làm subtitle theo dạng lyrics bài hát, nên muốn bỏ mp3 vào phần mềm rồi xuất file nền đen từ phần mềm subtitle edit thì có xuất được ko ạ?
Anh ơi cho em hỏi muốn tạo phụ đề từ chữ có sẵn trên màn hình mà ko phải từ âm thanh , sau đó mới vietsub thì làm thế nào ạ😢😢
Abyssreader
a ơi. cho e hỏi là phần mềm này e muốn phụ đề căn giữa video thì chỉnh ở đâu ạ a
Bấm phải vào phần chữ ở trong cửa sổ có timecode( ô cửa sổ ở phía trên bên trái). Sau đó chọn Alignment
@@icttapilu vậy cho e hỏi là muốn hiệu ứng chuyển cảnh như khi chữ xuất hiện và biến mất thì trong phần mềm này có ko ạ
Mấy cái đó dùng phần mềm dựng thôi bạn.
@@icttapilu vâng ạ, e cảm ơn nhiều ạ!
cho em hỏi mình muốn lấy "chatGPT" yêu cầu khóa API .vậy mình lấy ở đâu anh.
Whisper chính là một dự án của Open AI rồi bạn nhé. Nó được train bởi OPEN AI nhé. Bạn quan tâm đến API nếu bạn muốn ứng dụng cái này để phát triển sản phầm của riêng bạn. Đăng ký cho developer ở đây openai.com/product
thông tin thêm về dự án whisper
openai.com/research/whisper
muốn lấy api thì phải bỏ tiền ra rồi
Có cách nào chỉnh đừng cho nó đọc trùng nhau k a
Nó chính là tỉmecode đó bạn. Đuôi .SRT đó. Tất nhiên mình vẫn phải căn, chứ không cái nào 100% đâu.