您是用這個github裡的方法嗎?github.com/MahmoudAshraf97/whisper-diarization 我在做pip install -r requirements.txt時會報錯 ERROR: Could not find a version that satisfies the requirement triton (from nemo-toolkit) (from versions: none) ERROR: No matching distribution found for triton 一直修不好,不知道您是不是跟我卡在同個地方QQ 或著您是用別的方法,我可以來試試看~
太實用了!真的是紀錄人員的福音啊
謝謝您~~
語音翻譯很精準,讚!
感謝支持!
下面是使用 **Whisper** 模型在本地机器上进行音频重构的详细说明: ###步骤 1: 首先安装依赖项,需要安装 Whisper 及其相关依赖项。 1. **安装 Python** 确保你的系统已经安装了 Python 3.7 或更高版本。您可以在命令行中输入以下命令检查 Python 版本: ```bash python --version ``` 2.
========================
是不是要安装了才能用
需要安裝python喔~
簡單一點的方法可以參考另一支標題為【whisper】的影片,直接下載軟體就可以使用了
@@DataCraftExplorers 感谢up主分享,我找到了一个新的方法,是在google colaboratory 应用程式中,安装whisper ffmepg。可以达到同样的功能。
好讚!謝謝分享💙
感謝您~~
@@DataCraftExplorers 不一定是製作影片哦,還有一種合作方式很適合您的,最多耗時3分鐘。請問可以給個郵箱詳談嗎?
很實用!
謝謝您~~
Up声音好好听😊
感謝教學 想請問 6:45那邊說的 使用更精確的版本 是怎麼使用的?不曉得從哪裡操作
在主畫面 (可以參考6:04 )左下角那邊有一個Quality 的選項,那邊可以選擇不同的精準度喔~
@@DataCraftExplorers 那就是不同模型嗎?就是直接使用更大的模型這樣嗎?需要升級成pro的
是的,免費版本最精準的模型是small,再上去就是要升級付費版了~
看您的使用需求,若不想升級付費版但又想使用更精準的模型,可以參考我另一隻whisper in python 的影片喔~
謝謝分享,請教如何在python設定分辯不同的人聲?我用python直接用whisper,但不知如何分辯人。
可以!我研究看看~
您是用這個github裡的方法嗎?github.com/MahmoudAshraf97/whisper-diarization
我在做pip install -r requirements.txt時會報錯 ERROR: Could not find a version that satisfies the requirement triton (from nemo-toolkit) (from versions: none)
ERROR: No matching distribution found for triton
一直修不好,不知道您是不是跟我卡在同個地方QQ
或著您是用別的方法,我可以來試試看~
謝謝妳
謝謝您的留言🎉
whisper transcription是否無法在Windows電腦系統中使用呢?
是的喔,在windows 可以下載WhisperDesktop這個軟體喔!
未來也會出一集影片跟大家介紹~
請問有Android(安卓版)的whisper嗎?
謝謝
可以參考我的頻道新發佈的【otterAI】那隻影片喔~
功能差不多,可以在安卓系統使用~
這個影片的字幕應該也是用 AI 生成,而且也沒有校稿,錯誤非常之多.
是的!謝謝您的支持,認真的看了影片跟字幕!最近會努力生出時間校稿的🥹
以訓練資料來看,Whisper目前還是翻譯英文比起其他語言更準確,加上受限於whisper transcription 軟體的限制,精準度還是有加強的空間。
目前在研究直接使用OpenAI 提供的開源程式碼翻譯,期望可以產生更精準的翻譯結果,如果成功的話會再做一集影片跟大家分享喔!
新影片出爐囉,可以更精準的辨識影片字幕,可以到資訊欄點連結觀看喔~
新影片網址:th-cam.com/video/23lS2NyZRCQ/w-d-xo.html
❤
你好,可以給個郵箱嗎?想進行付費合作,推廣剪輯軟體
謝謝您的支持!我最近時間原因,可能無法做出讓人滿意的影片,日後有機會期待與您合作~
仔細看了一下影片的時序 很多毫秒都是相同數值 還是常常不能精確斷時序出來
如果使用 Whisper Transcription 生成的 SRT 文件中存在毫秒级别相同的時序,這可能是因為 Whisper Transcription 在生成 SRT 文件時將時序進行了四捨五入,導致時序的精度丟失。要解決這個問題,你可以嘗試以下幾種方法:
1. 付費升級:Whisper Transcription PRO
2. 使用其他轉錄工具:Descript、Rev、Otter.ai、Happy Scribe
3. 轉換時序格式:以下是一個使用 Python 的簡單示例,將 SRT 文件中的時序格式從「小時:分鐘:秒, 毫秒」轉換為「小時:分鐘:秒, 毫秒, 微秒」的範例(此段程式碼是在後面加上0)
def convert_timestamp_format(input_file, output_file):
with open(input_file, 'r') as f:
lines = f.readlines()
with open(output_file, 'w') as f:
for line in lines:
if ' --> ' in line:
start, end = line.strip().split(' --> ')
start_hms, start_ms = start.split(',')
end_hms, end_ms = end.split(',')
start += '000' # 添加三個零以表示微秒
end += '000' # 添加三個零以表示微秒
new_line = f"{start} --> {end}
"
f.write(new_line)
else:
f.write(line)
input_file = 'input.srt'
output_file = 'output.srt'
convert_timestamp_format(input_file, output_file)
新影片出爐囉,可以更精準的辨識出毫秒數值,可以到資訊欄點連結觀看喔~
新影片網址:th-cam.com/video/23lS2NyZRCQ/w-d-xo.html
這必須在電腦版才能操作吧?
嗯嗯對喔~目前whisper transcription 這個軟體只適用Mac 系統
@@DataCraftExplorers 用iphone 手机可以吗?
@@Hervelee1011 whisper transcription這個軟體目前只適用Mac電腦。
以下有一些可以支援手機的替代方案,您可以自行選擇適合您的喔~
Dragon Anywhere:這是由Nuance Communications開發的專業語音轉文字應用程式,提供高準確率的轉錄功能。
Otter Voice Notes:Otter 是一個智能語音錄製和轉文字應用程式,它可以即時將錄音轉換為文字並進行分類。
Rev Voice Recorder:Rev 是一個專門用於錄製和轉換語音的應用程式,提供高品質的轉錄服務。
想請問,它變成簡體字,要怎麼變成繁體字
在5:47那個畫面左下角,上面的按鍵可以選擇語言喔!
能直接轉出中文繁體嗎?
新版程式碼有更新在GitHub 上面
新增以下這段可以翻譯成繁體中文:
prompt = '以下是普通話的句子' # 轉錄成繁體中文
但實測結果有的時候某幾句話還是會混淆到簡體中文🥲
可以翻译粤语嗎?
嗨嗨~目前whisper transcrtion沒有支援粵語功能。
您可以考慮使用Google Cloud Speech-to-Text、Microsoft Azure Speech Service或IBM Watson Speech to Text等語音轉文字工具,這些服務支援粵語。
如果內容是又中文又英文,或者其他語言,它輸出的字幕會不會不準確呢?
我的實際使用情況覺得蠻準的,大部分是正確的,只有偶爾會有小錯誤~
語無倫次,不知再說啥??????????
在再不分??????????不知在說啥