I did OCR with GPT-4o and it was just plain awesome!
ฝัง
- เผยแพร่เมื่อ 2 ส.ค. 2024
- 00:00 Introduction and background
02:21 Tesseract OCR doesn't work for me
04:19 When using GPT-4o
MaSiRo Project GitHub: github.com/MaSiRoProjectOSS
MaSiRo Project is looking for new development members and assistance in development.
ーーー
For more information about MaSiRo Project
website: masiro.cafe/
Official channel: / @masiroproject
For support and goods sales, please visit
PIXIV FANBOX: masiro-project.fanbox.cc/
Booth: masiro-project.booth.pm/
ーーー
[BGM]
桜スキップ / MusMus
the opening of a book / DOVA-SYNDROME OFFICIAL
#ロボット #メイドロボ #MaSiRoプロジェクト #顔認識 #自律制御 #自己位置認識 #音声認識 #シミュレーション #robot #maidrobot #maidrobotic #robomaid #animemaid #animegao #kawaii #facerecognition #autonomous #control #autonomous_control #SLAM #voicerecognition #マイコン - วิทยาศาสตร์และเทคโนโลยี
ありがとうございます。ビデオから文字の入っている画像だけをキャプチャするのを、自動化しようと考えておられるようですが、私もそれをどうしようかと考えています。ビデオから画像に変換するサービスは、何秒ごととかに画像を抽出するので、同じものが複数出てしまったり、文字の入っていないものが入ったりしてしまいます。GPT-4oのプロンプトで、それらを省くことができるかもしれませんが。大変、失礼かもしれませんが、この自動化、どのようにしようと考えておられますか?
コメントありがとうございます。実はまだあまり考えられていません。
字幕のある時刻を抽出する作業をスクリプトで効率化するとか、部分的にでも作業を効率化できないかと考えています。
@@robot_tech_claude 私ももっと調べて、うまく自動化できるようにしたいので、これからもよろしくお願いします。
Will GPT-4o be used for MaSiRo and the others to communicate with people?
Not yet. We are considering about it.