I did OCR with GPT-4o and it was just plain awesome!

แชร์
ฝัง
  • เผยแพร่เมื่อ 2 ส.ค. 2024
  • 00:00 Introduction and background
    02:21 Tesseract OCR doesn't work for me
    04:19 When using GPT-4o
    MaSiRo Project GitHub: github.com/MaSiRoProjectOSS
    MaSiRo Project is looking for new development members and assistance in development.
    ーーー
    For more information about MaSiRo Project
    website: masiro.cafe/
    Official channel: / @masiroproject
    For support and goods sales, please visit
    PIXIV FANBOX: masiro-project.fanbox.cc/
    Booth: masiro-project.booth.pm/
    ーーー
    [BGM]
    桜スキップ / MusMus
    the opening of a book / DOVA-SYNDROME OFFICIAL
    #ロボット #メイドロボ #MaSiRoプロジェクト #顔認識 #自律制御 #自己位置認識 #音声認識 #シミュレーション #robot #maidrobot #maidrobotic #robomaid #animemaid #animegao #kawaii #facerecognition #autonomous #control #autonomous_control #SLAM #voicerecognition #マイコン
  • วิทยาศาสตร์และเทคโนโลยี

ความคิดเห็น • 5

  • @kazuo226
    @kazuo226 2 หลายเดือนก่อน

    ありがとうございます。ビデオから文字の入っている画像だけをキャプチャするのを、自動化しようと考えておられるようですが、私もそれをどうしようかと考えています。ビデオから画像に変換するサービスは、何秒ごととかに画像を抽出するので、同じものが複数出てしまったり、文字の入っていないものが入ったりしてしまいます。GPT-4oのプロンプトで、それらを省くことができるかもしれませんが。大変、失礼かもしれませんが、この自動化、どのようにしようと考えておられますか?

    • @robot_tech_claude
      @robot_tech_claude  2 หลายเดือนก่อน +2

      コメントありがとうございます。実はまだあまり考えられていません。
      字幕のある時刻を抽出する作業をスクリプトで効率化するとか、部分的にでも作業を効率化できないかと考えています。

    • @kazuo226
      @kazuo226 2 หลายเดือนก่อน

      @@robot_tech_claude 私ももっと調べて、うまく自動化できるようにしたいので、これからもよろしくお願いします。

  • @yoyomii__6367
    @yoyomii__6367 2 หลายเดือนก่อน

    Will GPT-4o be used for MaSiRo and the others to communicate with people?

    • @robot_tech_claude
      @robot_tech_claude  2 หลายเดือนก่อน +1

      Not yet. We are considering about it.