- 61
- 425 235
だるまと赤べこ【AI解説】
เข้าร่วมเมื่อ 5 ต.ค. 2022
AI関連の動画を投稿していきます。
ChatGPTゲーム制作シリーズを更新中。
Twitter: DarmaAkabeko
※このチャンネルはAmazonアソシエイト・プログラムに参加しています
ChatGPTゲーム制作シリーズを更新中。
Twitter: DarmaAkabeko
※このチャンネルはAmazonアソシエイト・プログラムに参加しています
Claudeの新機能「Computer Use」でゲームを自動操作させる
"当社の最新のゲーミングAI PCはxxxTOPSを誇り・・・なんとゲームをする時間を完全に削減可能です!!"みたいな未来も近いのかもしれません。
BGM:
・かずち - 青空空港
・茶葉のぎか - Soda_Soda
・しゃろう - superstar
・しゃろう - 303PM
・さんうさぎ - え!?やば、、、、
VOICEVOX: ずんだもん
X(Twitter): DarmaAkabeko
だるまと赤べこのサイト: www.darmabeko.com/
BGM:
・かずち - 青空空港
・茶葉のぎか - Soda_Soda
・しゃろう - superstar
・しゃろう - 303PM
・さんうさぎ - え!?やば、、、、
VOICEVOX: ずんだもん
X(Twitter): DarmaAkabeko
だるまと赤べこのサイト: www.darmabeko.com/
มุมมอง: 2 660
วีดีโอ
低スペックPCでもローカルで動かせるChatGPT風アプリを作ったよ
มุมมอง 2.7Kหลายเดือนก่อน
そんなアプリを作りました。 ※非ずんだもん注意 重要な追記: 初回起動時はモデルをダウンロードするためめっちゃ時間がかかります 使用するAI: ・Gemma2:2B ・Stable Diffusion 1.5 ・nanoLLaVA 作ったアプリのリンク: drive.google.com/file/d/1FbqxdSzYCPx8g1LNdFFtkg6jM_jlrrQy/view BGM: ・かずち - 青空空港 X(Twitter): DarmaAkabeko だるまと赤べこのサイト: www.darmabeko.com/
ChatGPTに追加された最新モデル「o1」がAGIの第一歩だった
มุมมอง 8Kหลายเดือนก่อน
よりによってこのタイミング・・・ 使用するAI: ・o1 Preview BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・しゃろう - 303PM ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko だるまと赤べこのサイト: www.darmabeko.com/
シンプル詐欺な自称最強LLM「Reflection 70B」の手口と真相
มุมมอง 3.2Kหลายเดือนก่อน
騙された・・・ 使用するAI: ・Reflection 70B(???) BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・しゃろう - 303PM ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko だるまと赤べこのサイト: www.darmabeko.com/
GPT-4oの新機能「Structured Output」が革命的すぎる(再投稿)
มุมมอง 8Kหลายเดือนก่อน
壊れた動画をアップロードしてしまったので再投稿・・・ Structured OutputとRPGの動画です。 使用するAI: ・GPT-4o ・Stable Diffusion 1.5 BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・しゃろう - 303PM ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko だるまと赤べこのサイト: www.darmabeko.com/
最高レベルの画像生成AI「Flux.1」がオープンソースで公開
มุมมอง 7K2 หลายเดือนก่อน
Black Forest Labsが公開した新たな画像生成AI「Flux.1」に触れてみます。 使用するAI: ・Flux.1[Dev] ・Flux.1[Schnell] ・Stable Diffusion 1.5 ・DALLE: 3 BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・しゃろう - 303PM ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko だるまと赤べこのサイト: www.darmabeko.com/
Copilot+ PCって何?AI PCの誇大広告と正しい選び方を解説
มุมมอง 2.3K2 หลายเดือนก่อน
Microsoftが作ったPCの新規格「Copilot PC」について疑問を述べます。 動画で触れた記事: www.darmabeko.com/articles/PC要件まとめ BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko
GPT-4o超えのオープンモデル「llama 3.1」を解説&ローカルで使ってみた
มุมมอง 6K3 หลายเดือนก่อน
Metaの新たなLLM「llama 3.1」シリーズについて解説します。 使用するAI: ・llama 3.1 405b ・llama 3.1 70b BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko だるまと赤べこのサイト: www.darmabeko.com/
異次元の高効率モデル「GPT-4o mini」の登場と3.5 Turboは永遠の別れ
มุมมอง 5K3 หลายเดือนก่อน
OpenAIが新たに発表した軽量言語モデル「GPT-4o mini」について解説します。 使用するAI: ・GPT-4o mini ・GPT-4o だるまと赤べこのサイト: www.darmabeko.com/ BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko
人間らしく自然に会話できる音声チャットAIを作る
มุมมอง 6K3 หลายเดือนก่อน
GPT-4oの新Voice Modeが中々公開されないので自宅で再現を試みます。 前回: th-cam.com/video/cd7rFszHD8E/w-d-xo.html 使用するAI: ・GPT-4o(OpenAI API) ・Speech-to-Text(Google Cloud) ・Gemini Flash(Gemini API) ・Gemma 2 8b ・Style-Bert-VITS2 だるまと赤べこのサイト: www.darmabeko.com/ BGM: ・かずち - 青空空港 ・茶葉のぎか - Soda_Soda ・しゃろう - superstar ・しゃろう - 303PM ・さんうさぎ - え!?やば、、、、 VOICEVOX: ずんだもん X(Twitter): DarmaAkabeko
Anthropicから早くもGPT-4o超え?「Claude 3.5 Sonnet」が発表
มุมมอง 5K4 หลายเดือนก่อน
Anthropicから早くもGPT-4o超え?「Claude 3.5 Sonnet」が発表
無料で誰でも使える動画生成AI「Dream Machine」がSoraのレベルだった
มุมมอง 11K4 หลายเดือนก่อน
無料で誰でも使える動画生成AI「Dream Machine」がSoraのレベルだった
Appleの最新AI「Apple Intelligence」が誤解されてるので解説
มุมมอง 8K4 หลายเดือนก่อน
Appleの最新AI「Apple Intelligence」が誤解されてるので解説
「未経験からのChatGPT×Pythonプログラミング」講座を発売しました
มุมมอง 3.6K5 หลายเดือนก่อน
「未経験からのChatGPT×Pythonプログラミング」講座を発売しました
Googleの最新発表からGeminiの進化やAI検索エンジンなど全部解説【Google I/O】
มุมมอง 5K5 หลายเดือนก่อน
Googleの最新発表からGeminiの進化やAI検索エンジンなど全部解説【Google I/O】
OpenAIの最新発表からGPT-4oや無料版をまとめて解説【Spring Update】
มุมมอง 11K5 หลายเดือนก่อน
OpenAIの最新発表からGPT-4oや無料版をまとめて解説【Spring Update】
未経験からのChatGPT×Pythonプログラミング#1 環境構築と遊んでみる
มุมมอง 9K6 หลายเดือนก่อน
未経験からのChatGPT×Pythonプログラミング#1 環境構築と遊んでみる
あなたがAGIだ
デブの方が優れてる…
手持ちのゲームやらせて似たようなもの作れが実現しそう
3歳児レベル、5年後には使えそう
"こんにちは、あなたのビデオ作品に大変魅力を感じています。もしご興味があれば、製品プロモーションのコラボレーションにご興味を持っていただけないでしょうか? "
ソシャゲの周回やらせたいよね~
実用には遠いとはいえこれはすごい機能ですね…! 反応しないところを連打するのすごい人間っぽくて笑っちゃった
え、何だこの性癖に刺さるポンコツロボット感…!
実用性が上がれば、AIの社会への実影響が跳ねそうですね。 良くも悪くも動物チックで、犬猫的な可愛さを感じます。
現在地解説ありがとうございます。これと会話しながらPC?操作するイメージは沸きますね。Appleもこの方向に行くんじゃないかなぁ。OS持ってるし。
うーん、3.5 Opus出さずに一般ユーザーからすると有用性が低いエージェント機能出してきたってことはLLMの開発上手く行ってないのかな? 予定表から3.5 Opus消えたし 今回の発表はClaude2.1からずっと使い続けてる古参ユーザーにとっては失望の方が大きかったです
文字とか背景、左右の二人のサイズ感とか色々主にはセンスを感じる
チェリーピッキングを加味しても、AIが自律的に情報処理して判断しているのはすごいなーと思いました。
最先端なのに昔のコマンド式RPGみたいな事やってんのは面白い
精度の問題が解決しても結局コストの問題は残るし総合的に実用性は微妙だと思うんですがどうなんでしょうか?
自動操作は、期待しかない。 HPの画面レイアウトがかわったり、レイアウトが変わるたびに自動操作プログラムを更新するのは手間が大変。 そもそもの、そのHPに変化があったことに気づかないことが多い。
凄く将来が期待できる機能。 単純な画像認識ではなく、Windows OS標準のシステムAPIで画面上の要素を取得して認識・操作できれば、もう少し低コストで使い物になりそう...?
早っ!もうずんだで動画作ったんですか。すごい!
いよいよキーボードとマウスが要らなくなるか。 ネトゲの相手もAIになりそうね。
っ☕動画投稿お疲れ様です!いつもながら、大変参考になりました。ありがとうございます。
Aボタン連打でぁあああ!! ってしまうのはある意味人間っぽい笑
ドジっ子AIくんかわいいね でも多分あと2年もすれば実用に耐えるレベルの能力を獲得するだろうな ChatGPTも高度な音声会話やo1の推論とか色々頑張ってるし未来が楽しみでしょうがない
お待ちしてました。 配信ありがとうございます。 とにかく スゴいの ひとことです。
こいつはやべえ
基本オフライン完結ゲームで必要な時にオンラインデータ(システム)を使うよ。ってことだったような。 でもさ・・・関係ないけどAIって言葉自体が無知なマスコミのせいもあるけど一人歩きしてるよね・・・ 何十年も前からあるただの単純な条件プログラム(システム)をAIシステム!ってドヤ顔で言うやつが多すぎる・・・特に子供・・・
このチャンネルすき
ありがとうございます😭
価格はどんどん下がっていくので、企業の目線だと性能がよければ導入検討対象になると思います。人件費は上がり続けるので
確かに、今後を見ると価格の問題は無くなっていきそうです...
無事にAPI使えるようになりましたね しかし1分程度試しただけで40〜50円はかなり厳しい… リアルタイムAPIの公式ページによれば今後4o miniにも対応するみたいなんでそこでどれだけ安くなるかに期待ですね
4o-miniへの対応に期待ですね! テキストと同じくらいの価格差をつけてくれれば最高です!
speech to textはPixelがすごいなと思います。エッジデバイスのモデルを上げるのはこのチャンネルに属してないかもですがスマホレベルで日本語のあの読み取り性能はすごいなと感じてます。
Pixelですか!Gemini Nanoってやつでしょうか?実は気になってはいましたが...すごいんですね。 手元にあれば...
早くAPI使ってみたいですけど、値段がかなりネックですよね いずれデモのような画像や映像のリアルタイム処理に対応したらさらに高くなりそう…
映像までいくと、ホストやキャバクラで話すくらいの覚悟になりそうですね笑
開始 0:58
お腹から声出てないボソボソ音はキツイ。
これなら字幕のがいいよな
精進してまいります・・・
素晴らしい!
ですよねえ...
ImageFXは特に触れる予定ないですか?
機を逃したという感じで...
めちゃくちゃ笑いました。少しベクトルが違いますがコロナ時にオンライン飲み会が流行っていて、その時と同じ問題が起こっているように感じました。つまり音声ソースが複数ある時に人間みたいにマルチに処理するのが大変そうという
Whisperも話者判定が出来ないので、その弱点を引き継いでますね...ある意味想定シーンを絞ったんでしょうか?
他の方のコメントでもありますがデバイス2台設置したら無限対話いけたりしますか…?今度試そうかな
面白そうですねそれ笑笑 やってみたい!
ずんだもんの開発元は音声モデルを売り込めばいいと思う。 ずんだもんとか、ゆっくり、きりたんとかと話せるようにしてほしいな。 まあ、公式になくても、キャラの音声に変換する高性能なボイスチェンジャーもあるし、それを一枚かませれば、ずんだもん化するんのかもしれんが、公式が対応してくれるのが楽でいいと思う。
確かに、ずんだもんの人気ってもはやすごいですしね!
うーんまだ自分が求めているものと違う
特に日本語だと足りない部分も目立ちますね。
メモリに好きな声の雰囲気とかを覚えさせると、声のカスタマイズっぽいことができました。結構良かったです。
CIとメモリにロールプレイの設定を入れたらいけました。特定のキャラクターのロールプレイが無理と言っていたのは、声優さんとかの声を勝手に再現するのを規制するためでしょうか。
なるほど、そんなテクニックが笑笑 面白いです。試してみます!ありがとうございます
今更ながら購入しました✨ 頑張って色んなアプリやゲーム作りたいと思います💪
ありがとうございます!今見つけて買ってもらえるなんて感激です
音声というか、話し方というか、マインドが積極的すぎるのをなんとかしたいなぁ。「しゃべれよ!」って三村が突っ込むくらいのでもいい。ずっと聞いていて、「どう?」っていうと話し始めるとか。
確かに、音を認識する→100%返事っていうのはちょっと不便ですよね。 それくらいの方がいい!
2台あったら会話させられんかな
やりたくなりますね笑
すごすぎる‼️
ですね!!本当に