【生成式AI】ChatGPT 可以自我反省!

【AI编年史】ChatGPT诞生后的700多天，世界发生了什么?

700天只用「多鄰國」APP學習語言，百萬網紅飛往當地實測打臉網友負評! | 青茶說

🔴LIVE สด! PGC 2024 ศึกชิงแชมป์โลกพับจี Circuit 3 วันที่ 2

🔴𝐋𝐈𝐕𝐄 การแข่งขัน RoV นานาชาติ AIC 2024 รอบ Swiss Stage วันที่ 9

Highlight : นายใหญ่ฉุนใคร?

【生成式AI】窮人如何低資源復刻自己的 ChatGPT

Hung-yi Lee

มุมมอง 99 314

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 18 ม.ค. 2025
วิทยาศาสตร์และเทคโนโลยี

ความคิดเห็น • 79

@HungyiLeeNTU ปีที่แล้ว ⁺⁵⁷
可以拿來訓練自己的 ChatGPT 的資料集 (由台灣大學學生 Eric Lam 整理)
github.com/voidful/awesome-chatgpt-dataset/
@PenutChen ปีที่แล้ว ⁺³
這個應該置頂一下
@l501l501l ปีที่แล้ว
伸手牌問一下，如果自己訓練ChatGPT，用Pytorch train完model，最後的model也會是一個Pickle檔(.pt) 嗎?
然後要使用model的時候(inference)，也是initiate後load model，才能開始使用嗎?
我在想如果考量到所有model相關的成本，"小資族"在cloud service開始使用model，除了training的費用，可能還要考慮host這個model的成本(e.g AWS: S3 storage cost, EC2 computation cost).
又或著6~13B size的model，在16GB的ram 可以直接載入，在本地端使用?(抱歉我只使用過BERT，所以希望有人可以提供經驗討論一下，謝謝
@耘子 9 หลายเดือนก่อน ⁺¹
謝謝Eric拯救比較窮的人
@morningstarkalis 8 หลายเดือนก่อน ⁺¹
你有沒有興趣加入一個即將提交"發明專利申請書"的核心團隊? 我需要你的專業我也會提供你的費用我相信你看過我的發明專利申請書後你會有極大的興趣
@carloshsueh9195 ปีที่แล้ว ⁺⁶¹
好像沒開打賞功能，不然我真的都想交學費了。感謝老師的整理跟提供insight，這幾篇文章要我自己讀完跟整理最快最快也要兩三天，老師跟團隊讓我們不到半小時就學完了，請收下我的膝蓋 orz
@willy7703 ปีที่แล้ว ⁺⁴
您兩三天就可以整理完我覺得也是快啦XD
@郭子-e7w ปีที่แล้ว
希望老師可以出完整的線上課程！
@hchsu4765 ปีที่แล้ว ⁺⁹³
謝謝老師拯救比較沒有錢的窮人
@hyy3657 ปีที่แล้ว ⁺⁶
老黃：我知道你還有錢買我的顯卡
@yonhlai ปีที่แล้ว ⁺³
难道还有比较有钱的穷人😂
@uartim ปีที่แล้ว
比較窮的有錢人
@xaviertsai4063 ปีที่แล้ว ⁺⁷
上課啦~ 我覺得老師上的課很適合拿來當通識課。淺顯易懂。
@蓝狐 ปีที่แล้ว ⁺¹⁵
老师太贴心了，买不起 A100 的穷人很感动
@mibo._. ปีที่แล้ว ⁺²¹
17:10 Vicuna 看起來表現好的原因會不會只是因為，這個評分標準偏向 Vicuna 當時訓練的 metric，都是使用 GPT-4 來衡量
@HungyiLeeNTU ปีที่แล้ว ⁺¹⁸
我覺得你說的蠻有道理的，如果當初 Vicuna 訓練的過程中有用 GPT-4 的衡量結果來選擇模型訓練的 hyperparameters，那使用GPT-4 衡量模型會對 Vicuna 有利
@PenutChen ปีที่แล้ว
投影片上秀的 Vicuna 參數量是 13B，但 LLaMA-GPT4 的參數量是 7B，這應該也有影響
@heeheehaha45 ปีที่แล้ว ⁺¹
李老師好，
有兩個想討論的話題：
1. 語言模型可以用自己生成的答案，變為訓練的數據嗎？如果可以，只要放著他們不管，他們自己也會越變越聰明啊
2. 如果有人把自己的模型放在區塊鏈的智能合約上，對比OPENAI的模型的輸出作訓練，這算不算在法律上抵觸了OPENAI的term of use? 如是，誰要負上責任？區塊鏈上都是無明的。。。
謝謝！
@simonliao5020 ปีที่แล้ว ⁺¹
第一次看到字幕。👍👍👍👍👍
@nameno7725 ปีที่แล้ว ⁺³
13:30 self-train 成本
@pang-jungliu3663 ปีที่แล้ว ⁺¹⁷
說是窮人但仍然是有錢的窮人….
@nking99t 10 หลายเดือนก่อน
我感觉最麻烦的是整理数据的部分？假设弄个MedLLM，怎么整理医疗数据。需要很多domain knowledges
@BoChengSu ปีที่แล้ว ⁺¹
話說如果有一點點小錢的話可以去Azure tune一下自己的GPT模型哦🤩
@run963741 ปีที่แล้ว ⁺³
最後再把所有 LLM 做 ensemble，LLM 練蠱比賽開始
@chenlin7535 ปีที่แล้ว ⁺¹
🥳李老师什么时候讲讲LLM的评估？感觉太多的营销号鼓吹轻量模型什么什么能和ChatGPT抗衡，但是有没有系统的评估数据
@nvsrf ปีที่แล้ว ⁺¹
现在已经可以 disable chat history, allowing you to choose which conversations can be used to train chatGPT models.
@corezhang9353 ปีที่แล้ว
请教一下，这个有没有完整的教程
@chaower6958 ปีที่แล้ว ⁺¹
please help. 請問Dolly 2.0 是NAR還是AR model??? ???
我看pythia 是拿GPTNeoX來training的感覺是AR model。問cha它老兄跟我說Dolly2.0是NAR。還是Dolly 2.0是hybrid的?
@chaower6958 ปีที่แล้ว
補充一下: 我是想應用NAR 的model像是BART。如果Dolly 2.0 在NAR的領域內表現優可以取代BART，也算是解惑大半了。感謝好心人士的回覆。
@帮涨油管粉丝 ปีที่แล้ว
很喜欢你拍的视频
@j1992624 ปีที่แล้ว ⁺⁵
建議換一個麥克風，或是上個cc字幕，感謝
@Weiweii1120 ปีที่แล้ว ⁺³
算是符合主題
@bbcc2960 6 หลายเดือนก่อน
awesome 7:40
@小輔-y3l ปีที่แล้ว ⁺²
看完以後才知道羊駝有那麼多英文單字...
@star95 ปีที่แล้ว ⁺⁴
老師請教那個ChatGPT復刻下來的模型有多大？好奇要多大硬碟存儲。另外一個問題，知識庫的內容部分都已經存在模型裡了嗎？復刻下來的模型可以斷開Internet 在內網裡正常工作嗎？
@aliendog5134 ปีที่แล้ว ⁺¹
1.刻下來的模型多大要看你用什麼pre train model 2.不太懂你這問題是什麼意思 3.模型載下來基本上就是在你的電腦了你要部屬到哪裡都可以
@蒂蒂-f7o ปีที่แล้ว ⁺⁴
許願成功了~謝謝老師~~~🥳🥳🥳
@柯議翔-d5g ปีที่แล้ว
最後說的那東西不會有 overfitting 的問題嗎
@thisismuffinmuffin ปีที่แล้ว
可是在使用chatgpt當老師的時候不是還是會有資料外洩的問題嗎？
@yuyi9978 ปีที่แล้ว
請問老師如果想參加這些專案需要什麼技能呢？因為本身沒有學過這方面
@bryanshen4930 ปีที่แล้ว
生產製造機器設備可以數位雙生!那有領域專業的專家是否也可以有一個數位副本?
@monkeylu3893 ปีที่แล้ว
是不是有点像Meta Learning
@yi-erliao468 ปีที่แล้ว
訓練完如果沒在訓練，要那麼大的算力嗎？
@Jack-sk9hy ปีที่แล้ว
牛哇牛哇😂 我正在想这个问题！
@fishyang2453 ปีที่แล้ว ⁺¹⁷
比較有錢的窮人🤣
@ansonchang4196 ปีที่แล้ว
謝謝老師
@rayk5097 ปีที่แล้ว ⁺¹¹
老師都不用休息嗎？😂
@hhkk2742 ปีที่แล้ว
大赞🎉❤ 13:30
@zhzhang9660 ปีที่แล้ว
老师能分享PPT吗
@majaja7368 ปีที่แล้ว
為什麼不跟chat gpt 一樣用網路上的文章訓練，而是要透過chat gpt呢?
@aliendog5134 ปีที่แล้ว ⁺⁵
因為chatgpt的資料量非常大想要自己造一個基本上不太可能所以就透過知識蒸餾的方式來達到復刻的目的
@llrabel ปีที่แล้ว ⁺¹
真是太有趣了！
@德寜生活 4 หลายเดือนก่อน
I Love you❤
@zhongzhongclock ปีที่แล้ว ⁺²
标题改一下：如何通过大只的“草泥马”生成一头小只的“草泥马”，这样可以吸引更多的观众
@drnmss3860 ปีที่แล้ว ⁺¹
这吸引的不是精准用户……
@shenseanchen ปีที่แล้ว
感谢Lee老师! 受教
@dandelionsdontfly6422 ปีที่แล้ว
出个手把手的教程吧😭
@haoli6628 ปีที่แล้ว
就像是Sheldon😂
@hsiaosai1120 ปีที่แล้ว
簽到
@the_fluffychan ปีที่แล้ว ⁺¹
「比較有錢的窮人」 😭
@飛鴻-q1c ปีที่แล้ว
哈哈哈哈哈，总不能自己造电脑 gpu就是了
@hsuchechun9113 ปีที่แล้ว
還是不夠有錢😢
@s.alikecool8728 ปีที่แล้ว
他們是比較有錢的窮人 14:25
@葉某人-n3q ปีที่แล้ว
窮人==無法購買數萬組GPU的人
@chenwilliam5176 ปีที่แล้ว
我是窮人，沒錢
購買 ChatGPT
服務 😢
還是使用 Goggle
😅
熟練後，還是可以
「快速根據自己的意思」
生成報告&論文😃
----------------
而且 OpenAI
CEO 已經要我們
忘記 ChatGPT-5
😢😢😢😢😢
@Dream-xr7ls ปีที่แล้ว
現在有 4 pro 了，想必4 pro pro 指日可待
@mcluke8092 ปีที่แล้ว
LLM重新定义穷人
@曾生-c8w 8 หลายเดือนก่อน
是不是我太弱智了，我完全聽不懂😂
@kouenshi7926 ปีที่แล้ว
不能換好一點的錄音設備嗎....??????這品質聽3秒就想關掉?????????
@godmaxspeedpot1502 ปีที่แล้ว ⁺²
免費的還嫌
@yray ปีที่แล้ว
墙国能复刻么😂
@incendioraven4269 ปีที่แล้ว
比较有钱的穷人哈哈哈哈
@TankNSSpank ปีที่แล้ว
666
@迎月柳 ปีที่แล้ว ⁺¹
你懂個屁啊
@四文魚-s3m ปีที่แล้ว
讓別人幫你跑不好ㄇ GPT共用PLUS才75台幣阿..我不是窮人是乞丐
@35教官 ปีที่แล้ว ⁺²
開頭不是有說，沒看？
@tl7955 ปีที่แล้ว ⁺⁸
看不懂可以不用留言😌
@Nick167507 ปีที่แล้ว ⁺¹
在說你是窮人/乞丐之前，邏輯先修好吧
@KenHsiehTW ปีที่แล้ว
謝謝老師

ต่อไป

เล่นอัตโนมัติ

【生成式AI】ChatGPT 可以自我反省!

【生成式AI】ChatGPT 可以自我反省!

【AI编年史】ChatGPT诞生后的700多天，世界发生了什么?

【AI编年史】ChatGPT诞生后的700多天，世界发生了什么?

700天只用「多鄰國」APP學習語言，百萬網紅飛往當地實測打臉網友負評! | 青茶說

700天只用「多鄰國」APP學習語言，百萬網紅飛往當地實測打臉網友負評! | 青茶說

🔴LIVE สด! PGC 2024 ศึกชิงแชมป์โลกพับจี Circuit 3 วันที่ 2

🔴LIVE สด! PGC 2024 ศึกชิงแชมป์โลกพับจี Circuit 3 วันที่ 2

🔴𝐋𝐈𝐕𝐄 การแข่งขัน RoV นานาชาติ AIC 2024 รอบ Swiss Stage วันที่ 9

🔴𝐋𝐈𝐕𝐄 การแข่งขัน RoV นานาชาติ AIC 2024 รอบ Swiss Stage วันที่ 9

Highlight : นายใหญ่ฉุนใคร?

Highlight : นายใหญ่ฉุนใคร?

เนื้อเรื่องที่ท่านจะโมโหจนน้ำตาไหล | Mouthwashing

เนื้อเรื่องที่ท่านจะโมโหจนน้ำตาไหล | Mouthwashing

离谱！完全不懂编程，我竟然4小时靠AI复刻出月入$600k的APP的同款，方法居然这么简单?（无代码开发）

离谱！完全不懂编程，我竟然4小时靠AI复刻出月入$600k的APP的同款，方法居然这么简单?（无代码开发）

Transformers (how LLMs work) explained visually | DL5

Transformers (how LLMs work) explained visually | DL5

马斯克等大佬是怎么记住这么多知识的？【考试脑科学】

马斯克等大佬是怎么记住这么多知识的？【考试脑科学】

【生成式AI 2023】讓 AI 做計劃然後自己運行自己

【生成式AI 2023】讓 AI 做計劃然後自己運行自己

ChatGPT最全教程！15种使用技巧，彻底掌握GPT-4&4o，循序渐进小白也能快速上手！！！

ChatGPT最全教程！15种使用技巧，彻底掌握GPT-4&4o，循序渐进小白也能快速上手！！！

马斯克 Starlink 星链计划全面解析，它是重大创新还是人类威胁？回到Axton

马斯克 Starlink 星链计划全面解析，它是重大创新还是人类威胁？回到Axton

【人工智能】Yuval Noah Harari 哈拉瑞 - AI 如何毁滅人類，目前為止最清晰的解釋 |《人類大歷史》作者 | 早晚會思考的問題

【人工智能】Yuval Noah Harari 哈拉瑞 - AI 如何毁滅人類，目前為止最清晰的解釋 |《人類大歷史》作者 | 早晚會思考的問題

超越ChatGPT？AI大模型DeepSeek优缺点分析，DeepSeek对AI行业会有什么影响？｜GPT-4o｜Llama 3.1｜Claude

超越ChatGPT？AI大模型DeepSeek优缺点分析，DeepSeek对AI行业会有什么影响？｜GPT-4o｜Llama 3.1｜Claude

Subtitle✔️ Sora AI: Master Video Generation Before It's Too Late | Complete Tutorial + Future Impact

Subtitle✔️ Sora AI: Master Video Generation Before It's Too Late | Complete Tutorial + Future Impact

This Device is SO AMAZING❗️Which Could Allow You to See the Shape of Airflow❗️

This Device is SO AMAZING❗️Which Could Allow You to See the Shape of Airflow❗️

iPhone vs Nokia ☠️ #trollface #edit #troll

iPhone vs Nokia ☠️ #trollface #edit #troll

เปรียบเทียบ DENZA D9 vs ZEEKR009 ตัวไหนคุ้มกว่า? คำตอบจากคนซื้อเเละใช้งานจริง!!

เปรียบเทียบ DENZA D9 vs ZEEKR009 ตัวไหนคุ้มกว่า? คำตอบจากคนซื้อเเละใช้งานจริง!!

เกือบไปแล้ว ? #macupstudio #ซ่อมไอแพด #ซ่อมแมคบุ๊ค #ซ่อมไอแมค #ซ่อมiPhone #ซ่อมiPad #ซ่อมMac

เกือบไปแล้ว ? #macupstudio #ซ่อมไอแพด #ซ่อมแมคบุ๊ค #ซ่อมไอแมค #ซ่อมiPhone #ซ่อมiPad #ซ่อมMac

3wings Propeller Connect & Speed Test On Drone Motor #shorts #dronemotor

3wings Propeller Connect & Speed Test On Drone Motor #shorts #dronemotor

พัดลมไม่มีแรง ต้องใช้มือช่วยหมุน แก้ง่ายนิดเดียว #ฝ้ายการช่าง #ซ่อมพัดลม

พัดลมไม่มีแรง ต้องใช้มือช่วยหมุน แก้ง่ายนิดเดียว #ฝ้ายการช่าง #ซ่อมพัดลม

ทำไมกลุ่มว้าแดงนิยม mi17 จากจีน

ทำไมกลุ่มว้าแดงนิยม mi17 จากจีน

ถ้าหัวชาร์จมีความรู้สึก #คีย์บอร์ด #themongkeebmer #themongreview

ถ้าหัวชาร์จมีความรู้สึก #คีย์บอร์ด #themongkeebmer #themongreview