小显卡玩转大模型，模型分层推理法

超越ChatGPT？AI大模型DeepSeek优缺点分析，DeepSeek对AI行业会有什么影响？｜GPT-4o｜Llama 3.1｜Claude

半块RTX4090 玩转70B大语言模型

เซอร์ไพรส์ซื้อรถคันใหม่ให้พี่หน่อง! ไม่ต้องทนขับรถเก่าอีกต่อไป ขับมาอวดจนพ่อหมั่นไส้

คริสต์มาสมรณะ | Who Are You EP.7 ( Edwin )

Live! ถ่ายทอดสดหวย ถ่ายทอดสดการออกรางวัลสลากกินแบ่งรัฐบาล งวดวันที่ 16 ธันวาคม 2567

如何知道一个大模型在推理和训练时需要多少显存？

AI开发者-就爱瞎鼓捣

มุมมอง 15 025

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 29 ม.ค. 2025
为您介绍一个大模型所需显存的计算工具。通过它，您就可以快速了解一个模型是否可以在自己的显卡上使用了。
#LLM #大模型 #accelerate #estimate-memory #GPU #显存 #Huggingface #transformers #gemma #mistral #qwen

ความคิดเห็น • 19

@techdiylife 10 หลายเดือนก่อน ⁺³
视频对应的文档（包含代码，以及详细的说明）：techdiylife.github.io/blog/topic.html?category2=t05&blogid=0031
@zingg7203 หลายเดือนก่อน
最准的还是用操作系统级别的库来监视资源调用情况
@背背背包客 6 หลายเดือนก่อน
请问本地安装和网页不同，则选择哪种呢
@tonysiu8562 22 วันที่ผ่านมา
great!!
@RiverDong 9 หลายเดือนก่อน
这个测试的是Batch size=1的情况？
@zcz1595 10 หลายเดือนก่อน ⁺¹
能请教一下M2芯片统一内存架构32GB的Mac book pro在本地部署LLM方面大概能相当于多少GB的独立显存吗？
@techdiylife 10 หลายเดือนก่อน ⁺¹
应该与Windows一样，内存作为共享显存。可以理解为32G 减去其他程序占用的内存
@zcz1595 10 หลายเดือนก่อน
@@techdiylife 谢谢回复，听up这么一说感觉好像我的mac又行了
@abner7502 9 หลายเดือนก่อน
@@techdiylife win下面，假如我电脑上的显卡就4GB显存，如果离线模型超过4GB大小，是不是我就不能用GPU来加速了，只能用CPU？
@clarinetlatoya 9 หลายเดือนก่อน
@@abner7502 爆显存了
@taurusduan9715 8 หลายเดือนก่อน
@@abner7502 可以，通常win10情况下可以使用3.8GB的显存+内存。只要你的内存够大，可以使用20gb的模型，超过这个体量可能会没有意义。
@inglam 5 หลายเดือนก่อน ⁺¹
请教一下，为什么一般训练需要的显存是推理的四倍呢？
@techdiylife 5 หลายเดือนก่อน ⁺¹
训练时除了参数还需要额外存储梯度，以及优化器的状态。
@long龙龙 6 หลายเดือนก่อน
你好，请问为什么int8和int4的Training using Adam 给的数据是N/A
@techdiylife 6 หลายเดือนก่อน
你要使用量化模型进行训练吗？量化模型训练需要一些特殊的处理。可以去网上找找参考代码。
@Yiwaterofficial 10 หลายเดือนก่อน ⁺¹
能否提供連係方式？
@techdiylife 10 หลายเดือนก่อน ⁺¹
感兴趣的话可以加入下面的微信交流群，两个群主题不一样：
AI共学会：LLM部署实战交流
techdiylife.github.io/blog/blog.html?category1=c05&blogid=0032
AI共学会：Transformers开发百问（最新建立）
techdiylife.github.io/blog/blog.html?category1=c05&blogid=0035
@Sawyer0823 9 หลายเดือนก่อน
想請問mistral large需要多少的記憶體大小? 4x H100 80GB?
@techdiylife 9 หลายเดือนก่อน ⁺¹
Mistral large不开源，参数量好像都没有公布，没法知道它到底需要多少资源。
开源模型，你可以使用这个工具大体来判断：huggingface.co/spaces/hf-accelerate/model-memory-usage
这里有我做到一些对比：
techdiylife.github.io/blog/blog.html?category1=c02&blogid=0031

ต่อไป

เล่นอัตโนมัติ

小显卡玩转大模型，模型分层推理法

小显卡玩转大模型，模型分层推理法

超越ChatGPT？AI大模型DeepSeek优缺点分析，DeepSeek对AI行业会有什么影响？｜GPT-4o｜Llama 3.1｜Claude

超越ChatGPT？AI大模型DeepSeek优缺点分析，DeepSeek对AI行业会有什么影响？｜GPT-4o｜Llama 3.1｜Claude

半块RTX4090 玩转70B大语言模型

半块RTX4090 玩转70B大语言模型

เซอร์ไพรส์ซื้อรถคันใหม่ให้พี่หน่อง! ไม่ต้องทนขับรถเก่าอีกต่อไป ขับมาอวดจนพ่อหมั่นไส้

เซอร์ไพรส์ซื้อรถคันใหม่ให้พี่หน่อง! ไม่ต้องทนขับรถเก่าอีกต่อไป ขับมาอวดจนพ่อหมั่นไส้

คริสต์มาสมรณะ | Who Are You EP.7 ( Edwin )

คริสต์มาสมรณะ | Who Are You EP.7 ( Edwin )

Live! ถ่ายทอดสดหวย ถ่ายทอดสดการออกรางวัลสลากกินแบ่งรัฐบาล งวดวันที่ 16 ธันวาคม 2567

Live! ถ่ายทอดสดหวย ถ่ายทอดสดการออกรางวัลสลากกินแบ่งรัฐบาล งวดวันที่ 16 ธันวาคม 2567

Uyurken Kendimi Kurtçukların Arasında Buldum🤯😬🪱

Uyurken Kendimi Kurtçukların Arasında Buldum🤯😬🪱

【人工智能】万字通俗讲解大语言模型内部运行原理 | LLM | 词向量 | Transformer | 注意力机制 | 前馈网络 | 反向传播 | 心智理论

【人工智能】万字通俗讲解大语言模型内部运行原理 | LLM | 词向量 | Transformer | 注意力机制 | 前馈网络 | 反向传播 | 心智理论

英伟达GB200 GPU如何做到“遥遥领先”？谈谈英伟达的Chiplet路径与“铜互联”前景

英伟达GB200 GPU如何做到“遥遥领先”？谈谈英伟达的Chiplet路径与“铜互联”前景

这是史上最快GPU！我们测了四张H100！价值120万元！

这是史上最快GPU！我们测了四张H100！价值120万元！

黄仁勋：“别再学编程，如果一切重来，我会学习。。。” 聊聊 AI 阴影下的程序员生存技能 | 回到Axton

黄仁勋：“别再学编程，如果一切重来，我会学习。。。” 聊聊 AI 阴影下的程序员生存技能 | 回到Axton

从编解码和词嵌入开始，一步一步理解Transformer，注意力机制(Attention)的本质是卷积神经网络(CNN)

从编解码和词嵌入开始，一步一步理解Transformer，注意力机制(Attention)的本质是卷积神经网络(CNN)

【AI时代浪潮下，80%孩子必须补齐的软实力：表达力！】

【AI时代浪潮下，80%孩子必须补齐的软实力：表达力！】

【2024年10月】記住！這些顯卡不能碰！Remember! These graphics cards cannot be touched!

【2024年10月】記住！這些顯卡不能碰！Remember! These graphics cards cannot be touched!

วาทะลูกหนังขอเสนอ"แมนเชสเตอร์ ซิตี้ VS แมนเชสเตอร์ ยูไนเต็ด หลังเกม เรือใบสีฟ้าแพ้ปีศาจแดงคาบ้าน"

วาทะลูกหนังขอเสนอ"แมนเชสเตอร์ ซิตี้ VS แมนเชสเตอร์ ยูไนเต็ด หลังเกม เรือใบสีฟ้าแพ้ปีศาจแดงคาบ้าน"

ช้างศึกโดนก่อน ไล่ยิงคืนสิงคโปร์ ทะลุน็อคเอาท์

ช้างศึกโดนก่อน ไล่ยิงคืนสิงคโปร์ ทะลุน็อคเอาท์

ศึกมวยไทยพันธมิตร 16/12/2024

ศึกมวยไทยพันธมิตร 16/12/2024

🔴LIVE โหนกระแส ศึกชิงมรดก 500 ล้าน ทายาทฟ้องเด็กรับใช้ปลอมลายเซ็น

🔴LIVE โหนกระแส ศึกชิงมรดก 500 ล้าน ทายาทฟ้องเด็กรับใช้ปลอมลายเซ็น

Highlight | อัจฉริยะสาวไส้...เบื้องลึกเหตุยิง "สจ.โต้งปราจีนบุรี" | เปิดโต๊ะข่าว | 17 ธ.ค.67

Highlight | อัจฉริยะสาวไส้...เบื้องลึกเหตุยิง "สจ.โต้งปราจีนบุรี" | เปิดโต๊ะข่าว | 17 ธ.ค.67

ตรวจหวยงวดวันที่ 16 ธันวาคม 2567 พร้อมรางวัล N3 รางวัลพิเศษ รางวัล 2 ตัว : Matichon Online

ตรวจหวยงวดวันที่ 16 ธันวาคม 2567 พร้อมรางวัล N3 รางวัลพิเศษ รางวัล 2 ตัว : Matichon Online

ผู้หญิงแต่งงานกับขอทาน แต่กลับถูกดูหมิ่น ในที่สุดชายขเทานก็เผยตัวตย#ละครหวานๆ#ชอบ

ผู้หญิงแต่งงานกับขอทาน แต่กลับถูกดูหมิ่น ในที่สุดชายขเทานก็เผยตัวตย#ละครหวานๆ#ชอบ

#WOWxดราม่าคอมเม้นแฟนบอลอาเซียน ตะลึง!! แห่ชื่นชมสปิริตทีมชาติไทย หลังเกมส์พลิกชนะสิงคโปร์ 4-2

#WOWxดราม่าคอมเม้นแฟนบอลอาเซียน ตะลึง!! แห่ชื่นชมสปิริตทีมชาติไทย หลังเกมส์พลิกชนะสิงคโปร์ 4-2