llama3 01 模型简介

NewSQL大神黄东旭：从0到1，如何设计一个分布式数据库

Windows下中文微调Llama3，单卡8G显存只需5分钟，模型可接入GPT4All、Ollama，实现CPU推理聊天，附Colab一键训练脚本。

#มาใหม่สดๆ#503 ถูกตรงๆ#แม่วรรณให้มาแล้วหลักหน่วยตัวเดียวงวด 16/7/67

Khóa ly biệt

ทักษะฟุตบอลที่ดีที่สุด 2023/24

llama3 02 环境配置模型下载基于vLLM进行模型推理

TGLTommy

มุมมอง 673

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 2 ก.ค. 2024
在这节课中，我们将深入探讨如何配置和部署Llama3模型，以确保能够顺利地开始你的AI项目。首先，我将一步一步带你完成环境的设置，并向你演示从官方网站及Hugging Face库下载Llama3模型的两种方法。其次，我将详细介绍如何使用Transformers库和vLLM框架来部署和进行模型推理。通过实际示例和详细步骤，你将学习如何有效地利用这些工具，以确保模型能够最大限度地发挥其性能。
大模型LLM系列课程相关资料，请在以下GitHub页面自助获取：
github.com/Tommy-s-Online-Cou...
本节课程内容包含：
00:00:00 llama3模型-官网下载
00:04:08 llama3模型-Hugging Face下载
00:05:46 llama实战环境配置
00:06:36 验证llama3模型下载是否正确
00:08:07 llama3模型推理-GPU版本
00:09:39 llama3模型推理-基于vLLM
00:16:39 下节预告
大语言模型相关精品系列课程请访问我的网站：
www.TGLTommy.com
วิทยาศาสตร์และเทคโนโลยี

ความคิดเห็น • 11

@user-ot6qr9zi1j หลายเดือนก่อน
Tommy老师，感谢分享！有个问题请教一下，是不是使用vllm，就可以本地化部署类似于llama3这样的开源模型，然后再生成API接口，供自己的app调用了？如果再要做fine tune，可以用unsloth这样的工具去做，做完后依然用vllm去部署并生成接口。感谢感谢
@TGLTommy หลายเดือนก่อน ⁺²
可以基于vLLM将第三方开原模型部署为对外的API接口服务；可以基于开源的训练框架（deepspeed，xtuner, LLaMA-Factory等工具）进行模型微调，然后部署为API服务。可以学习一下我这个系列分享的课程，已经有包含。
@user-ot6qr9zi1j หลายเดือนก่อน
@@TGLTommy 好的，我仔细学习一下，感谢tommy老师
@user-ot6qr9zi1j หลายเดือนก่อน
@@TGLTommy 另外请教一下，如果是按照您上述的这些框架，最后包装成API之后，我还能用langchain的框架去管理吗？还是说得用其他框架呢
@TGLTommy หลายเดือนก่อน ⁺¹
@@user-ot6qr9zi1j API管理？我没有用过langchain去做过。不过，你可以参考一下FastChat项目中用controller对API进行管理，可以参考一下。
@bibiworm หลายเดือนก่อน
老师这是本地部署对吧
@TGLTommy หลายเดือนก่อน
嗯嗯，是的哈
@simonwu6992 หลายเดือนก่อน
你好，想请教一下，我的模型老报错AssertionError: Meat-Llama-3-8B/tokenizer.model，不知道这边有没有碰到过。-e都装完了也没抱错，用的是官方github那段torchrun指令。
@TGLTommy หลายเดือนก่อน
请问是否查看了模型的SHA256是否与huggingface上一致呢？如果模型下载过程中出现了问题，会抛出error
@simonwu6992 หลายเดือนก่อน
用vllm是不是只能使用Hugging face下载的模型呢？我在原生的git上下载的模型就跑不起来vllm。另外想请教下，我的显卡是4070ti，看配置有2个16Ggpu显存，跑推理只用到其中一个专用显存，还有一个空着，有没有配置方式能把另一个也用上呢？
@TGLTommy หลายเดือนก่อน
如果用vllm进行模型推理，建议模型格式是huggingface格式。使用vllm进行推理时，可以配置在2张GPU上进行并发推理，提高服务的性能。

ต่อไป

เล่นอัตโนมัติ

NewSQL大神黄东旭：从0到1，如何设计一个分布式数据库

NewSQL大神黄东旭：从0到1，如何设计一个分布式数据库

Windows下中文微调Llama3，单卡8G显存只需5分钟，模型可接入GPT4All、Ollama，实现CPU推理聊天，附Colab一键训练脚本。

Windows下中文微调Llama3，单卡8G显存只需5分钟，模型可接入GPT4All、Ollama，实现CPU推理聊天，附Colab一键训练脚本。

#มาใหม่สดๆ#503 ถูกตรงๆ#แม่วรรณให้มาแล้วหลักหน่วยตัวเดียวงวด 16/7/67

#มาใหม่สดๆ#503 ถูกตรงๆ#แม่วรรณให้มาแล้วหลักหน่วยตัวเดียวงวด 16/7/67

ทักษะฟุตบอลที่ดีที่สุด 2023/24

ทักษะฟุตบอลที่ดีที่สุด 2023/24

หนูไม่ได้ท้องนะแม่!

หนูไม่ได้ท้องนะแม่!

提示词、RAG、微调哪个会让大模型表现更好？1、实践中如何选择微调、rag、提示词工程2、提示词工程使用方式3、RAG VS 微调 4、rag评估框架rags：rags5、微调好处及微调实践场景用例

提示词、RAG、微调哪个会让大模型表现更好？1、实践中如何选择微调、rag、提示词工程2、提示词工程使用方式3、RAG VS 微调 4、rag评估框架rags：rags5、微调好处及微调实践场景用例

Python零基础入门教程5小时完整版(2020年最新版)

Python零基础入门教程5小时完整版(2020年最新版)

不要浪费钱买课了，喂饭式教你训练大模型llama3

不要浪费钱买课了，喂饭式教你训练大模型llama3

Fast LLM Serving with vLLM and PagedAttention

Fast LLM Serving with vLLM and PagedAttention

00934有夠會漲，同樣都月配息、績效大贏，可以取代00929嗎？！即將首次配息，會配出高股息嗎？！~CC中文幕

00934有夠會漲，同樣都月配息、績效大贏，可以取代00929嗎？！即將首次配息，會配出高股息嗎？！~CC中文幕

Obs157 | Using Copilot Plugin with Local AI Model Services - Using Ollama and LM Studio

Obs157 | Using Copilot Plugin with Local AI Model Services - Using Ollama and LM Studio

部署本地大模型和知识库，最简单的方法

部署本地大模型和知识库，最简单的方法

【Ollama 使用指南】详解开源大模型管理工具｜15分钟了解ollama｜本地部署开源模型llama，gemma，llava，mistral｜定制化开源模型｜本地部署chatbot｜多模态开源模型

【Ollama 使用指南】详解开源大模型管理工具｜15分钟了解ollama｜本地部署开源模型llama，gemma，llava，mistral｜定制化开源模型｜本地部署chatbot｜多模态开源模型

【人工智能】vllm推理服务介绍| Qwen-7b大模型部署 | 推理服务演示

【人工智能】vllm推理服务介绍| Qwen-7b大模型部署 | 推理服务演示

เครื่องเล่นแผ่นจิ๋ว VS แผ่นเสียง Taylor Swift อันไหนจะตึงกว่ากัน? #Rokblok #TTPD

เครื่องเล่นแผ่นจิ๋ว VS แผ่นเสียง Taylor Swift อันไหนจะตึงกว่ากัน? #Rokblok #TTPD

เอาแล้ว Elon Musk จะแบน Apple! #ข่าวด่วน #elonmusk #tesla #apple #news #mercular #ai #chatgpt #สิริ

เอาแล้ว Elon Musk จะแบน Apple! #ข่าวด่วน #elonmusk #tesla #apple #news #mercular #ai #chatgpt #สิริ

ลำโพงที่เล็กที่สุด!!

ลำโพงที่เล็กที่สุด!!

The Truth about Snapdragon X Laptops…

The Truth about Snapdragon X Laptops…

cute mini iphone

cute mini iphone

iPad Gen9..งอได้ก็ตรงได้!!😊 #iPadGen9 #ดัดบอดี้ #ซ่อมiPad #ซ่อมมือถือบางใหญ่

iPad Gen9..งอได้ก็ตรงได้!!😊 #iPadGen9 #ดัดบอดี้ #ซ่อมiPad #ซ่อมมือถือบางใหญ่

ซื้อ iPhone 15 ไปเลยตอนนี้ หรือรอ iPhone 16 ดีกว่า แบบไหนดี เเบบไหนคุ้ม มีคำตอบ

ซื้อ iPhone 15 ไปเลยตอนนี้ หรือรอ iPhone 16 ดีกว่า แบบไหนดี เเบบไหนคุ้ม มีคำตอบ

No fear of others peeping anymore☺️ #phoneaccessories #screenprotector #ezglaz #privacyfilm #fyp

No fear of others peeping anymore☺️ #phoneaccessories #screenprotector #ezglaz #privacyfilm #fyp