Лекция. Последствия релиза GPT - 2

Лекция. GPT - 2

Лекция. GPT-3 и Sparse Attention

ลองสุ่มไอโฟน 990 โกงมั้ย? [ โกงมั้ยครับ ep.101 ] | DOM

VLOGWEEK #22 ตัวแม่คอนเฟิร์ม ตุลาหน้าหลีหู !!! เห้ยมันเป็นไปได้ไง ?? ตุลาทำไมมันคมขนาดนี้ นอยอะ

🔴Live โหนกระแส โผล่อีกวิชาแปลก!!! พระสงฆ์สอนลูกศิษย์ฝึก "หู-ตาทิพย์"

Лекция. Законы масштабирования LLM

Deep Learning School

มุมมอง 840

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 19 พ.ย. 2024

ความคิดเห็น • 2

@АлексейСвищев-н7к 4 หลายเดือนก่อน
Тут целый ряд вопросов возникает.
Касательно инференса и MoE - понятно. Нужно корректировать.
1 . Другой вопрос касательно реальных задач. Насколько лосс, размер модели, количество токенов в обучении коррелирую с результатами в бенчмарках? Может быть, увеличив свои бюджеты в 3 раза - мы получим лишь весьма незначительный прирост в целевых задачах.
2. Насколько обосновано выходить на плато? Допустим, ограничение в инференсе 1 млрд параметров и нужно получить максимально качественную модель при разумно-неограниченном вычислительном бюджете. Сколько данных будет пределом для такой модели (после которого она уже не будет получать преимуществ). Что случится если модель выйдет на плато (начнет переучиваться)? Как это будет связано со значениями в бенчмарках?
3. Говоря о количестве данных, что мы можем сказать об их качестве? Разнообразии? Ведь все занимаются очисткой данных как минимум и это сильно помогает на бенчмарках. А если говорить о синтетике, тут появляется вопрос об их разнообразии и правдоподобии. Может, просто создать случайные последовательности символов? Их бесконечно. Или все-таки нужно заботиться о слабо измеримых параметров данных (самый простой пример факты реальные и факты ошибочные).
@shadowmachine777 21 วันที่ผ่านมา
Я масштабиуремое латентное пространство.

ต่อไป

เล่นอัตโนมัติ

Лекция. Последствия релиза GPT - 2

Лекция. Последствия релиза GPT - 2

Лекция. GPT - 2

Лекция. GPT - 2

Лекция. GPT-3 и Sparse Attention

Лекция. GPT-3 и Sparse Attention

ลองสุ่มไอโฟน 990 โกงมั้ย? [ โกงมั้ยครับ ep.101 ] | DOM

ลองสุ่มไอโฟน 990 โกงมั้ย? [ โกงมั้ยครับ ep.101 ] | DOM

VLOGWEEK #22 ตัวแม่คอนเฟิร์ม ตุลาหน้าหลีหู !!! เห้ยมันเป็นไปได้ไง ?? ตุลาทำไมมันคมขนาดนี้ นอยอะ

VLOGWEEK #22 ตัวแม่คอนเฟิร์ม ตุลาหน้าหลีหู !!! เห้ยมันเป็นไปได้ไง ?? ตุลาทำไมมันคมขนาดนี้ นอยอะ

🔴Live โหนกระแส โผล่อีกวิชาแปลก!!! พระสงฆ์สอนลูกศิษย์ฝึก "หู-ตาทิพย์"

🔴Live โหนกระแส โผล่อีกวิชาแปลก!!! พระสงฆ์สอนลูกศิษย์ฝึก "หู-ตาทิพย์"

PASULOL รามเกียรติ์ ตอนที่ 4 นนทกพบรัก [Ramakien Ep.4: Nonthok in love]

PASULOL รามเกียรติ์ ตอนที่ 4 นนทกพบรัก [Ramakien Ep.4: Nonthok in love]

Mo Gawdat - бывший коммерческий директор Google X. Лекция о скорости и перспективах развития ИИ.

Mo Gawdat - бывший коммерческий директор Google X. Лекция о скорости и перспективах развития ИИ.

Fine-tuning, RAG, Llama, prompt-engineering, LLM-арены | Что происходит в LLM

Fine-tuning, RAG, Llama, prompt-engineering, LLM-арены | Что происходит в LLM

Полная история GPT, блок 2.5: законы масштабирования LLM (Scaling Laws) | Котенков Игорь

Полная история GPT, блок 2.5: законы масштабирования LLM (Scaling Laws) | Котенков Игорь

Главная проблема ИИ, которую никто не может решить

Главная проблема ИИ, которую никто не может решить

Terence Tao (IQ 220): Mathematics in the Age of AI

Terence Tao (IQ 220): Mathematics in the Age of AI

Занятие 5. Лекция. Attention, transformers! Переломный момент в истории NLP

Занятие 5. Лекция. Attention, transformers! Переломный момент в истории NLP

Что есть кроме ChatGPT и как это готовить: разворачиваем локальные LLM у себя на компьютере!

Что есть кроме ChatGPT и как это готовить: разворачиваем локальные LLM у себя на компьютере!

Алексей Семихатов - «Общая теория относительности: гравитация и космос»

Алексей Семихатов — «Общая теория относительности: гравитация и космос»

Лекция. Метрики и неожиданные навыки GPT-3

Лекция. Метрики и неожиданные навыки GPT-3

ถ่ายทอดสด พร้อมบทวิเคราะห์ l International Exhibition Matches l ทีมชาติไทย พบ ทีมชาติเลบานอน

ถ่ายทอดสด พร้อมบทวิเคราะห์ l International Exhibition Matches l ทีมชาติไทย พบ ทีมชาติเลบานอน

रुला दिया अंकल ने 🫂😭🙏#humanity #respect #helping#trending #viralvideo

रुला दिया अंकल ने 🫂😭🙏#humanity #respect #helping#trending #viralvideo

ลองสุ่มไอโฟน 990 โกงมั้ย? [ โกงมั้ยครับ ep.101 ] | DOM

ลองสุ่มไอโฟน 990 โกงมั้ย? [ โกงมั้ยครับ ep.101 ] | DOM

PASULOL รามเกียรติ์ ตอนที่ 4 นนทกพบรัก [Ramakien Ep.4: Nonthok in love]

PASULOL รามเกียรติ์ ตอนที่ 4 นนทกพบรัก [Ramakien Ep.4: Nonthok in love]

อาจารย์ใหญ่ • คุณอาร์ต เชียงราย | 16 พ.ย. 67 | THE GHOST RADIO

อาจารย์ใหญ่ • คุณอาร์ต เชียงราย | 16 พ.ย. 67 | THE GHOST RADIO

Live!🔴 ทีมชาติไทย VS ทีมชาติลาว เชียร์สดฟุตบอลอุ่นเครื่อง FIFA DAY | 17 พ.ย. 67 #ทีมชาติไทย

Live!🔴 ทีมชาติไทย VS ทีมชาติลาว เชียร์สดฟุตบอลอุ่นเครื่อง FIFA DAY | 17 พ.ย. 67 #ทีมชาติไทย

แข่งใช้ชีวิต!! 50 ชั่วโมง ในบ้านใต้ดินเขาวงกต 5 สี!! (หนีตายเพื่อนร่วมห้อง ฮาๆ)

แข่งใช้ชีวิต!! 50 ชั่วโมง ในบ้านใต้ดินเขาวงกต 5 สี!! (หนีตายเพื่อนร่วมห้อง ฮาๆ)

Khi Liam Harrison cho đối thủ 5 lần đo sàn chỉ trong 1 hiệp đấu

Khi Liam Harrison cho đối thủ 5 lần đo sàn chỉ trong 1 hiệp đấu