Лекция: Характеристики аппаратного обеспечения: CPU, память, диски и сеть I SRE Week I ШАД
ฝัง
- เผยแพร่เมื่อ 17 มิ.ย. 2024
- "SRE Week 2024 l Лекция 2: Характеристики аппаратного обеспечения: CPU, память, диски и сеть
Спикер: Руслан Савченко, руководитель службы разработки динамических таблиц YTsaurus.
На лекции продолжите погружаться в технические детали эксплуатации высоконагруженных сервисов и узнаете о важных характеристиках аппаратного обеспечения.
Скачать презентацию по лекции: disk.yandex.ru/d/akGo4UUCfXYa5Q
Материалы, о которых говорит спикер в лекции:
1. J.L. Hennessy, D.A. Patterson. Computer Architecture: A Quantitative Approach (The Morgan Kaufmann Series in Computer Architecture and Design). 2019. shop.elsevier.com/books/compu...
2. T. Downs. A Concurrency Cost Hierarchy. Performance Mattersю 2020. travisdowns.github.io/blog/20...
3. H. Schweizer et al. Evaluating the Cost of Atomic Operations on Modern Architectures. PACT 2015 doi.org/10.1109/PACT.2015.24
4. M. Velten et al. Memory Performance of AMD EPYC Rome and Intel Cascade Lake SP Server Processors. ICPE '22 doi.org/10.1145/3489525.3511689
5. C. Li et al. Quantifying the cost of context switch. ExpCS '07. doi.org/10.1145/1281700.1281702
6. R. Savchenko. arXiv, 2021 arxiv.org/abs/2102.11198
7. T. Heo et al. IOCost: block IO control for containers in datacenters. ASPLOS '22. doi.org/10.1145/3503222.3507727
8. Skylake (server) - Microarchitectures - Intel. wikichip.org. en.wikichip.org/wiki/intel/mi...)
Другие лекции интенсива SRE Week:
Лекция 1: Введение. Как ломаются большие системы. Разбираем статистику поломок сервисов: th-cam.com/users/liveTBr01y66bvo?...
Лекция 3: Обзор утилит диагностики в командной строке Linux: th-cam.com/users/liveAqDnLf6xf0c?...
Лекция 4: Распределённые системы и observability. Инфраструктурные компоненты и средства диагностики распределённых систем: th-cam.com/users/live4036v1ydDPY?...
Лекция 5: Практика работы SRE. Чем приходится заниматься руками: SLO, capacity planning, алерты, дежурства, incident management, postmortem actions: th-cam.com/users/live758wXAx-bv8?...
Семинар 6.1: Настройка параметров ядра Linux: th-cam.com/users/liveI_mVU41I-YE?...
Семинар 6.2: Performance troubleshooting на практике: th-cam.com/users/lived0SZtSF5m4U?...
Узнать больше о Школе анализа данных можно на сайте: shad.yandex.ru/
Тема Numa - не раскрыты ( Кол-во линий/памяти/CRU они же зависимы, да? %)
Опечатка на слайде: lspu -> lscpu
1. Лекция по разделению памяти между процессорами выглядит хорошо и полно для иллюстраций Intel/AMD не моложе 2015. Подспудно речь идет о серверах.
2. Не сказано про P-states и C-states в PM (power management), которые тоже влияют на caches и NUMA.
2. Не сказано об учитывании caches, NUMA и PM в компиляторах, скажем, С от GNU GCC или MS VS.
3. Сегодня мы видим захват ARM и NVidia рынка Intel/AMD. Это связано с увеличением скорости счета на GPU под мульти-SIMD массивами с ИИ LLP командами при меньших энергозатратах.
- "Не понятная стоимость операций, на физические показатели (там же все..., как раз более понятно (геометрия - размах головки (... оч неизвестно) )"
Интересно про Контекст свичинг... Понятное сравнение с кешем l1-3, не понятно в контексте ОС - Считаю что CS - дорогая операция
Идея Numa ноды не раскрыта - CPU/RAM, кмк
Правильно ли я услышал, что - "доступ к памяти l3 дольше чем, через соседней нума,?"
Серьезно? про 4к паттерн заявлен? А про какой паттерн нагрузки считается в этом случае ожидаем?
Что надо читать в это паттерне лежит на диске
?
тема энвилоупа не раскрыта
Руслан, визуальное оформление слайдов в стиле XKCD - это вообще не смешно.
Хорошо, что статья не публиковалась.
th-cam.com/video/KHnsyuEqERY/w-d-xo.html
странно что пропустили конгеншенн-протоколы пропустили (