Если SM имеет 32 рабочих треда, то почему мы выделяем рабочую группу 128? Логичней выделить рабочую группу из 32 элементов. Разве нет? Так синхронизация должна быть быстрей Если выделить рабочую группу из 256 элементов, получается в 2 раза ещё больше будет переключений контекстов при выполнении рабочей группы. Это ведь сильней должно влиять на производительность. Видел что в opencv часто используют 32х8 рабочую группу. Там через cuda kernels это реализовано. Есть ли какой сакральный смысл за этим? Может оптимальней делать 32х4 группу?
вообще синхронизация элементов проходит как раз по группам, вам не надо синхронизировать 32 потока из одного ворпа, т.к. они уже аппаратно синхронизированы.
Поддерживаю Товарищ!!! Давайте тащите покрышки. Обложим этих зад*отов. Выгоним их из своих комнат на площади. Пусть Там народу лекции свои читают. Что бы все слышали..... А вы товарищ! Проконтролируйте что бы все ( народ) конспектировали и усвоили материал.... Через год мы должны создать свою Видеокарту... СССРцкую!! И чтоб она буржуев.... ДИП ( Догнала и Перегнала - если не знаете сути сокращения)
Крутой лектор, крутая подача и крутой материал!
17:00 - Возможны проблемы с версиями, пользователь сохранил файл в одной версии программы, а считал в другой версии программы
Есть ли возможность как-то получить доступ к прикладным материалам, на которых основывается практика по этим лекциям?
Видеокарты на 19:00 начинаются...
Если SM имеет 32 рабочих треда, то почему мы выделяем рабочую группу 128? Логичней выделить рабочую группу из 32 элементов. Разве нет? Так синхронизация должна быть быстрей
Если выделить рабочую группу из 256 элементов, получается в 2 раза ещё больше будет переключений контекстов при выполнении рабочей группы. Это ведь сильней должно влиять на производительность. Видел что в opencv часто используют 32х8 рабочую группу. Там через cuda kernels это реализовано. Есть ли какой сакральный смысл за этим? Может оптимальней делать 32х4 группу?
вообще синхронизация элементов проходит как раз по группам, вам не надо синхронизировать 32 потока из одного ворпа, т.к. они уже аппаратно синхронизированы.
на мой взгляд это бредовая идея - преподавать программирование в формате видеолекций.
услышали вас, закрываемся!
Поддерживаю Товарищ!!! Давайте тащите покрышки. Обложим этих зад*отов. Выгоним их из своих комнат на площади. Пусть Там народу лекции свои читают. Что бы все слышали..... А вы товарищ! Проконтролируйте что бы все ( народ) конспектировали и усвоили материал.... Через год мы должны создать свою Видеокарту... СССРцкую!! И чтоб она буржуев.... ДИП ( Догнала и Перегнала - если не знаете сути сокращения)
@@CompscicenterRu нормуль... так держать