Добрый день. очень полезное виедо спасибо. Подскжите пожалуйста, а почему дата сайнтист не может сам преобразовать эти данные как ему надо, через тот же пандас скажем ?
Пандас - одномашинный вариант обработки, по определению "большие данные" так не обработать. Spark работает на кластере, ему любые данные "по плечу". Понятно, что в видео была "игрушечная" задачка, в жизни задачи куда-как больше и сложнее.
Это одно из лучших введений в тему, которое я когда-либо видел.
Спасибо за комментарий, приходите к нам на курсы или просто подписывайтесь :-)
пощупать руками это реально бесценно. с примером!
Супер пример!
Жаль в плейлистах нет нумерации уроков. Иногда затруднительно найти первое видео и дальше смотреть по очереди.
Про спарк ни слова... плохо очень.
Класс
Добрый день. очень полезное виедо спасибо. Подскжите пожалуйста, а почему дата сайнтист не может сам преобразовать эти данные как ему надо, через тот же пандас скажем ?
Пандас - одномашинный вариант обработки, по определению "большие данные" так не обработать. Spark работает на кластере, ему любые данные "по плечу".
Понятно, что в видео была "игрушечная" задачка, в жизни задачи куда-как больше и сложнее.
Добрый день!
Скажи, пожалуйста, где можно скачать код с исходные данные для изучения в живую?
Заранее благодарен!
Звук ❤
Круто
иииии... датасеты разные)
Что такое Спарк?
все видео это пример - как с помощью спарк преобразовывать данные. А что такое спарк - ноль инфы
ужасное объяснение
че так
Из этого видео я понял, что Apache Spark - это питоновская библиотека, которая дублирует pandas. Спасибо.
К сожалению есть питоновская, лучше под Spark писать на Scala
@@ChannelCheesecakeпочему к сожалению ?
Качество звучания, как будто в прямом эфире ток-шоу позвонили внезапно человеку))