Извините, регистрация закрыта. Возможно, на событие уже зарегистрировалось слишком много человек, либо истек срок регистрации. Подробности Вы можете узнать у организаторов события.
Всем привет! Наконец настала весна, ручьи воды текут по дорогам, а с вами снова Moscow Spark. И у нас тоже текут ручьи, потому что стриминг шагает по планете и все чаще находит свое место в продакшен-пайплайнах обработки данных. На седьмой итерации митапа послушаем успешные кейсы внедрения стриминга, а также узнаем, что GPU полезны не только для глубокого обучения, но и для задач обработки данных.
Стриминг в упряжке с Кассандрой: хорошие практики и подводные камни
Рустам Аляутдинов, senior Spark engineer @ NVIDIA
Что может быть банальнее перекачивания данных из Кафки в Кассандру? Казалось бы ничего, но практика всегда изобилует непредсказуемыми поворотами. В моем докладе рассказ пойдет о том, как создать стриминг приложение, в котором скорость будет сочетаться с удобством поддержки и отладки, не забывая при этом про качество и целостность данных.
Стримы на питоне. Слабоумие и отвага
Андрей Титов, senior Spark engineer @ NVIDIA
Что может заставить здравомыслящего дата инженера перейти со Скалы на Питон? В принципе, ничего. Ко мне это, правда, не относится. И поэтому я расскажу в своем докладе, на какие грабли я наступил и с какими проблемами столкнулся при построении стриминг приложений на PySpark 2.4.0, а также поделюсь информацией по оптимизации стриминга из Кафки на скоростях около 100к eps.
Перспективы использования GPU в обработке данных
Дмитрий Урсегов, экс-тимлид @ Fastdata.io
Уже сейчас видно, что графические ускорители имеют огромные перспективы, подходят для большинства задач обработки данных и позволяют экономить время и деньги. А с появлением быстрых источников данных, за которыми традиционные процессоры не будут успевать, могут стать стандартом.
В докладе я рассмотрю перспективы GPU в обработке данных за рамками глубокого обучения, какие у этого аппаратные и программные предпосылки. Разберем архитектуру и ее текущие ограничения. Будут даны результаты на некоторых задачах. Немного затронем детали интеграции со Spark, Rapids и Dask.
Как добраться?
На 1-м этаже будет регистрация. Для того, чтобы попасть на конференцию необходимо иметь при себе паспорт, после регистрации, следуя указателям подняться на 4-й этаж через лифтовую группу B. На 4-м этаже, также следуя указателям, пройти в атриум.