Обработка больших данных при помощи Apache Spark ч2 | Технострим

Мероприятие: Moscow Data Science Junior Meetup, Выступающий: Виталий Худобахшов, Одноклассники Apache Spark сегодня является одной из самых популярных технологий обработки больших данных в первую очередь за счет очень удобного API, который близок к обычному функциональному стилю программирования на Scala. Спикер расскажет, что такое Spark и как с ним работать. Рассмотрит некоторые паттерны использования Spark. И, конечно, расскажет, что такое большие данные с практической точки зрения. В качестве основных примеров разберет, как определить пол и возраст пользователя в социальной сети, если он указан с ошибкой. На этих примерах станет понятно, что можно узнать просто с помощью правильной обработки данных, даже не используя машинное обучение. Календарь событий: О КАНАЛЕ: Официальный канал образовательных проектов Group ► Нажмите здесь для подписки ‣ Актуальные лекции и мастер-классы о программировании
Back to Top