Data Science at Scale: Курс науки о данных для работы с гигантскими объемами информации
Специализация Data Science at Scale от Университета Вашингтона состоит из 4 курсов, охватывающих темы от масштабируемого управления данными до предсказательной аналитики и визуализации результатов. Рассказываем подробнее.
Специализация Data Science at Scale от Университета Вашингтона состоит из 4 курсов, охватывающих темы от масштабируемого управления данными до предсказательной аналитики и визуализации результатов. Рассказываем подробнее.
Примечание Adviser
В этой статье ссылки партнеров. Это значит, что если вы что-то покупаете с нашей помощью — вы также поддерживаете dev.by. (Вот другой способ).
При этом редакция и авторы независимы в выборе темы, концепции материала, фокуса описания, подхода к услугам или товарам. Прежде чем что-то советовать, мы много читаем и смотрим по теме, говорим с экспертами.
Редакция может выражать свое мнение и пробовать всё на себе.
Если рекомендательный материал обновляется, мы указываем, что и когда поменялось, в самом начале.
Data Science at Scale — подход, который позволяет эффективно извлекать ценную информацию из огромных и разнородных данных, используя современные технологии и методы для работы в условиях больших объемов, высокой скорости поступления данных и разнообразия их типов.
Специализация включает 4 курса. Вы научитесь визуализировать данные и передавать результаты, а также разбираться в юридических и этических вопросах, связанных с большими данными. В заключительном проекте Capstone, разработанном в партнерстве с платформой для цифровых стажировок Coursolve, сможете применить свои новые навыки в реальном проекте.
Кто преподаёт
Преподаватель курса Билл Хоу — ведущий специалист в области науки о данных. Сейчас он работает на факультете информатики и техники Университета Вашингтона, где также занимает должность директора нескольких исследовательских программ. Текущие исследования Билла Хоу сосредоточены на масштабируемых системах обработки данных, параллельных базах данных и применении вычислительных методов в науке и инженерии.
Программа обучения
1. Манипулирование данными в масштабе: системы и алгоритмы
Анализ данных заменил сбор данных как ключевой элемент в принятии решений на основе фактов. Курс познакомит вас с системами и алгоритмами, которые используют параллельные базы данных, распределенные системы и языки программирования для создания масштабируемых платформ анализа данных. Вы узнаете, как оценивать облачные вычисления, базы данных SQL и NoSQL, MapReduce, Spark и другие специализированные системы.
2. Практическая прогнозирующая аналитика: модели и методы
Курс научит вас разрабатывать статистические эксперименты и анализировать их результаты с использованием современных методов. Вы изучите основные методы классификации и оптимизации, а также методы неконтролируемого обучения и графовой аналитики.
3. Коммуникация результатов Data Science
Вы научитесь создавать и критиковать визуализации данных, объяснять конфиденциальность и этические вопросы в науке о данных, а также использовать облачные вычисления для воспроизводимого анализа данных. Итоговое задание курса связано с анализом графиков в облаке, для выполнения которого потребуется использовать Amazon Web Services (AWS).
4. Data Science at Scale — Capstone Project
В заключительном проекте Capstone вам предстоит поработать над реальным проектом, применяя все навыки, полученные в ходе специализации. Каждая задача Capstone напрямую связана с реальными партнерами, заинтересованными в итоговых результатах.
TIP от Adviser: Учиться на Coursera еще выгоднее с подпиской Coursera Plus. За $59 в месяц можно пройти неограниченное число учебных программ из более чем 7 тысяч. Идеальный вариант, если вы готовы посвятить много времени учебе.
Искусство компромиссов: как повышать рейт на Upwork, Toptal или Fiverr, не теряя клиентов
Востребованный фрилансер рано или поздно упирается в стеклянный потолок своей рабочей недели. Можно работать по 50 часов, до автоматизма отточить стек и закрывать контракты с идеальным результатом. Но если почасовой рейт застыл на отметке двухгодичной давности, вы начинаете терять деньги. Инфляция, рост личной экспертизы и выгорание от однотипных задач — маркеры того, что вам пора пересмотреть прайс.
Выход из тени репо: как разработчику построить личный бренд и заставить рынок говорить о себе
В среде разработчиков все еще силен красивый, но опасный миф: «Хороший код говорит сам за себя, а лучшее резюме — идеально зеленая сетка коммитов на GitHub». В идеальном (академическом) мире этого, возможно, хватило бы. Но в реальности, где за сильные позиции в стартапах борются тысячи талантов, молча писать код — это сознательный отказ от половины карьерных возможностей.
Искусство предсказания: 10 книг по декомпозиции и оценке сроков, которые могут спасти дедлайны вашей команды
«Сделайте нам примерную оценку к вечеру вторника», — фраза, от которой у тимлида начинает предательски дергаться глаз. Бизнесу нужна точность, но разработка связана с постоянным хаосом, скрытыми зависимостями и legacy-кодом. Поэтому эстимейты скорее похожи на гадание, а финальные релизы сдвигаются на недели, сжигают бюджеты и нервные клетки команды.
Альторны возвращаются: RoboCraft открыл летний набор на Arduino.Start для детей 9-13 лет
После нескольких миссий Альторны снова выходят на связь. На этот раз юным инженерам предстоит не просто помочь космической команде, а самим (с родителями) выбрать удобный формат обучения: групповой курс, индивидуальные занятия или самостоятельный онлайн-курс.
Хотите сообщить важную новость? Пишите в Telegram-бот
Главные события и полезные ссылки в нашем Telegram-канале
Обсуждение
Комментируйте без ограничений
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.