Data Science at Scale: Курс науки о данных для работы с гигантскими объемами информации
Специализация Data Science at Scale от Университета Вашингтона состоит из 4 курсов, охватывающих темы от масштабируемого управления данными до предсказательной аналитики и визуализации результатов. Рассказываем подробнее.
Примечание Adviser
В этой статье ссылки партнеров. Это значит, что если вы что-то покупаете с нашей помощью — вы также поддерживаете dev.by. (Вот другой способ).
При этом редакция и авторы независимы в выборе темы, концепции материала, фокуса описания, подхода к услугам или товарам. Прежде чем что-то советовать, мы много читаем и смотрим по теме, говорим с экспертами.
Редакция может выражать свое мнение и пробовать всё на себе.
Если рекомендательный материал обновляется, мы указываем, что и когда поменялось, в самом начале.
Data Science at Scale — подход, который позволяет эффективно извлекать ценную информацию из огромных и разнородных данных, используя современные технологии и методы для работы в условиях больших объемов, высокой скорости поступления данных и разнообразия их типов.
Специализация «Data Science в масштабе» / Coursera
Специализация включает 4 курса. Вы научитесь визуализировать данные и передавать результаты, а также разбираться в юридических и этических вопросах, связанных с большими данными. В заключительном проекте Capstone, разработанном в партнерстве с платформой для цифровых стажировок Coursolve, сможете применить свои новые навыки в реальном проекте.
Кто преподаёт
Преподаватель курса Билл Хоу — ведущий специалист в области науки о данных. Сейчас он работает на факультете информатики и техники Университета Вашингтона, где также занимает должность директора нескольких исследовательских программ. Текущие исследования Билла Хоу сосредоточены на масштабируемых системах обработки данных, параллельных базах данных и применении вычислительных методов в науке и инженерии.
Программа обучения
1. Манипулирование данными в масштабе: системы и алгоритмы
Анализ данных заменил сбор данных как ключевой элемент в принятии решений на основе фактов. Курс познакомит вас с системами и алгоритмами, которые используют параллельные базы данных, распределенные системы и языки программирования для создания масштабируемых платформ анализа данных. Вы узнаете, как оценивать облачные вычисления, базы данных SQL и NoSQL, MapReduce, Spark и другие специализированные системы.
2. Практическая прогнозирующая аналитика: модели и методы
Курс научит вас разрабатывать статистические эксперименты и анализировать их результаты с использованием современных методов. Вы изучите основные методы классификации и оптимизации, а также методы неконтролируемого обучения и графовой аналитики.
3. Коммуникация результатов Data Science
Вы научитесь создавать и критиковать визуализации данных, объяснять конфиденциальность и этические вопросы в науке о данных, а также использовать облачные вычисления для воспроизводимого анализа данных. Итоговое задание курса связано с анализом графиков в облаке, для выполнения которого потребуется использовать Amazon Web Services (AWS).
4. Data Science at Scale — Capstone Project
В заключительном проекте Capstone вам предстоит поработать над реальным проектом, применяя все навыки, полученные в ходе специализации. Каждая задача Capstone напрямую связана с реальными партнерами, заинтересованными в итоговых результатах.
Читать на dev.by