Data Science at Scale: Курс науки о данных для работы с гигантскими объемами информации
Специализация Data Science at Scale от Университета Вашингтона состоит из 4 курсов, охватывающих темы от масштабируемого управления данными до предсказательной аналитики и визуализации результатов. Рассказываем подробнее.
Специализация Data Science at Scale от Университета Вашингтона состоит из 4 курсов, охватывающих темы от масштабируемого управления данными до предсказательной аналитики и визуализации результатов. Рассказываем подробнее.
Примечание Adviser
В этой статье ссылки партнеров. Это значит, что если вы что-то покупаете с нашей помощью — вы также поддерживаете dev.by. (Вот другой способ).
При этом редакция и авторы независимы в выборе темы, концепции материала, фокуса описания, подхода к услугам или товарам. Прежде чем что-то советовать, мы много читаем и смотрим по теме, говорим с экспертами.
Редакция может выражать свое мнение и пробовать всё на себе.
Если рекомендательный материал обновляется, мы указываем, что и когда поменялось, в самом начале.
Data Science at Scale — подход, который позволяет эффективно извлекать ценную информацию из огромных и разнородных данных, используя современные технологии и методы для работы в условиях больших объемов, высокой скорости поступления данных и разнообразия их типов.
Специализация включает 4 курса. Вы научитесь визуализировать данные и передавать результаты, а также разбираться в юридических и этических вопросах, связанных с большими данными. В заключительном проекте Capstone, разработанном в партнерстве с платформой для цифровых стажировок Coursolve, сможете применить свои новые навыки в реальном проекте.
Кто преподаёт
Преподаватель курса Билл Хоу — ведущий специалист в области науки о данных. Сейчас он работает на факультете информатики и техники Университета Вашингтона, где также занимает должность директора нескольких исследовательских программ. Текущие исследования Билла Хоу сосредоточены на масштабируемых системах обработки данных, параллельных базах данных и применении вычислительных методов в науке и инженерии.
Программа обучения
1. Манипулирование данными в масштабе: системы и алгоритмы
Анализ данных заменил сбор данных как ключевой элемент в принятии решений на основе фактов. Курс познакомит вас с системами и алгоритмами, которые используют параллельные базы данных, распределенные системы и языки программирования для создания масштабируемых платформ анализа данных. Вы узнаете, как оценивать облачные вычисления, базы данных SQL и NoSQL, MapReduce, Spark и другие специализированные системы.
2. Практическая прогнозирующая аналитика: модели и методы
Курс научит вас разрабатывать статистические эксперименты и анализировать их результаты с использованием современных методов. Вы изучите основные методы классификации и оптимизации, а также методы неконтролируемого обучения и графовой аналитики.
3. Коммуникация результатов Data Science
Вы научитесь создавать и критиковать визуализации данных, объяснять конфиденциальность и этические вопросы в науке о данных, а также использовать облачные вычисления для воспроизводимого анализа данных. Итоговое задание курса связано с анализом графиков в облаке, для выполнения которого потребуется использовать Amazon Web Services (AWS).
4. Data Science at Scale — Capstone Project
В заключительном проекте Capstone вам предстоит поработать над реальным проектом, применяя все навыки, полученные в ходе специализации. Каждая задача Capstone напрямую связана с реальными партнерами, заинтересованными в итоговых результатах.
TIP от Adviser: Учиться на Coursera еще выгоднее с подпиской Coursera Plus. За $59 в месяц можно пройти неограниченное число учебных программ из более чем 7 тысяч. Идеальный вариант, если вы готовы посвятить много времени учебе.
Искусство предсказания: 10 книг по декомпозиции и оценке сроков, которые могут спасти дедлайны вашей команды
«Сделайте нам примерную оценку к вечеру вторника», — фраза, от которой у тимлида начинает предательски дергаться глаз. Бизнесу нужна точность, но разработка связана с постоянным хаосом, скрытыми зависимостями и legacy-кодом. Поэтому эстимейты скорее похожи на гадание, а финальные релизы сдвигаются на недели, сжигают бюджеты и нервные клетки команды.
Альторны возвращаются: RoboCraft открыл летний набор на Arduino.Start для детей 9-13 лет
После нескольких миссий Альторны снова выходят на связь. На этот раз юным инженерам предстоит не просто помочь космической команде, а самим (с родителями) выбрать удобный формат обучения: групповой курс, индивидуальные занятия или самостоятельный онлайн-курс.
Гид по коммуникации для техлидов: как продать бизнесу внедрение новых технологий и рефакторинг
Рано или поздно каждый техлид упирается в стену. По мере роста проекта, старая архитектура начинает скрипеть на поворотах: монолит пора распиливать, легаси выжигать, а фреймворки обновлять. Но как только приходишь с этим к менеджменту, в ответ — недоумение.
Офис в режиме инкогнито: как собрать автономный хаб для работы на природе, если надоели коворкинги
Главный тренд современной удаленки — поиск абсолютной свободы перемещений. Возможность закрыть ноутбук в пятницу, подальше от душного мегаполиса и в понедельник продолжить писать код на веранде уединенного домика, звучит как идеальный план. На практике формат workation разбивается о реальность: батарея тает за пару часов компиляции, интернет вдали от вышек отказывается грузить тяжелые репо, а блики на экране заставляют искать тень.
Хотите сообщить важную новость? Пишите в Telegram-бот
Главные события и полезные ссылки в нашем Telegram-канале
Обсуждение
Комментируйте без ограничений
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.