Технологии компьютерного зрения помогают робомобилю отличить фонарный столб от оленя, а роботу-курьеру — не перепутать газон с тротуаром. Еще они позволяют распознать человека в толпе, модерировать контент в соцсетях, диагностировать болезнь по рентгеновскому снимку, отличить кота от собаки, а корги — от лабрадора. Специалистов по Computer Vision пока не так много, а спрос на них растет с каждым годом. Рассказываем, как изучить новую технологию, не выходя из дома.
Технологии компьютерного зрения помогают робомобилю отличить фонарный столб от оленя, а роботу-курьеру — не перепутать газон с тротуаром. Еще они позволяют распознать человека в толпе, модерировать контент в соцсетях, диагностировать болезнь по рентгеновскому снимку, отличить кота от собаки, а корги — от лабрадора. Специалистов по Computer Vision пока не так много, а спрос на них растет с каждым годом. Рассказываем, как изучить новую технологию, не выходя из дома.
Компьютерное зрение(Computer Vision, CV) — это область искусственного интеллекта, связанная с анализом, классификацией и распознаванием изображений и видео. В основе CV-систем обычно лежат алгоритмы на базе машинного обучения — с их помощью они учатся отличать одни объекты от других, видеть паттерны и закономерности. Человек учится распознавать образы в процессе знакомства с окружающим миром — еще в детстве он запоминает, чем отличается кошка от собаки, а интерфейс Among Us — от интерфейса Minecraft. Компьютер «мыслит» иначе — чтобы научить систему распознавать образы, ей нужно «скормить» датасет с размеченными данными, который наглядно показывает отличия одного объекта от другого.
Разметка данных, кстати, целая наука — причем довольно трудоемкая. Обычно для этого нанимают фрилансеров, которые дистанционно маркируют видеоролики и изображения. Чем точнее разметка и чем больше данных, тем точнее будет работать система компьютерного зрения. При этом многое зависит от специфики — алгоритм, которые ориентируется в разных видах птиц, не поможет робомобилю распознать преграду на дороге. Хотя бывают интересные прецеденты. Например, в Японии алгоритм для распознавания выпечки стали использовать для диагностики рака.
Реконструкция работы системы распознавания объектов у автомобилей Tesla.
С каждым годом технология эволюционирует, но без глитчей пока не обходится: алгоритмы путают людей с животными, принимают абстрактные паттерны за реальные объекты, а иногда не могут отличить черепаху от ружья. Задача специалистов по компьютерному зрению — свести к минимуму такие инциденты и научить алгоритмы уверенно ориентироваться в окружающем мире. Например, на производстве система сможет выявить бракованное изделие, в клинике поможет врачу отличить злокачественную опухоль от доброкачественной, а астрофизикам позволит быстрее классифицировать небесные тела.
Технология сама по себе нейтральна, но применять ее можно по-разному — например, некоторые государства используют ее для деанонимизации протестующих. Поэтому специалистам по ИИ рекомендуют изучать этику в сфере машинного обучения. Один из таких курсов мы специально включили в эту подборку.
Где изучать компьютерное зрение?
Бесплатные уроки по теме «Компьютерное зрение» от Udemy
Восемь коротких уроков отлично подойдут для быстрого погружения в тему. Например, вы узнаете, как устроена навигация робомобилей, что такое метод Виолы — Джонса, как работают сверточные и генеративно-состязательные нейросети, а также познакомитесь с библиотекой OpenCV и поймете, как использовать ее для распознавания лиц.
Глубокое обучение и компьютерное зрение от А до Я: OpenCV, SSD и GAN от Udemy
На курсе вы освоите базовые инструменты компьютерного зрения и сможете не только создать приложение для распознавания лиц и объектов, но также генерировать изображения с помощью GAN — генеративно-состязательных нейросетей.
Вы узнаете, как глубокое обучение помогает компьютерам распознавать образы, а также создадите сервисы для распознавания и отслеживания объектов. Для обучения пригодится знание Python, но самых базовых навыков будет достаточно. Кстати, приобретать дорогое ПО не придется — в процессе обучения вы будете использовать бесплатные инструменты с открытым кодом.
Основы компьютерного зрения с Watson и OpenCV от edХ
На этом вводном курсе вы научитесь обрабатывать и классифицировать изображения, следуя гайдлайнам от сотрудников IBM, а также освоите базовые принципы работы с Python, Watson AI и OpenCV
Обработка изображений с помощью Python. Бесплатный курс от DataCamp
Отличное дополнение к курсу от edX — четыре модуля по обработке и маркировке изображений. Программа сфокусирована не столько на компьютерном зрении, сколько на обработке визуала (image processing). Например, вы научитесь улучшать качество медицинских снимков, увеличивать фотографии в несколько раз, удалять отдельные объекты и распознавать паттерны с помощью современных инструментов на базе машинного обучения.
Станьте экспертом по компьютерному зрению с Udacity
На занятиях вы научитесь работать с системами компьютерного зрения, которые уже применяются во многих отраслях — от производства до автотранспорта. Партнерами курса выступили Nvidia, Deep Learning Institute и компания Affectiva, которая создает ПО для распознавания эмоций по фото и видео. Плюс обучения на Udacity — это дополнительная помощь с трудоустройством после окончания курса. Вам помогут улучшить резюме и страницу на LinkedIn, а также организуют ревью кода на Github.
Фундаментальная программа, разработанная при участии известного эксперта по машинному обучению Эндрю Ына, включает пять курсов по глубокому обучению. Вы узнаете, какие технологии на самом деле скрываются за абстрактным понятием «искусственный интеллект», научитесь работать с разными типами нейросетей и сможете применять их для распознавания образов, синтеза речи и музыки.
Разработчики часто закладывают в алгоритмы собственные предубеждения и когнитивные искажения. В результате ИИ дискриминирует отдельные группы людей, совершает ошибки и вводит в заблуждение пользователей. Курс объясняет, что скрывает за «черный ящик» искусственного интеллекта и как предрассудки становятся частью «прошивки», а главное, объясняет разработчикам, как этого избежать.
«Всё под контролем». Как развить эмоциональный интеллект и перестать залипать в стрессе
Мир IT построен на логике, но держится на людях. И чем быстрее развивается технология, тем важнее понимать себя, других и свои эмоции. Речь не про «улыбаться на митинге», а про способность сохранять ясность мысли, когда всё вокруг летит в прод, а вы остаетесь спокойны и собраны. Развитие эмоционального интеллекта сегодня важнее не меньше, чем знание кода или фреймворков.
«Tinder уже не тот»: Как формат воркейшен-кемпа возвращает живое общение
Мир давно устал от свайпов и коротких чатов. Люди, особенно из IT, всё чаще ищут не свидания, а возможность поговорить по-настоящему — без ролей, без фильтров и без суеты. Так появился воркейшен-кемп «12 Незнакомцев» от сообщества COMOON. Первый заезд распродали за несколько дней.
Сейчас команда готовит «18 Незнакомцев» — и снова осталось всего несколько мест.
Как отключиться от кода: 5 курсов для релаксации и вдохновения
Работа в IT — это постоянное напряжение: дедлайны, сложные задачи, потоки сообщений, созвоны, апдейты, переработки. Кажется, что мозг работает на пределе и даже выходные не всегда спасают. Лучший способ восстановить энергию — не отдыхать ничего не делая, а делать что-то другое. Лучше творческое, где вы работаете руками, а не головой.
Хотите сообщить важную новость? Пишите в Telegram-бот
Главные события и полезные ссылки в нашем Telegram-канале
Обсуждение
Комментируйте без ограничений
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.