Монолог из третьего «Терминатора» сегодня фантастикой не кажется, ведь алгоритмы искусственного интеллекта уже используются почти во всех областях твоей жизни. Хочешь разобраться в особенностях их работы и защитить мир от восстания машин? Записывайся на
курс Machine Learning в школу TMS! Твоим преподавателем станет Максим Степанович — эксперт с 4-летним опытом в Data Science и человек, согласившийся дать небольшое интервью о будущей программе и ML в целом.
LinkedIn преподавателя —
https://by.linkedin.com/in/maxim-stepanovich-6ab9691aa
— Максим, расскажи пару слов о себе — своем опыте и бэкграунде. Почему решил стать специалистом по машинному обучению? — На самом деле все довольно просто. Еще в университете пробовал разные виды программирования — начинал с создания мобильных и веб-приложений. Все это казалось мне шаблонным, такого мнения придерживаюсь и сейчас. Я всегда хотел заниматься чем-то инновационным и решать задачи с максимально неочевидным результатом, а стандартная разработка выглядела рутинной. Стремясь уйти от этой рутины, набрел на нейросети и машинное обучение. Получается, что усталость от классической работы девелопера привела меня в Data Science.
— Ты уточнил, что до ML занимался «классическим» программированием. С какими языками и технологиями была связана твоя прежняя работа? — Стандартный набор инструментов веб-разработчика — Java+Spring, Python с фреймворками Flask и Django. Душа к вебу не лежала, пробовал менять языки, но ничего принципиально нового не получал.
— Если говорить обобщенно, что такое Data Science и Machine Learning? Почему об этих направлениях сегодня слышно отовсюду? — В эпоху повсеместной цифровизации люди сталкиваются с огромными объемами данных. Информация есть везде, куда ни посмотри. Миллионы комментариев под роликами на «Ютубе», тысячи денежных переводов, сотни факторов одобрения кредитов для потенциальных получателей — все эти сведения нуждаются в осмыслении и обработке.
На месте не стоит, например, медицина — с каждым годом врачи открывают новые заболевания и начинают применять более сложные технологии при постановке диагнозов. Увеличивается и вес ошибки — если доктор подберет не то лечение, пациенту станет хуже. Аналогично дела обстоят и с банками, теряющими громадные деньги из-за неправильно выданного кредита.
Основная задача Data Science — это анализ больших объемов данных разными способами. Первый кейс направления заключается в замене рутинных процессов инструментами автоматизации для повышения производительности. Второй — в устранении фактора человеческой ошибки при обработке информации.
— В каких направлениях применяют алгоритмы Data Science и Machine Learning? Где они востребованы?
— Лучше бы ты спросил, где они
не востребованы. На данный момент машинное обучение внедрено во все сферы жизни — от образования и финансов до медицины и маркетинга. Люди пользуются умными колонками, работающими на алгоритмах ML, и делают покупки на маркетплейсах с рекомендательными системами, построенными на алгоритмах ML. Даже навязчивая реклама в браузере использует инструменты Machine Learning.
Могу раскрыть интересный кейс с примером не самого очевидного применения Data Science. Некоторые крупные сети супермаркетов еще несколько лет назад пришли к тому, чтобы использовать машинное обучение для анализа трафика в магазинах по камерам видеонаблюдения. Компании начали собирать данные о том, как ведут себя покупатели — какими маршрутами ходят и где проводят больше времени. На базе этой информации эксперты поменяли расположение полок, увеличив ежемесячную прибыль в некоторых торговых точках на 40-50% (без изменения ассортимента!).
— Кейс действительно интересный, но со стороны он выглядит мрачновато. Получается, что за нами следит большой брат, а ML — это своеобразное зло? — Вопрос, прямо скажем, дискуссионный. Любое творение всегда можно описать с двух сторон — положительной и отрицательной. Внедряя Data Science в медицину, мы снижаем риск врачебной ошибки, но забираем работу у докторов.
Всегда нужно отталкиваться оттого, что экосистемой Machine Learning управляет человек. Алгоритмы внедряются в тех местах, где это будет выгодно с точки зрения автоматизации бизнеса. Лучше один раз купить или написать проект, завязанный на AI, чем платить каждый месяц зарплату сотрудникам.
Когда эксперты «Теслы» разработали свой знаменитый автопилот, зашла речь о сферах его применения. Какие бы тесты на безопасность ни проходила программа, от ее повсеместного внедрения отказывалась и компания, и сами водители. Никто не захочет брать на себя юридическую ответственность, если алгоритмы вдруг перестанут работать корректно и станут причиной аварии с летальным исходом.
— Что должен знать и уметь специалист в области машинного обучения? Чему будешь учить студентов на курсах Machine Learning в IT-школе TeachMeSkills? — Data Science — широкое понятие с большим набором сфер применения. Задач, решаемых с помощью ML-алгоритмов, бесчисленное множество — я уже приводил примеры из мира медицины, финансов и маркетинга. На курсе в TMS мы сделаем акцент на двух областях — NLP (Natural Language Processing — обработка текста) и компьютерном зрении (Computer Vision — обработка изображений).
Как приятное дополнение к представленным блокам — знакомство с направлением MLOps. Любые модели, пайплайны и строчки кода, написанные в сфере Data Science, сами по себе никакой ценности не несут до тех пор, пока их куда-то не внедрить. Этот процесс мы тоже затронем — познакомимся с Докером, рассмотрим подходы внедрения и расскажем о том, как ML приносит людям пользу.