08 декабря

Data science: почему стоит выбрать это направление

При выборе перспективного занятия стоит обратить внимание на направление, которое разгонялось с середины XX века и набрало мощь около 2010 года, долго предвкушаемое и поэтому незаменимое. А еще если вам всегда хотелось приносить пользу людям. В том числе и о возможностях спасения человечества поговорили с преподавателем курса Богданом Редчуком, Data Scientist в Surprise.com. Выбирайте этот курс, если вас привлекает широкий горизонт!
Краткое досье:

НТУУ «Киевский политехнический институт им. Игоря Сикорского», прикладная физика (физика живых систем).
Опыт коммерческого машинного обучения с 2016 года
Работал с дронами на оборонную отрасль, Computer Vision, проекты для Levi's и Macy's
Профиль в LinkedIn: https://www.linkedin.com/in/bohdan-redchuk/
Как появилось это направление

— Концепция нейронных сетей и машинного обучения появилась давно, в 40-х годах прошлого века, но в те времена еще не было мощных вычислительных машин, чтобы реализовать задуманное, — объясняет Богдан. — Кроме того, не было и запаса накопленных данных, с которыми можно было бы работать. К началу XXI века появились и мощности, и данные, и процесс пошел: прогнозировали и темпы инфляции, и стоимость акций, используя статистические методы, ранние нейронные сетки и т.д. Это еще не машинное обучение и не искусственный интеллект, но из этого начался Data Science. По моему мнению, началом Data science в настоящем его виде в наших широтах можно считать примерно 2010 год.
Интересно:

Именно благодаря развитию Data science появились смартфоны, а также страшилки о том, что машины могут поработить мир.
Перспективы «без лимита»

— Data science — направление, которое продолжает развиваться (не во всех уголках планеты есть интернет), и даже когда будет во всех, накопление данных продолжится, и сбор и обработка их — тоже, — рассказывает Богдан. — Потребность в специалистах будет расти, это совершенно очевидно: поток данных увеличивается, появляются новые соцсети (например, Instagram и TikTok), люди оставляют о себе все больше информации в интернете, и все эти данные можно и нужно обрабатывать и монетизировать. Бесчисленные магазины любых товаров и услуг, доставка — всем нужны специалисты, умеющие обрабатывать огромное количество информации о клиентах и превращать ее в живые деньги. Кроме того, это направление, в котором можно реализовать проекты и по спасению людей.
Примеры для наглядности

Онкология. Что имеем на данный момент: множество медицинских специалистов выполняют какие-то отдельные манипуляции: делают рентген, КТ, анализы. Диагностов высочайшего уровня — единицы, они нарасхват. В том числе и поэтому остро стоит проблема необнаружения онкологических заболеваний на ранних стадиях, когда человека легко спасти. Причем здесь Data science? Можно обучить модель делать исследования, изучать и сравнивать результаты, диагностировать: болен человек или нет. На 100% безошибочного результата быть не может, но и специалисты ошибаются, особенно не очень квалифицированные. Если же модель выдаст результат, в котором не уверена, можно обратиться к человеку-диагносту для «консилиума». Но если модель уверена, что пациенту не о чем волноваться, то подтверждение врача не нужно. Представьте, насколько эффективнее может стать диагностика онкологических заболеваний и шире распространение хотя бы за счет того, что машине не надо в отпуск, она не болеет и не нуждается в обеденном перерыве, а обработать может больше данных и гораздо быстрее, чем любой, самый гениальный диагност-человек.

Доставка. Дроны-доставщики еды могут самостоятельно находить адрес и доставлять заказ из точки А в точку Б. Для этого не нужны дополнительно операторы, которые будут отслеживать выполнение.
— Таких примеров много: нелюбимая многими из-за ее неожиданной точности контекстная и таргетированная реклама, рекомендации видео на ютубе: везде используются алгоритмы машинного обучения. Бывает, только подумаешь о чем-то, тебе кажется, даже вслух не произносил, — смеется Богдан, — а соцсети уже подсовывают рекламу именно на эту тему. Не нужно здесь подозревать теорию большого заговора или изощренную слежку «большого брата», все проще: машинное обучение на основе вашего «интернет-следа». Это и есть Data science.


Прислушайтесь к себе

- Data science — это исследовательская работа для пытливого ума, — говорит Богдан. — Не ежедневная рутина, когда ты делаешь понятную работу, а эксперименты, изобретения, изучение научных работ других исследователей, постановка проблемы и поиски ее решения. Если вы любите головоломки, хотите сделать мир лучше, придумать что-то концептуально новое, если вам интересны новые разработки, прорывы в науке, феноменальные изобретения, то это прямой путь в Data science.


Понятный старт

— Я составлял программу курса таким образом, чтобы она была понятна даже тем, у кого не было опыта программирования или статистического бэкграунда, — объясняет Богдан. — Все это для того, чтобы любой человек, которому интересны научные исследования, мог освоить базовые знания и уверенно идти на собеседования для старта в Data science.


Краткое содержание курса

  • Знакомство с Python
  • Все, что нужно знать о Data science
  • Визуализация данных
  • Библиотеки для работы с табличными данными
  • Линейная алгебра, элементы высшей математики, дифферинцированного исчисления
  • Основы теории вероятности, статистика
  • Классические базовые алгоритмы машинного обучения
  • Введение в нейронные сети
  • Глубокое обучение, рекомендательные системы
  • Главные библиотеки для глубокого обучения PyTorch и TensorFlow

— После каждого блока предусмотрена курсовая работа, — отмечает Богдан. — Первый блок обучения — необходимая теория, второй — практика. В конце учебы каждый готовит финальный курсовой проект. Также в процессе учебы мы проходим все, что могут спросить на собеседовании. Повторюсь, после успешно пройденного курса вы будете обладать необходимыми знаниями и умениями, чтобы претендовать на работу в Data science.
Потребность в специалистах Data science

— Востребованность на рынке труда огромная, и спасибо можно сказать пандемии covid-19 в том числе, — говорит Богдан. — Жизнь перемещается в онлайн, потребность в специалистах формируется не только в новых сегментах, новых бизнесах, выходящих на рынок, но и у тех, кто давно обосновался, возможно, лидирует, и понимает, что без Data science уже никуда. При таком высоком спросе конкуренция — ниже, это означает, что при наличии необходимого склада ума, базовых знаний и интереса к профессии вы без труда найдете работу и сможете выстроить отличную карьеру.


Что там по зарплатам

— Разбежка в зарплатах довольно большая, но и возможности неплохие, — говорит Богдан. — Можно быть лидом в маленькой команде с зарплатой 3-4 тысячи долларов, если у тебя опыт 2-3 года, а можно получать 8-10 тысяч в большой компании и при наличии хороших скиллов. Тот момент, когда практически все зависит от человека.

Зарплатные вилки:

  • junior - 1000-2000$
  • middle - 2500-4000$
  • senior - 5000-7000$
  • lead 8-10k$

— Варианты развития: можно стать очень крутым, но узкопрофильным специалистом в какой-то конкретной области и быть лидом по Computer Vision или NLP в продукте, где под это заточены задачи; либо с накоплением опыта расширять свои знания и дорасти в компании до уровня Staff Engineer (круче, чем Senior). Можно быть лидом в разных проектах, стать DS консультантом — на этой позиции тоже высокий уровень зарплат.


Как пройти собес

— Обычно спрашивают базовые алгоритмы, какие-то конкретные детали определенных алгоритмов, — объясняет Богдан. — Но самое важное: вам опишут проблему и будут внимательно следить за ходом вашей мысли, как бы вы ее решали. Могут быть вопросы по статистике, и всех всегда интересует прошлый опыт, поэтому важно иметь собственный проект, на примере которого можно продемонстрировать наличие опыта. На нашем курсе у вас будет возможность создать собственный проект и это подойдет для собеседования. Также мы изучаем все необходимое из того, что спрашивают на собеседованиях, и тренируемся в том числе и проходить их.
Краткое резюме от TMS:

Data science — сложно, но очень интересно, открывает широкое поле для деятельности, в котором ограничения — только в вашей голове. В Data science открытые горизонты для реализации фантастических проектов, можно и мир спасти при желании. Прислушайтесь к себе, возможно, вы всегда хотели заниматься чем-то настолько перспективным. Курс от ТМС — отличный старт в профессии будущего.
Над материалом работала Ольга Мурашко

Стань востребованным IT специалистом

Наша цель — дать тебе знания и опыт, достаточные для трудоустройства в крупнейшие IT компании.