Специалист по анализу данных - самая сексуальная работа 21 века… Только не говорите специалистам по данным

Несколько лет назад Harvard Business Review объявил Data Scientist самой сексуальной карьерой 21 века. Сегодня наука о данных пользуется большим спросом. Glassdoor назвал ее лучшей работой 2016 года, а LinkedIn назвал анализ данных и интеллектуальный анализ вторым по востребованию навыком в 2017 году. Компании находятся в жесткой конкуренции за квалифицированные данные. профессионалов, и во многих странах спрос просто превышает предложение.

Согласно исследованию McKinsey, к 2018 году спрос в США будет на 50–60 процентов выше предложения. Это означает, что, по оценкам, не хватает от 140 000 до 190 000 специалистов по обработке данных и 1,5 миллиона менеджеров и аналитиков.

Почему наука о данных так популярна?

Большие данные произвели революцию во всех отраслях, от производства и здравоохранения до маркетинга и даже спорта. В последние годы компании во всех отраслях стали применять науку о данных. В то же время это помогло улучшить технологии искусственного интеллекта (AI) и машинного обучения (ML).

Недавний анализ, проведенный Gartner, показал, что ИИ и машинное обучение являются основными движущими силами технологических инноваций в 2017 году. Поскольку большие данные являются топливом, на котором движутся эти новые технологии, спрос на специалистов по обработке данных будет продолжать быстро расти.

Со средним доходом в 104 000 долларов в год специалисты по обработке данных являются одними из самых высокооплачиваемых и востребованных должностей на данный момент. Однако у самой сексуальной профессии века есть и негламурная сторона.

Наука о данных не для Instagram

Как и в любой карьере и, возможно, в большинстве случаев в жизни, в науке о данных есть гораздо менее привлекательная сторона. Нечасто можно увидеть селфи ученых в бикини, развалившихся на пляже, хотя это было бы неплохо. Статистика показывает, что вы с большей вероятностью увидите этих невероятно умных людей, сгорбившихся за компьютером, готовящим большие наборы данных для обучения алгоритмов машинного обучения. Недавний опрос показал, что специалисты по обработке данных тратят 60% своего времени на очистку данных, а еще 19% посвящено сбору наборов данных и управлению ими.

Другими словами, сбор и подготовка данных отнимают у них около 80% времени! Тем не менее, согласно тому же опросу, 76% специалистов по данным считают, что это наименее приятная часть их работы.

Алгоритмы машинного обучения хороши ровно настолько, насколько хороши данные, которые их питают, поэтому подготовка данных является важной функцией, необходимой для правильного аннотирования, категоризации и выявления шаблонов, которые делают алгоритмы более умными. Но в этом нет ничего сексуального. Процесс очень трудоемкий и утомительный. Ужасная правда заключается в том, что специалисты по обработке данных проводят большую часть своего времени, делая то, что им просто не нравится. В то время можно было бы сосредоточиться на инновационных технологиях, которые могут изменить мир, но это не должно быть так.

Как вернуть сексуальность

Текущий процесс подготовки данных не только кропотливый, но и делает компании уязвимыми для ошибок. Даже когда информация берется из лучших источников, она часто чревата опечатками, ошибками, дырами и другими ошибками, которые требуют тщательной очистки.

Необходимо собрать, подготовить и проанализировать большой объем высококачественных данных, прежде чем их можно будет использовать осмысленным образом. Только после подготовки данных специалисты по данным могут преобразовать информацию в действия и алгоритмы. Тем не менее, текущая модель спроектирована так, что очень мало времени тратится на функцию, которая дает наибольшие результаты.

Эта модель науки о данных ограничивает инновации, отнимая драгоценное время и ресурсы. К счастью, необязательно выполнять эту работу самостоятельно. CloudFactory упростила для предприятий возможность разгрузить подготовку данных для обучения алгоритмов машинного обучения и других процессов, требующих обработки больших объемов данных, так что специалисты по обработке данных могут свободно заниматься тем, что у них лучше всего получается… внедрять инновации. Мы специализируемся на подготовке и организации наборов данных и работаем с такими компаниями, как Microsoft, над внедрением их в создание инновационных технологий искусственного интеллекта, машинного обучения и других сложных технологий. Узнайте больше о том, как CloudFactory может помочь в реализации ваших проектов в области науки о данных, здесь.

Отметьте здесь для получения дополнительной информации.

Первоначально опубликовано на blog.cloudfactory.com.