11 самых распространенных ошибок на собеседованиях по науке о данных (и как с ними справляться?)

Итак, вы готовы к предстоящему интервью по науке о данных. Вы наверняка уже перепроверили свои знания и практические навыки. Вы прошли различные контрольные списки, необходимые для технического собеседования. Теперь вы рассчитываете на свой опыт, который поможет вам пройти это собеседование. Таким образом, было бы разумно, если бы вы также просмотрели список некоторых распространенных возражений, выдвигаемых на собеседовании по науке о данных. Не смотрите дальше, так как мы тщательно подделали список специально для вас.

Вот список одиннадцати наиболее важных возражений, встречающихся в интервью по науке о данных, и как с ними справиться!

Понимание этих возражений не только поможет вам увернуться от «пуль», но и проложит путь к успеху там, где многие терпят неудачу. Читайте дальше, чтобы «заполнить» пробелы, которые могут возникнуть во время вашего интервью по науке о данных.

№1. Представление «монотонного» портфолио

«Обычное» или «монотонное» портфолио вас не убьет! Но на это часто жалуются рекрутеры, занимающиеся наукой о данных. Вы должны использовать этот шанс, чтобы продемонстрировать свои организационные и коммуникативные способности компании. Зачем отключать менеджера по найму тем, что есть у всех? Представьте себе «количество усилий, которые вы приложили для первого свидания». Даже ваш профиль в Tinder продуман до мелочей, верно? Тогда почему бы не применить тот же подход к работе вашей мечты? Тщательно составленное портфолио будет отражать вашу внимательность к деталям, серьезность позиции и эффективность коммуникации. Суть здесь в том, чтобы выделиться из толпы. Пусть ваше портфолио произведет впечатление на рекрутера. Вот как вы можете создать тщательное портфолио;

● Используйте возможности визуализации. В конце концов, специалисты по обработке и анализу данных делают это постоянно. Они используют визуальные эффекты для представления отчетов о данных и так далее. Отображение ваших проектов, достижений, навыков и т. д. в визуальном формате принесет вам двойную пользу. Во-первых, интервьюер может быстро и легко понять, что вы можете предложить компании. Во-вторых, тщательно составленное визуальное портфолио будет отражать ваши организаторские способности и креативность.

● Сформулируйте информацию таким образом, чтобы любой, кто читает ваше портфолио, понял ее за считанные секунды, скажем, около 20 секунд.

● Включите эти проекты: ваше портфолио должно состоять из проектов по очистке данных, проектов по сторителлингу данных и сквозных проектов. Все эти проекты включают алгоритмическое кодирование, очистку данных и навыки анализа. Такие проекты сразу же позволят интервьюеру начислить вам «баллы».

#2. Предоставление «небрежного» кода

Вы можете быть уверены, что ваши навыки кодирования и анализа будут проверены на собеседовании по науке о данных. Тест алгоритма кодирования напрямую покажет техническую ценность, которую вы принесете компании. Написание «неаккуратного» кода или кода со слишком большим количеством ошибок может быть последним, что вы хотели бы делать! Плохо написанный машинный код — обычное возражение рекрутеров. Если вас попросят написать программу, кодировать алгоритм или поработать с набором данных, убедитесь, что вы избегаете этих распространенных ошибок;

● При написании кода убедитесь, что вы вводите пробелы, когда это необходимо. Отсутствие пробелов не только делает строки в коде нечитаемыми, но также затрудняет «редактирование» или «исправление» в случае сбоя программы или ошибок.

● Во время написания кода пишите «только одно утверждение в строке». Пока это не ошибка, а отличная практика кодирования. При повторном просмотре кода вы можете четко прочитать каждую строку и проверить наличие ошибки.

● При очистке набора данных не забывайте тщательно удалять «выбросы» и «дубликаты». Кроме того, убедитесь, что вы внимательно относитесь к нулевым, конкретным значениям и нулевым значениям. Неправильное их определение может привести к неверным результатам.

● При добавлении преобразованных или рассчитанных переменных в набор данных не назначайте переменным числовые идентификаторы. Каждая система компании имеет свой способ генерации идентификаторов. Самостоятельное присвоение идентификаторов переменных может привести к ошибочным результатам.

● Прежде чем преобразовывать набор данных в конце, убедитесь, что вы продумали новые возможные переменные. Обычно очистка данных занимает много времени, и кандидаты устают. Вместо этого начните с чистого листа и подумайте о потенциальных переменных трансформации.

Следование приведенным выше советам может значительно улучшить качество кодов и моделей анализа данных, которые вы создаете в процессе найма. Помните об этом и делайте все возможное!

#3. Неясность в отношении должности

Это возражение является самооправданным. Если вы подходите к интервьюеру и не имеете или имеете смутное представление о должностной роли и обязанностях, ваша компетентность и решительность могут быть сомнительными! Область науки о данных имеет много тесно связанных профилей работы. Однако они сильно различаются по обязанностям и навыкам, необходимым для их выполнения. Это все равно, что взять девушку в кино и «не знать ее имени и других основных деталей». Тогда будьте готовы столкнуться с ее «холодной стороной». В то время как эта аналогия подводит итог здесь, давайте взглянем на некоторые указатели, о которых вы можете позаботиться!

● Знайте, кого они ищут: организация может искать разработчика, аналитика данных или специалиста по данным. Таким образом, вы должны понимать основные обязанности и навыки, необходимые для каждого из них. Вам имеет смысл претендовать на должность специалиста по данным, если вы разбираетесь в статистике и алгоритмах, и тому подобное. Это избавляет от путаницы между нанимателем и нанимателем.

● Знайте, «что» они ищут: вот список навыков и знаний, которые компания ищет в кандидатах на определенную должность. Например, должность специалиста по данным требует знания таких языков, как Python и R, аналитических навыков и опыта работы с различными системами баз данных, такими как SQL и NoSQL. В то время как работа архитектора данных требует знания Pig, Hive и Spark, а также глубоких знаний ETL, архитектуры базы данных, инструментов BI, хранилища данных и т. д. Суть в том, чтобы убедиться, что ваш набор навыков и опыт соответствуют открытым данным. положение науки.

● Знайте компанию: внимательно прочитайте веб-сайт компании. Знайте, кто они и чем занимаются. Также читайте кратко об основателях. Поймите, что представляют собой их продукты/услуги и куда они планируют двигаться с наплывом «больших данных»!

#4. Нет практического опыта работы с наукой о данных или проектами машинного обучения

Это одно из серьезных «красных флажков» со стороны компаний при наборе талантов для профилей науки о данных. Справедливый, если не богатый, опыт в науке о данных и проектах машинного обучения высоко ценится организациями. Существует высокая вероятность того, что отсутствие такого практического опыта в реальных проектах может помешать кандидату добиться успеха на собеседовании по науке о данных. Вы должны убедиться, что вы перечислили их в своем портфолио, чтобы отразить вашу техническую компетентность. Вот о чем вам нужно позаботиться;

● Включите проекты по очистке данных. Важным навыком, которым должен обладать любой специалист по обработке и анализу данных, является умение очищать необработанные данные и осмысленно их использовать. Интервьюер просмотрит ваше портфолио для этого проекта. Вы даже можете взяться за такой проект и поручить его себе. В конце концов, все дело в опыте! Найдите наборы данных в Интернете и завершите проект «очистки» с помощью таких инструментов, как «R Markdown» и «Блокнот Jupyter».

● Включите проекты повествования о данных. Эти проекты в основном предназначены для извлечения ценной информации из наборов данных. Короче говоря, данные «рассказывают» историю о конкретной проблеме, отношении и возможном решении. Например, если взять набор данных по международным рейсам и проанализировать задержки. Возможная связь может быть продемонстрирована между задержками рейсов и потерями для авиакомпаний. Решение может состоять в «оптимизации» времени полета или маршрутов. Идея здесь состоит в том, чтобы показать интервьюеру, что вы можете принести пользу компании.

● Включите сквозные проекты данных. Такие проекты данных отражают вашу способность создавать операционные модели пользовательского уровня. Интервьюер будет присуждать высшие баллы за такие проекты. Если у вас есть опыт, ну и хорошо. Если нет, начните создавать интегрированный надежный проект данных прямо сейчас! Например, вы можете построить проект по прогнозированию «рынка недвижимости». Вам потребуются демографические данные и данные о недвижимости. Затем вы можете построить модель с нуля, которая «предсказывает рынок недвижимости» на годовой/семестровой основе. Конечно, вы можете изучить любую другую интересующую вас тему.

#5. Отсутствие контроля над техническими аспектами науки о данных

Наука о данных и аналитика данных тесно связаны с машинным обучением и ИИ. Это действительно область высокой технической компетентности. Очевидно, что профессионал должен быть технически грамотным и быть в курсе новейших инструментов, технологий и тенденций в этой области. Интервьюер может возразить, если почувствует пробелы в ваших технических знаниях. Может быть, вы показали отличное портфолио с потрясающими проектами. Но проверить их можно только проверив свои технические знания. Вот контрольный список, который вы должны иметь в виду, прежде чем появиться на собеседовании по науке о данных.

● Внимательно относитесь к языкам кодирования: как профессионалу в области обработки данных вы должны знать все тонкости Java, C, Scala, Python, R и т. д. Даже если вы не работали со всеми из них, вы должны знать их плюсы. и минусы использования этих языков в контексте науки о данных. Например, некоторые языки подходят для обработки данных среднего уровня, некоторые для визуализации, а некоторые являются универсальными. Кроме того, убедитесь, что вы умеете программировать как минимум на двух языках программирования.

● Будьте внимательны с алгоритмами: весьма вероятно, что вас попросят написать код для алгоритма. Рекомендуется, чтобы вы понимали стандартные алгоритмы, такие как k-means, Apriori, AdaBoost, линейная регрессия, логистическая регрессия и т. д. Регулярно совершенствуйте свои навыки кодирования.

● Будьте в курсе последних отраслевых тенденций: Интернет вещей (IoT), машинное обучение и искусственный интеллект, аналитика данных и программное обеспечение с открытым исходным кодом — вот некоторые из новейших тенденций в области обработки и анализа данных. Как профессионалу в этой области настоятельно рекомендуется оставаться в курсе этих новых технологических тенденций. Интервьюер был бы рад узнать ваши знания и техническое мнение об этой отрасли и ее будущем.

#6. Отсутствие умения решать проблемы и деловой хватки

Менеджеры по найму могут быть ошеломлены вашими техническими способностями и навыками. Тем не менее, убедить их в своих способностях решать проблемы и деловых способностях просто необходимо. Это когда они действительно могут судить о вас. Часто соискатели демонстрируют безупречные навыки в сочетании с глубокими знаниями. Но когда дело доходит до решения реальных проблем, они не справляются. Мало того, компании хотят, чтобы их специалисты по науке о данных также обладали деловой хваткой. Если вы можете понять проблему с точки зрения бизнеса, вы можете предложить столь же подходящее решение. В конце концов, большие данные предназначены для решения бизнес-задач, обеспечения удобства клиентов и улучшения производственных процессов. Имейте в виду следующие моменты, сидя на собеседовании по науке о данных.

● Предлагайте интервьюеру свои ответы в «формате решения». Расскажите интервьюеру, как ваши знания и навыки могут быть использованы компанией для достижения успеха. Например, вы можете предложить улучшения продукта/услуги или теоретическое решение процесса, с которым фирма сталкивается регулярно.

● Продемонстрируйте свои деловые способности, подкрепив свои заявления конкурентной стратегией. Если вы решили рассказать о конкурентах компании, обязательно расскажите о мерах, которые ваша организация может предпринять, чтобы обогнать их.

● Предлагайте свои решения на «деловом языке» и думайте как владелец бизнеса. Ведите разговор на собеседовании в том направлении, в котором вам будет удобно давать глобальный взгляд на большие данные. Не стесняйтесь думать об инновациях и говорить об этом!

#7. Неспособность ответить на «основные вопросы»

Вы можете возиться с речью, если красивая женщина начинает говорить с вами, то же самое может произойти, когда вы участвуете в раунде лицом к лицу с рекрутером специалистов по науке о данных. Иногда мы не можем ответить на фундаментальные вопросы из-за отсутствия присутствия духа. За пределами комнаты для интервью мы все знаем все. Но там мы иногда можем вести себя глупо и пропустить какой-то вопрос науки о данных, который мы очень хорошо знаем. Здесь ваши знания и опыт не подлежат сомнению. Важна уверенность и присутствие духа. Мы составили список некоторых основных вопросов, которые могут быть заданы вам во время очного раунда. Посмотрите и ожидайте подобных вопросов в интервью по науке о данных.

● Какой язык для текстовой аналитики вы бы предпочли — R или Python?

● Объясните рекомендательные системы?

● Почему очистка данных является важным шагом в анализе данных?

● Как бы вы создали таксономию на основе неструктурированных данных для выявления основных тенденций продаж?

● Как вы будете предсказывать категоричные ответы?

● Когда вы недавно использовали функцию логистической регрессии?

● Что такое нормальное распределение?

● Перечислите основные различия между одномерным и многомерным анализом?

● Как вы будете выбирать «k» в k-средних?

Список таких вопросов неисчерпаем. Вы можете сослаться на эту ссылку, чтобы узнать больше таких вопросов. Совет хорошо готовится и хорошо доставляется!

#8. Неправильное использование жаргонизмов и терминов

Опытный или страстный специалист по науке о данных очень хорошо знает свою область. Предполагается, что вы понимаете все отраслевые жаргоны и используете их в правильном контексте. Удивительно, но это является еще одним распространенным возражением в интервью по науке о данных. Кандидаты часто злоупотребляют жаргоном или терминами в неправильном контексте.

Например, назвать набор из 150 000 наблюдений «большими данными» или заявить, что специалист по данным и аналитик данных обязательно должны быть одним и тем же.

Такие заявления можно простить раз или два. Играя с ними больше, чем это, поймаете «рентгеновское» зрение интервьюера. Если какой-либо «термин» или сценарий застает вас врасплох, лучшая политика — быть честным. Не пытайтесь «играть» с рекрутером. Будьте готовы принять и учиться. Вас оценят.

В качестве корректирующей меры просмотрите обновленный глоссарий терминов, используемых в науке о данных и терминах больших данных.

#9. Отказ от личных взглядов на будущее машинного обучения и искусственного интеллекта

Наука о данных идет рука об руку с машинным обучением и искусственным интеллектом. Интервьюер хотел бы узнать ваше личное мнение о будущем этой технологии. Но соискатели обычно не разговаривают открыто во время интервью. Эй, люди! Откройтесь и выдвиньте свое мнение с некоторыми разумными аргументами. Скажите им, «каким вы видите развитие этой технологии в следующие 5–10 лет», скажите им, «какое влияние она окажет на отрасли» и «потенциал, который таит в себе эта технология». зарекомендовать себя как любознательный и дальновидный профессионал.

#10. Быть «чрезмерно» креативным

Менеджеры по найму всегда охотятся за профессионалами, которые могут «подходить», «подходить» и «расти» в своей организации. Рекрутеры, занимающиеся наукой о данных, «боятся» двух типов людей. Один «некомпетентен», а второй — «чрезмерно креативен». Само творчество не является «дьяволом» в этом контексте. Но очень творческих людей часто считают «разрушителями» в организации. Компании часто считают, что они плохо «вписываются» в свою экосистему (если только это не творческая работа!). От специалиста по данным ожидается, что вы будете организованным, послушным и аналитическим. Быть креативным — это нормально, но убедитесь, что вы создаете сбалансированный образ (себя!) для интервьюера.

№11. Не похож на командного игрока

Компании управляются командами. Индивидуальный талант играет жизненно важную роль в достижении цели. Но большие подвиги совершаются «коллективным талантом». Помните, что интервьюер также проверит ваш командный дух. Таким образом, вы должны одинаково проявлять индивидуальные усилия и коллективные командные усилия. На самом деле, придавайте большее значение достижениям вашей команды. Это очень рекомендуется. Компании, использующие новейшие технологии больших данных, вкладывают миллионы долларов в создание качественной рабочей силы специалистов по обработке и анализу данных. Не забудьте «перечислить свои коллективные достижения» во время интервью по науке о данных!

Вы только что столкнулись с некоторыми критическими возражениями во время типичного интервью по науке о данных. Знание этих «пробелов» даст вам преимущество перед другими. Работа над ними также поможет вам в долгосрочной перспективе.

У вас есть что спросить или что-то интересное добавить к этому списку? Поделитесь с нами в поле для комментариев!