В беседе с Роханом Рао: специалистом по анализу данных, гроссмейстером Kaggle и действующим чемпионом Индии по судоку

Если собрать достаточно умных людей в одном пространстве, произойдут хорошие вещи. Эрик Херсман

Одним из преимуществ участия в H2O.ai является то, что вы можете работать с одними из самых ярких умов на планете. Здесь вы сможете тесно общаться с людьми, имеющими большой опыт, а также знания. Одним из таких специалистов здесь являются Kaggle Grandmasters, которые снова и снова доказывают свое мастерство и опыт в области Data Science.

У меня была возможность пообщаться с моим коллегой Роханом Рао, гроссмейстером Kaggle и семикратным чемпионом страны по судоку, и я подумал о том, чтобы поделиться этим разговором с сообществом. Благодаря этому разговору вы получите возможность узнать о его путешествии, вдохновении и достижениях. Вы также узнаете, что его вдохновляет на участие в соревнованиях и что поддерживает его мотивацию.

Рохан Рао, которого на Kaggle зовут Вопани, носит несколько шляп. Помимо того, что он четверной мастер Kaggle Grandmaster и специалист по анализу данных здесь, в H2O.ai, он также является опытным решателем судоку и головоломок, который широко считается лучшим решателем судоку в Индии.

Он 15-кратный чемпион страны по судоку и головоломкам, первый индиец, вошедший в десятку лучших в мире, и единственный индиец, поднявшийся на подиум (топ-3) на чемпионатах Азии 2018 и 2019 годов. недавно выиграл последний национальный чемпионат по судоку, а также занял 2-е место в престижном турнире Brands Brain International Challenge, который прошел в Бангкоке в июле этого года.



Вот отрывок из моего разговора с Роханом:

  • Вы первый индиец, вошедший в десятку лучших в мире по судоку? Что изначально вдохновило вас начать заниматься судоку?

Рохан: Я всегда увлекался логикой, числами, закономерностями и спортом с самого раннего детства. Я научился решать судоку в 2005 году, за день до соревнований в Мумбаи, на которых я выиграл в категории до 16 лет. Это был переломный момент для меня, и я начал активно заниматься этим из интереса и хобби.

Поскольку я по натуре умею решать проблемы, я рассматриваю судоку как задачу, которую нужно решить. Прохождение логического пути исключения и расстановки цифр, чтобы в конечном итоге прийти к решению, всегда дает мне чувство выполненного долга и счастья.

Практика, подготовка, упорный труд и много усилий на протяжении многих лет позволили мне выиграть различные национальные и международные чемпионаты. Это дало мне возможность представлять свою страну в спорте и помогло мне достичь моей цели - стать первым индийцем, вошедшим в топ-10 в мире и в топ-3 в Азии.

  • Как вы заинтересовались наукой о данных? Разве в этом сыграла роль умение решать головоломки?

Рохан: Получив степень магистра прикладной статистики, я искал области, в которых я мог бы применять статистику для решения реальных проблем. Я пришел к выводу, что наука о данных (DS) - это увлекательная область работы, в которой используется изрядное количество математики и статистики. К счастью, в 2013 году я получил свою первую работу в консалтинговой компании по машинному обучению (ML), где и начал свою карьеру.

Судоку и ML начинались независимо как отдельные области интересов и работы. Поначалу было трудно угнаться за обоими, но постепенно обнаружились области, в которых они оба пересекаются.

Судоку научил меня думать, разрабатывать стратегию и планировать решение конкретной проблемы. Это помогло мне развить умственную выносливость, скорость и способность находить важные элементы решений, которые выделяются.

С другой стороны, машинное обучение научило меня умно объединять теоретические знания и идеи в практические решения. Это заставило меня оценить важность анализа, многомерного понимания и концепции оптимизации решений до предела.

  • Стать гроссмейстером Kaggle - впечатляющий подвиг, требующий большого упорства и упорного труда. Как началось ваше свидание с Kaggle и что поддерживало вас на протяжении всего пути вашего гроссмейстера?

Рохан: Мне посчастливилось иметь отличного наставника в течение первых двух лет работы, который познакомил меня с Kaggle и тесно сотрудничал со мной. Мой дух соревнований, голод и стремление к успеху взяли верх, что было постоянной мотивацией на протяжении всего моего пути.

Стать гроссмейстером Kaggle, несомненно, было решающим моментом в моей карьере, и это потребовало некоторых личных жертв и большой поддержки со стороны семьи и друзей.

  • Какие ресурсы вам больше всего нравятся, когда речь идет о науке о данных в целом? Какие языки программирования вы предпочитаете?

Рохан: Kaggle, Google и Stackoverflow были бы моей тройкой лучших, и это совсем не удивительно. В зависимости от постановки проблемы существует множество полезных репозиториев Github и библиотек / пакетов с открытым исходным кодом, которые могут повысить ценность при создании решения.

Я начал с R, и он остается моим предпочтительным языком для DS. Впоследствии я изучил Python вместе со Scala, которую я использовал последние несколько лет для создания готовых к работе решений.

  • Многих людей, особенно новичков, не устраивает Kaggle? Есть ли предложения о том, как им следует подходить к конкурсу по науке о данных?

Рохан: Kaggle стал огромным и обширным с кладовой полезной информации, кодов, идей, обсуждений и решений. Поначалу это может показаться немного ошеломляющим из-за огромных размеров и глубины доступного контента.

Я предлагаю проложить путь и, в зависимости от цели, определить небольшие задачи Kaggle и посвятить время их выполнению. На начальных этапах лучше полностью сосредоточиться на одном соревновании. Можно начать с изучения ядер и принять участие в обсуждениях этого конкурса. Затем можно принять участие в различных соревнованиях, одно за другим, чтобы получить максимальную известность.

  • Как специалист по данным в H2O.ai, какова ваша роль и в каких конкретных областях вы работаете?

Рохан: Как мастер Kaggle в H2O.ai, моя роль в первую очередь заключается в разработке продуктов H2O, таких как AI без драйверов, чтобы помочь нашим клиентам создавать решения машинного обучения для широкого круга варианты использования в различных отраслях, включая финансовые технологии, производство, розничную торговлю, здравоохранение, маркетинг. Я специализируюсь на системах рекомендаций, моделировании кредитных рисков, экосистеме цифровых платежей и оптимизации кампаний цифрового маркетинга.

Задача двоякая: создание независимой от отрасли платформы для масштабируемых решений машинного обучения, а также обеспечение интеллекта с помощью различных рецептов, относящихся к данным, моделям или экспертным знаниям в предметной области, и возможность объединить все в единый комплексный продукт.

  • Какие из лучших вещей, которые вы узнали с помощью Kaggle, вы применяете в своей профессиональной работе в H2O.ai?

Рохан: В Kaggle существует множество проблем, каждая из которых имеет свой способ обработки данных, построения моделей и оптимизации решений. Самым важным уроком для меня стала способность понять набор данных, а затем разработать структуру решения для науки о данных.

Я автоматизировал многие компоненты рабочего процесса машинного обучения, чтобы повысить эффективность работы над соревнованиями Kaggle. Сейчас я использую многие из этих модулей для улучшения продуктов H2O.ai, таких как ИИ без драйверов, для создания решений машинного обучения в различных отраслях, чтобы они были доступны в более широкой экосистеме.

  • В последнее время много шумихи вокруг машинного обучения и искусственного интеллекта в целом. Что вы думаете об этом?

Рохан: Важно понимать, что ИИ совершает огромный прорыв в различных отраслях и имеет светлое будущее в продуктах и ​​приложениях, построенных на его основе. Также важно понимать, что почти все инновационные решения чрезвычайно сложно разработать, они были разработаны в течение многих лет исследований и не являются просто волшебством.

Он медленно и непременно станет неотъемлемой частью нашей жизни во многих отношениях, которые, мы надеемся, решат многие проблемы в мире, и со временем его станет легче понять, создать и поделиться.

  • Есть ли какие-то конкретные области или проблемы, в которых вы хотели бы применить свой опыт в области машинного обучения?

Рохан: Прогнозирование преступлений с использованием данных и машинного обучения по всему миру - одна из моих самых важных областей интересов, которая может оказать значительное положительное влияние в мире.

  • Какие-либо советы для соискателей науки о данных, которые только начали или хотят начать свой путь в науке о данных?

Рохан: DS становится обширным зонтиком с множеством интересных работ и проектов в самых разных отраслях. Многие соискатели увязли в огромном содержании и глубине доступной информации.

Я бы посоветовал другим определить область, которая соответствует их навыкам, а затем работать над решением проблемы в этом направлении. Крайне важно иметь практический опыт в любой работе с DS, потому что только тогда можно понять все мельчайшие детали профиля. Также предпочтительнее работать над проектами DS в составе компании / команды в качестве штатного сотрудника, поскольку это дает возможность увидеть весь рабочий процесс проекта DS.

Это требует значительных усилий, времени, терпения и жертв. Помните об этом, чтобы лучше подготовиться к быстро меняющемуся сообществу DS и повысить ваши шансы на успех, а также получить удовольствие от работы и путешествий в процессе.

Успех никогда не бывает легким. Часто это трудный путь с множеством препятствий и препятствий. Терпение, настойчивость и практика - три добродетели, составляющие столпы успеха. Гроссмейстеры рождаются не за один день. Вместо этого они проводят дни и годы, неустанно работая для достижения своих целей. Надеюсь, этот разговор также вдохновит и мотивирует вас работать над достижением желаемой цели в жизни.