Введение: обмен знаниями и передовым опытом

Тесное сотрудничество с более широким сообществом рекомендателей, в том числе с инновационными мировыми лидерами, такими как Tencent, позволяет NVIDIA использовать передовой опыт, идеи и знания в нашей среде рекомендаций. В NVIDIA мы стремимся оптимизировать создание, развертывание и оптимизацию рекомендательных систем. Наши команды инженеров участвуют в отраслевых вызовах, организуют общественные мероприятия и тесно сотрудничают с первопроходцами, такими как Tencent. Сянтин Конг, эксперт-инженер, руководит проектированием и разработкой платформы Tencent для рекламы и глубокого обучения. Пока Конг выступал на GTC Spring, мы попросили его поделиться некоторыми дополнительными идеями о создании рекомендательных систем в этом интервью.

Интервью с Сянтингом Конгом, инженером-экспертом, Tencent

Вопрос. Какова ваша роль в Tencent?

Сянтин Конг: я опытный инженер в Tencent и отвечаю за проектирование и разработку системы рекомендаций по рекламе. Я также возглавляю платформу рекламы и глубокого обучения Tencent. Наша платформа поддерживает оптимизацию модели машинного обучения, обучение и логические выводы в различных бизнес-сценариях, от рекламы и финансовых технологий до интеллектуального анализа данных в сети.

Вопросы. Над чем работает ваша команда в Tencent?

Сянтин Конг. Наша команда в основном занимается разработкой платформ машинного обучения, а мы отвечаем за разработку функций, обучение моделей и интерактивные выводы. Мы работаем над внедрением нового поколения высокопроизводительной распределенной системы обучения рекламным рекомендациям на основе GPU от 0 до 1.

Вопрос. Как ваша работа и работа вашей команды над рекомендателями связана с бизнесом Tencent в целом?

Сянтин Конг.Наша обучающая платформа по рекламным рекомендациям охватывает весь трафик Tencent. Рекламные рекомендации Tencent широко используются в таких сервисах, как WeChat, Moments, QQ, Tencent Games, Tencent Video, Tencent News и так далее. Доходы Tencent от рекламы исчисляются сотнями миллионов. Точность наших рекламных рекомендаций помогает увеличить доход от рекламы.

Вопрос. Ваша команда относительно новая? Почему Tencent решила инвестировать в рекомендателей?

Сянтин Конг:Наша команда создавалась много лет. Рекламный бизнес является относительно важным бизнесом внутри Tencent, и система рекомендаций используется для увеличения общего дохода от рекламы.

Вопрос. На каких рекомендательных системах работает ваша команда?

Сянтин Конг. Наша команда уделяет основное внимание системе рекомендаций по рекламе, отвечающей за оптимизацию платформы обучения рекламе. Система рекламных рекомендаций Tencent состоит из частей, включая автономную разработку функций, учебную платформу, онлайн-систему логического вывода, онлайн-разработку функций и игровую платформу. Рекламные рекомендации — это процесс постепенной фильтрации. Этапы сортировки включают отзыв, предварительное ранжирование и ранжирование. Каждый этап имеет различные требования. Быстрое исследование и итерация модели предъявляют более высокие требования к эффективности обучения.

Вопрос. Как ваша команда проводит обучение?

Сянтин Конг: мы организуем обмен технологиями каждые одну-две недели.

Вопрос. Как ваша команда оценивает рекомендательные системы? тонкая настройка?

Сянтин Конг. С помощью нашей системы рекомендаций мы оптимизируем стратегию алгоритма, добавляем больше образцов и функций и оцениваем, может ли это привести к увеличению дохода. Точность рекомендации по рекламе можно повысить, обучив больше выборочных данных, добавив больше выборочных функций. Но это приводит к увеличению времени обучения и влияет на частоту обновления модели. Чтобы гарантировать, что обновления модели не будут сорваны, эффективность обучения модели необходимо постоянно улучшать. После повышения производительности обучающей модели можно обучить больше данных, чтобы повысить точность модели и тем самым увеличить доход от рекламы.

Вопрос. Как вы оптимизируете свои системы рекомендаций? Например, насколько мы понимаем, Tencent использует HugeCTR для оптимизации встраивания. Как это помогло вам оптимизировать рабочий процесс?

Xiangting Kong:HugeCTR, как система обучения рекомендациям, интегрирована в систему обучения рекомендациям по рекламе, чтобы ускорить частоту обновления обучения модели, и можно обучить больше образцов для улучшения онлайн-эффектов.

Вопрос. Как вы выбираете подходящую методику, пакет, метод или платформу для поддержки своей работы?

Сянтин Конг. Выбранная нами технология или платформа должны быть совместимы с экосистемой сообщества, чтобы мы могли лучше выполнять последующие обновления.

Вопрос. Как вы решаете проблему масштабирования моделей?

Сянтин Конг. Использование более крупной модели способствует изучению большего количества функций, тем самым повышая точность модели.

Вопрос. Каков недавний успех команды?

Сянтин Конг. В нашей учебной среде было разработано распределенное решение с параллельными данными.

Вопрос. Интегрировали ли вы в последнее время определенные методы в процесс рекомендаций?

Сянтин Конг. Недавно мы интегрировали конвейер CSR [Compressed Sparse Row] в нашу систему обучения рекомендациям по рекламе. Тренировочные данные типа CSR генерируются таким образом, чтобы данные можно было напрямую считывать с графического процессора для обучения. Благодаря нашей оптимизации конвейера обработки данных нагрузка на ЦП значительно снижается, а использование графического процессора значительно улучшается.

Вопрос. Если бы руководитель группы только начинал и в настоящее время оценивает создание, развертывание и оптимизацию рекомендателей для своей компании... какой совет вы бы ему дали, чтобы помочь ему ускорить или оптимизировать рабочие процессы рекомендателей?

Xiangting Kong. Выберите проверенную техническую платформу и совместимую с экосистемой сообщества, чтобы упростить последующие обновления системы.

Дополнительные ресурсы сообщества для рассмотрения

Поскольку NVIDIA стремится оптимизировать рабочие процессы рекомендателей, мы используем передовой опыт, идеи и знания из более широкой отрасли, в том числе из новаторских первопроходцев, таких как Tencent. Дополнительные ресурсы и события, которые следует учитывать, если вы ищете дополнительные передовые методы, которые помогут ускорить рабочие процессы рекомендаций: