Да, сейчас 2023 год, и самая горячая тема в сфере технологий — искусственный интеллект. По сути, на каждом шагу мы можем услышать, как кто-то совершает прорыв в своей области/рынке/индустрии с помощью ИИ. Каждая конференция посвящена искусственному интеллекту, а в маркетинговом контенте на таких порталах, как Linkedin, доминирует искусственный интеллект, не говоря уже о активном присутствии дискуссий об искусственном интеллекте в основных средствах массовой информации. Переоценено? Ну, наверное, немного да, не меньше. Мы стоим на пороге революции, революции, основанной на данных, но это большая тема, и позвольте мне сегодня не развивать ее дальше.

В наш век невероятного ажиотажа вокруг искусственного интеллекта каждая отрасль, включая электронную коммерцию, мечтает использовать этот замечательный инструмент, чтобы… Ну, а для чего он действительно нужен? Откуда возникла мысль, что было бы уместно иметь ИИ? Страх остаться позади? Желаете соединить бизнес электронной коммерции с текущими тенденциями и стимулировать маркетинг? Вероятно, ответ на остальные вопросы — да, но это не моя главная мотивация. Просто вы, наверное, как и подавляющее большинство, не можете четко определить, хочу, чтобы ИИ делал Х, решал/повышал эффективность Y, потому что сама работа ИИ кажется вам загадочной. Это вполне понятно, и я должен отметить — вам не нужно тратить много часов на изучение технических аспектов, необходимых для реализации, чтобы знать, чего ожидать от ИИ. В первую очередь вам нужно потратить время на понимание и структурирование бизнес-процессов вашего бизнеса. То, как работают ваши процессы, какие данные они предоставляют, где и в какой форме вы получаете прибыль от процесса, определит для нас пространство для автоматизации с использованием ИИ. Ниже я привожу небольшой пример использования приложений машинного обучения в сфере электронной коммерции, где попытаюсь объяснить, как реализовать такую ​​задачу, и поделюсь своими мыслями о том, что и как делать.

Персональная рекомендация

Абсолютная классика, потому что, в конце концов, именно в этом и состоит суть электронной коммерции — заставить клиента купить продукт. Фактически, рекомендации товаров для покупки в Интернете в настоящее время настолько популярны, что покупатель ожидает этого, и никто не собирается тратить часы на поиск содержимого веб-сайта. Ладно, зачем упоминать такое клише, которое существует еще с тех времен, когда никто не предсказывал конец света из-за бурного развития ИИ? Главным образом потому, что это отличный пример, чтобы показать, как ситуация в вашей компании определяет правильное использование машинного обучения. Сама тема, конечно, очень обширная, поэтому на этот раз я решил сосредоточиться на одной теме, а именно на проблеме холодного старта, то есть отсутствия соответствующих данных для системы рекомендаций. Принято считать, что существует два основных подхода к построению рекомендательной системы:

  • совместная фильтрация, рекомендация на основе аналогий с прошлыми событиями. Идея этого подхода заключается в том, что «если этот товар понравился пользователю, который купил то же самое, что и вы, он тоже понравится».
  • на основе содержания, рекомендации на основе характеристик системного объекта — будь то элемент, например «Если вам понравились другие предметы, красные и круглые, то вам понравится и этот предмет, потому что он красный и круглый» или пользователь «Если вам 30 лет, то вам понравятся универсалы, как и другим 30-летним в нашем система".

Хорошо, так что же выбрать? Подозреваю, что если вы впервые сталкиваетесь с этим вопросом, то содержательная рекомендация кажется более понятной и интуитивно понятной с точки зрения самой схемы. Реальный ответ на этот вопрос, как и следовало ожидать, зависит от ситуации. Основным фактором, по которому мы дифференцируем выбор метода, является масштаб данных, то есть количество субъектов и пользователей системы и сколько их у нас будет, когда мы начнем строить рекомендательную систему.

Действительно, в небольшом масштабе рекомендации, основанные на контенте, хороши. Нам просто нужно иметь характеристики каждого элемента в нашей системе, и, предложив похожие, мы, вероятно, добьемся успеха. Более того, нет необходимости беспокоиться о первоначальной проблеме холодного запуска, упомянутой ранее. У нас уже есть необходимые возможности для сравнения. При внедрении нового товара в систему достаточно описать его особенности, и система заработает без сбоев. Добавляем ли мы один элемент, десять элементов или даже сотню, это может потребовать некоторых усилий, но, безусловно, осуществимо. Однако добавить десять тысяч предметов — удачи в этом.

Здесь возникает новая проблема: как мы можем сравнивать такое количество разных объектов, используя один и тот же набор функций? Будет сложно описать/дифференцировать их все с помощью небольшого набора функций. Возможно, мы могли бы расширить набор, но при этом у вас все равно останется мифическое проклятие размерности 💀 и каждый объект, описываемый 10 000 признаков (конечно, отсутствие определенного признака тоже является своего рода признаком). Обычно это невозможно в больших масштабах — и здесь на помощь приходит коллаборативная фильтрация. Вы просто рекомендуете по аналогии.

  1. У кого-то в корзине в одной покупке стиральная машина и холодильник.
  2. Вы проверяете, что другие, у кого была стиральная машина и холодильник, взяли и утюг.
  3. Вы предлагаете утюг

Вот и все. Вас не волнует размер, форма или тот факт, что он лавандово-коричневого цвета. Обратной стороной является то, что вам необходимо выполнить второй подпункт примера, который подразумевает наличие истории предыдущих покупок, которой у вас явно нет при создании своей первой системы.

Следовательно, гибридные комбинации, как правило, являются наиболее распространенными — например, сначала вы выполняете фильтрацию на основе контента, а затем совместную фильтрацию. Или вы выполняете совместную фильтрацию на более общей основе, как в нашем примере с типом бытовой техники, плюс, когда вы знаете, что вам нужно рекомендовать утюг, вы рекомендуете утюг на основе контента в зависимости от возраста, потому что вы знаете, что молодой У студента нет 2000 долларов на IRONATRON 3000 премиум-класса с ручкой, украшенной рубинами. Как правило, решение должно быть адаптировано к вашим потребностям, и стоит поискать творческие решения, чтобы эта система работала — в вашем масштабе бизнеса, в вашей сфере деятельности и на вашем рынке.

Генерация контента

Вероятно, одна из самых горячих технологических тем последних месяцев. Скорость, с которой развивается эта отрасль искусственного интеллекта, определенно дает предприятиям возможность получить преимущество над конкурентами. Вероятно, значительная часть текущих исследований и разработок в области электронной коммерции тесно связана с генерацией с помощью ИИ. Эффективное использование сгенерированного контента обязательно принесет прибыль вашему бизнесу.

По моему мнению, люди часто хотят использовать сгенерированный ИИ неправильным образом — во-первых, они ожидают, что он будет генерировать контент на 100% безошибочно — что-то вроде «создавайте для каждого пользователя персонализированный аватар, который будет для него наиболее подходящим изображением аватара, который они могут использовать». когда-либо видел». Не только ИИ, но и художник (человек) не сможет каждый раз создавать идеальный аватар для пользователя. Поэтому я бы не стал использовать контент, созданный искусственным интеллектом, предполагая, что качество контента будет шокирующе превосходить то, что сейчас делает человек. Сила этого подхода в низкой цене контента — вероятно, в сотни раз дешевле, чем ручная человеческая работа. Конечно, дело не в том, что вы должны сразу же сделать предположение, что подход, основанный на количестве, а не на качестве, является правильным. Вы можете или даже должны работать над адаптацией контента и улучшением его качества. Если вы хотите сохранить вау-фактор, вам потребуется поддерживать определенный уровень качества.

Конечно, многие люди визуалы, поэтому стоит дополнить ваш контент изображениями, если для этого есть место, это привлечет их внимание — такой подход правильный. Вы видите очевидную потребность, потенциальную выгоду и простоту определения цели использования. Хуже, если вы создаете исчерпывающие описания продуктов, а клиенты четко не указывают, что это проблема. Я хочу сказать, что в настоящее время у нас наблюдается тенденция, когда мы все быстрее и быстрее предоставляем более короткую информацию — TikTok, снимки YT, всевозможные резюме и резюме. Так что бессмысленно создавать много контента, если за ним нет идеи, потому что само действие воспринимается получателем довольно негативно. Под идеями я имею в виду, например:

  • создание контента, который перенаправляет трафик на продукты, которые вы хотите продавать
  • поощрение пользователя повторно посетить веб-сайт, потому что он или она заинтересованы в остальной части созданной истории
  • создание описаний, которые будут хорошо ранжироваться с точки зрения SEO —
    ⚠️ реклама здесь ⚠️ — могу порекомендовать Surfer AI, проект, над которым сейчас работает наша компания.

Хотя это правда, что генерация связана со все большим количеством нового контента, не следует ограничиваться этим. Адаптация к ранее упомянутому тренду «короткой информации» также является интересным направлением. Например, извлечение ключевой информации — вы находитесь в ситуации, когда ваш поставщик не предоставляет никаких данных об устройстве, и это только длинное описание, которое вы можете получить из оцифрованного руководства. Пользовательский интерфейс вашего торгового портала создан с учетом того, что пользователю будет отображаться только важная информация. Эта ситуация ставит вас в положение, когда вам необходимо иметь информацию об определенных технических характеристиках устройства этого типа. На самом деле это довольно классическая задача машинного обучения, которая может не требовать использования LLM, но на помощь может прийти модель распознавания именованных объектов (NER). Это хорошо тем, что, как правило, это автономные модели, поэтому нам не придется платить за использование API.

В настоящее время существует хороший спектр услуг, предлагающих все виды генеративного ИИ. Если вы не работаете с конфиденциальными данными, создание PoC на основе готовых инструментов — очень хорошая идея. О каких затратах речь? Например, создание изображения в Clipdrop стоит около $0,04, а создание нескольких секунд анимации с помощью kaiber.ai — ещё $0,1. Цена вполне разумная, но долгосрочная зависимость от внешнего поставщика также может привести к изменению цен или невозможности повлиять на качество получаемой вами услуги. Также вероятно, что по мере увеличения количества запросов рентабельность внутренней службы будет расти.

Хорошо, я немного посетовал, но какие уроки я извлек из этого и что еще стоит упомянуть?

  • Вполне вероятно, что вы начнете с использования готового инструмента, поскольку обучение модели с нуля не представляется возможным. Подумайте, как вы можете переложить затраты на пользователя.
  • Если есть возможность, реализуйте PoC на основе готовых инструментов.
  • При этом у нас довольно много инструментов с открытым исходным кодом, поэтому их определенно стоит рассмотреть. Если кто-то мне не верит, вот несколько интригующих примеров:
    - StableDiffusionXL — одна из новейших моделей генерации изображений с открытым исходным кодом. Эффекты и интересные редакции этой модели вы можете найти на Civitai
    отличном репозитории с кодом для создания коротких видеороликов на основе вывода StableDiffusion из коробки
    AudioCraft от Meta — возможно, интересная идея обогатить вашу рекламу музыкальным слоем или создать интернет-вирус в социальных сетях
    Эталон моделей LLM с открытым исходным кодом — отличный источник для поиска лучшего LLM для ваших нужд. Имейте в виду большой размер этих моделей — текущий ведущий вариант модели LLaMa 2 70B имеет минимум около 150 ГБ видеопамяти.
  • Реализация проектов искусственного интеллекта обязательно займет минимум пару месяцев — это много, если учесть скорость, с которой в настоящее время развиваются технологии машинного обучения. Стоит быть готовым к переменам в процессе НИОКР.

Спасибо за внимание — дальнейшее обсуждение вариантов использования электронной коммерции во второй части статьи.

Вы заинтересованы в использовании ИИ в своем продукте? Давайте поговорим!
Запланируйте встречу на bards.ai или добавьте меня в Linkedin.