Статьи по тематике reinforcement-learning

Публикации по теме 'reinforcement-learning'

Мой #66DaysOfData — введение и ресурсы

Мой #66DaysOfData — введение и ресурсы Недавно я наткнулся на хэштег #66DaysOfData в описании под видео на Youtube. Из любопытства по поводу происхождения этого хэштега и заинтригованного, казалось бы, случайным числом 66, я запустил свою поисковую систему и обнаружил, что это вызов, инициированный Кеном Джи. Задача состоит в том, чтобы заниматься концепциями и приложениями науки о данных не менее 5 минут каждый день в течение 66 дней. Все подробности об этом вы найдете на его сайте:..

Будущее с обучением с подкреплением

Часть 2: Сравнения и приложения Если вы еще не прочитали Учебник по обучению с подкреплением , вернитесь и сначала ознакомьтесь с ним здесь . Эта статья познакомит вас с ключевыми концепциями обучения с подкреплением. Тогда вы будете готовы полностью сравнить разные типы машинного обучения. Сравнение обучения с подкреплением с другими типами машинного обучения Возможно, вы слышали о других типах машинного обучения, например: обучение с учителем, обучение без учителя и т. Д...

6 лучших реальных приложений обучения с подкреплением

Обучение с подкреплением (RL) основано на механизмах вознаграждения и наказания. Агент получает вознаграждение за правильные ходы и наказание за неправильные. Поступая таким образом, агент минимизирует неправильные ходы и максимизирует количество правильных. Цель этой статьи — изучить некоторые из реальных приложений обучения с подкреплением. 1. Самоуправляемые автомобили Использование Глубокого обучения с подкреплением для автономного вождения было предложено в нескольких статьях...

Преобразование здравоохранения с помощью обучения с подкреплением

Загрузить технический документ Как общество, мы более разнообразны, чем когда-либо, мы более информированы, чем когда-либо, мы осознаем свою индивидуальность и гордимся ею. Сейчас, более чем когда-либо, потребители ищут возможности, которые отражают их предпочтения, стиль и потребности. Универсальный подход для всех больше не работает. Во многих потребительских предложениях уже происходит переход от универсального подхода к персонализации. Ежедневно мы получаем персональные..

АННА. - Агент искусственной нейронной сети для MotoGP ™ 19

«Опыт игры с искусственным интеллектом» 8 июля 2019 года в Mikamai, Data Science Milan организовал встречу на тему видеоигр. Был представлен новый инструмент «A.N.N.A.» которые превосходят традиционную систему искусственного интеллекта, где каждое действие планируется заранее. «A.N.N.A. - Агент искусственной нейронной сети для MotoGP ™ 19 », Лука Антига и Даниэле Кортиновис, Orobix S.r.l. После объяснения Лукой об Orobix, Даниэле обрадовал присутствующих на встрече,..

Введение в глубокое обучение с подкреплением

Глубокое обучение с подкреплением (DRL) — это мощный подход, сочетающий в себе глубокое обучение и обучение с подкреплением для решения сложных задач принятия решений. В последние годы он привлек значительное внимание благодаря своей способности достигать сверхчеловеческих характеристик в различных областях, включая игры, робототехнику и автономное вождение. Что такое обучение с подкреплением? Обучение с подкреплением (RL) — это подобласть машинного обучения, которая фокусируется на..

Udacity Robotics ND Project 8 - Глубокая манипуляция рукой с RL

Введение В этой статье я рассмотрю свою заявку на участие в Udacity Robotics ND Project 8 - Deep RL Arm Manipulation. Цель этого проекта - создать агента DQN и определить функции вознаграждения, чтобы научить роботизированную руку выполнять две основные задачи в моделируемой среде: Прикоснитесь любой частью руки робота к интересующему объекту с точностью не менее 90%. Только основание захвата манипулятора должно касаться объекта с точностью не менее 80%. Я рассмотрю детали..