Публикации по теме 'reinforcement-learning'
Мой #66DaysOfData — введение и ресурсы
Мой #66DaysOfData — введение и ресурсы
Недавно я наткнулся на хэштег #66DaysOfData в описании под видео на Youtube. Из любопытства по поводу происхождения этого хэштега и заинтригованного, казалось бы, случайным числом 66, я запустил свою поисковую систему и обнаружил, что это вызов, инициированный Кеном Джи. Задача состоит в том, чтобы заниматься концепциями и приложениями науки о данных не менее 5 минут каждый день в течение 66 дней. Все подробности об этом вы найдете на его сайте:..
Будущее с обучением с подкреплением
Часть 2: Сравнения и приложения
Если вы еще не прочитали Учебник по обучению с подкреплением , вернитесь и сначала ознакомьтесь с ним здесь . Эта статья познакомит вас с ключевыми концепциями обучения с подкреплением. Тогда вы будете готовы полностью сравнить разные типы машинного обучения.
Сравнение обучения с подкреплением с другими типами машинного обучения
Возможно, вы слышали о других типах машинного обучения, например: обучение с учителем, обучение без учителя и т. Д...
6 лучших реальных приложений обучения с подкреплением
Обучение с подкреплением (RL) основано на механизмах вознаграждения и наказания. Агент получает вознаграждение за правильные ходы и наказание за неправильные. Поступая таким образом, агент минимизирует неправильные ходы и максимизирует количество правильных.
Цель этой статьи — изучить некоторые из реальных приложений обучения с подкреплением.
1. Самоуправляемые автомобили
Использование Глубокого обучения с подкреплением для автономного вождения было предложено в нескольких статьях...
Преобразование здравоохранения с помощью обучения с подкреплением
Загрузить технический документ
Как общество, мы более разнообразны, чем когда-либо, мы более информированы, чем когда-либо, мы осознаем свою индивидуальность и гордимся ею. Сейчас, более чем когда-либо, потребители ищут возможности, которые отражают их предпочтения, стиль и потребности. Универсальный подход для всех больше не работает.
Во многих потребительских предложениях уже происходит переход от универсального подхода к персонализации. Ежедневно мы получаем персональные..
АННА. - Агент искусственной нейронной сети для MotoGP ™ 19
«Опыт игры с искусственным интеллектом»
8 июля 2019 года в Mikamai, Data Science Milan организовал встречу на тему видеоигр. Был представлен новый инструмент «A.N.N.A.» которые превосходят традиционную систему искусственного интеллекта, где каждое действие планируется заранее.
«A.N.N.A. - Агент искусственной нейронной сети для MotoGP ™ 19 », Лука Антига и Даниэле Кортиновис, Orobix S.r.l.
После объяснения Лукой об Orobix, Даниэле обрадовал присутствующих на встрече,..
Введение в глубокое обучение с подкреплением
Глубокое обучение с подкреплением (DRL) — это мощный подход, сочетающий в себе глубокое обучение и обучение с подкреплением для решения сложных задач принятия решений. В последние годы он привлек значительное внимание благодаря своей способности достигать сверхчеловеческих характеристик в различных областях, включая игры, робототехнику и автономное вождение.
Что такое обучение с подкреплением?
Обучение с подкреплением (RL) — это подобласть машинного обучения, которая фокусируется на..
Udacity Robotics ND Project 8 - Глубокая манипуляция рукой с RL
Введение
В этой статье я рассмотрю свою заявку на участие в Udacity Robotics ND Project 8 - Deep RL Arm Manipulation. Цель этого проекта - создать агента DQN и определить функции вознаграждения, чтобы научить роботизированную руку выполнять две основные задачи в моделируемой среде:
Прикоснитесь любой частью руки робота к интересующему объекту с точностью не менее 90%. Только основание захвата манипулятора должно касаться объекта с точностью не менее 80%.
Я рассмотрю детали..