Публикации по теме 'reinforcement-learning'


Основы обучения с подкреплением
Чтобы понять время обучения в обучении с подкреплением, полезно учитывать как то, с чего мы начинаем, так и то, через что мы проходим. Я больше разговаривал с Руофаном и нашим специалистом по данным Россом Стори, чтобы выяснить, что влияет на время обучения, и найти рекомендации, чтобы сделать его максимально управляемым. Наш механизм искусственного интеллекта выберет лучший алгоритм и гиперпараметры; Ваш тщательный выбор или проектирование среды обучения может обеспечить симулятор,..

Наше исследование противовирусных препаратов на основе искусственного интеллекта для борьбы с…
Надеюсь, у вас все хорошо в эти трудные времена. С огромным удовольствием я хотел бы сообщить вам, что моя команда в Pucho создала виртуальные молекулы с помощью моделей глубокой генерации, которые могут выступать в качестве потенциальных ингибиторов COVID-19. В этой работе мы создали химические структуры потенциальных кандидатов в лекарства и рассчитали сходство с уже существующими ингибиторами протеазы SARS CoV-19. Мы также сравнили его с одобренным FDA ингибитором Ремдесивиром. Мы..

ГРАДИЕНТЫ ПОЛИТИКИ В ГЛУБОКОМ ОБУЧЕНИИ УСИЛЕНИЯ
В 2016 году агент подкрепления с глубоким обучением AlphaGobeat Ли Седол, профессиональный игрок в го с рейтингом 9 дан (высшая награда в области го). Го считалось игрой, оторванной от компьютерных алгоритмов, потому что в ней есть художественная сущность. Но AlphaGo, разработанный Google DeepMind, смог победить Ли Седола со счетом 4–1 в серии из 5 матчей. Это событие действительно всколыхнуло человеческий разум всего мира, это становится очевидным из того факта, что Ли Седол сделал..

О вмешательствах, контрфактах и ​​динамических моделях
Краткое изложение нашей рукописи по каузальному машинному обучению в NeurIPS 2019 Я рад сообщить, что наша статья Интеграция марковских процессов со структурным каузальным моделированием позволяет делать контрфактические выводы в сложных системах , написанная Каушалом Панери, Ольгой Витек и мной, будет опубликована в сборнике материалов NeurIPS 2019. 👇 TL; DR; прокрутите вниз, чтобы увидеть короткое видео с описанием бумаги. В этом посте я представлю краткое изложение этой работы,..

Введение в искусственные нейронные сети (ИНС)
Простое объяснение абсолютно для всех Всем привет, Я пишу для вас сегодня, чтобы дать простое представление об ИНС. Искусственные нейронные сети относятся к основным областям искусственного интеллекта (ИИ), которые мы обсуждали ранее как здесь . ИНС входит в категорию машинного обучения (ML), и сегодня ИНС является лидером машинного обучения. Если у вас есть сомнения относительно этой классификации, нажмите здесь и прочтите эту статью. ИНС вдохновлена ​​тем, как мозг состоит..

Обобщение в обучении с глубоким подкреплением
Переоснащение в контролируемом обучении Машинное обучение - это дисциплина, в которой, учитывая некоторые обучающие данные \ среду, мы хотели бы найти модель, которая оптимизирует некоторую цель, но с намерением хорошо работать с данными, которые никогда не рассматривались моделью во время обучения . Обычно это называется обобщением или способностью изучать что-то полезное, выходящее за рамки специфики учебной среды. Чтобы это было возможно, мы обычно требуем, чтобы..

Усиление Deep Q Learning для игры в Unity
В этом посте я рассмотрю Deep Q Networks, подход к обучению с подкреплением, который использует нейронные сети для изучения состояний и действий. Проект является частью наностепени Udacity Deep Reinforcement Learning. В рамках этого проекта я рассмотрю следующие темы и покажу, как реализовано Deep Q Learning для реальной игры на Unity: Как устроена сеть Deep Q Learning Network и как она обучается с использованием памяти воспроизведения. Чем сеть Deep Q Learning Network отличается..