Неужели нейронные сети отказываются от ПО?

Я планирую использовать нейронные сети для аппроксимации функции ценности в алгоритме обучения с подкреплением. Я хочу сделать это, чтобы ввести некоторое обобщение и гибкость в том, как я представляю состояния и действия.

Мне кажется, что нейронные сети - правильный инструмент для этого, однако у меня здесь ограниченная видимость, поскольку я не являюсь экспертом в области искусственного интеллекта. В частности, похоже, что в наши дни нейронные сети заменяются другими технологиями, например поддерживают векторные машины, но я не уверен, является ли это вопросом моды или есть какие-то реальные ограничения в нейронных сетях, которые могут обречь мой подход. У вас есть какие-либо предложения?

Спасибо,
Туннуз

neural-network reinforcement-learning

tunnuz 02.08.2011 источник

Ответы (4)

arrow_upward
3
arrow_downward

Это правда, что нейронные сети больше не в моде, как когда-то, но вряд ли они умерли. Общей причиной того, что они попали в немилость, стало появление машины опорных векторов, поскольку они сходятся во всем мире и требуют меньшего количества параметров.

Тем не менее, SVM очень обременительны для реализации и не могут быть естественным образом обобщены на обучение с подкреплением, как это делают ANN (SVM в основном используются для автономных задач принятия решений).

Я бы посоветовал вам придерживаться ИНС, если ваша задача кажется подходящей для одной, поскольку в сфере обучения с подкреплением ИНС по-прежнему находятся на переднем крае в производительности.

Вот отличное место для начала; просто ознакомьтесь с разделом «Изучение временной разницы», так как это стандартный способ, которым ИНС решают задачи обучения с подкреплением.

Одно предостережение: недавняя тенденция в машинном обучении заключается в использовании множества различных обучающих агентов вместе с помощью упаковки или ускорения. Хотя я не видел этого так часто в обучении с подкреплением, я уверен, что использование этой стратегии все равно будет гораздо более мощным, чем одна ИНС. Но если вам действительно не нужна производительность мирового класса (именно она выиграла конкурс netflix), я бы избегал этой чрезвычайно сложной техники.

zergylord 02.08.2011

comment

Аргумент сложности реализации SVM спорный, поскольку всю тяжелую работу берут на себя библиотеки. - Don Reba; 03.08.2011

comment

В некоторых случаях вы правы, но, конечно, не во всех. Он не упомянул свой язык программирования или мотивацию, так что ручная реализация не исключена. - zergylord; 03.08.2011

comment

Глобальная конвергенция? Никакая аппроксимационная техника не может гарантировать глобальную сходимость без бесконечных параметров. - Panagiotis Panagi; 08.08.2011

comment

Любой метод аппроксимации, при котором результат может быть истолкован как выпуклая функция, гарантированно сходится к глобальному решению ... Теперь я не уверен, что это так для SVM, поэтому, пожалуйста, предоставьте некоторые доказательства того, что они фактически аппроксимируют локально и я соответственно изменю свой ответ. - zergylord; 08.08.2011

comment

Тогда вы должны были сказать, что когда аппроксимируемая функция является выпуклой, то глобальная сходимость гарантирована. Но это только частный случай. В общем, любой метод аппроксимации (независимо от того, какой инструмент вы используете) может гарантировать ограниченность ошибки аппроксимации только в пределах компактной (конечной) области. Вне этой области ничего нельзя сказать об ошибке аппроксимации. Если вы хотите увеличить размер этой области аппроксимации, вам нужно указать больше параметров. Число параметров стремится к бесконечности, поскольку область приближения стремится ко всему пространству. - Panagiotis Panagi; 09.08.2011

comment

В качестве доказательства взгляните на www2.in.tu-clausthal .de / ~ hammer / paper / postscripts / (стр. 5, абзац: Возможности аппроксимации). Суть в том, что инструмент, который вы используете для аппроксимации, не имеет большого значения, когда речь идет о наилучшей достижимой производительности аппроксимации. Все эти методы следуют теореме об универсальной аппроксимации. Который в основном утверждает, что любой метод аппроксимации приведет к неизбежной ошибке аппроксимации, которая: (а) может быть сделана сколь угодно малой внутри компактной (локальной, конечной) области, (б) может стать большой за пределами этой области. - Panagiotis Panagi; 09.08.2011

comment

Спасибо за ссылку на статью; после просмотра выясняется, что мы просто разговаривали друг с другом. Я никогда не имел в виду, что SVM могут идеально смоделировать произвольную функцию для всех входных значений; как вы отметили, ни один разумный алгоритм не может этого сделать. Я просто утверждал, что SVM избегают проблемы локальных оптимумов, которые можно сформулировать как сходящиеся к глобальным оптимумам. Это утверждение подтверждается в той самой статье, которую вы процитировали во введении. - zergylord; 09.08.2011

comment

Суть в том, что инструмент, который вы используете для аппроксимации, не имеет большого значения, когда речь идет о наилучшей достижимой производительности аппроксимации - это верно только в самом техническом смысле, который можно вообразить. В любом реальном приложении наилучшая достижимая производительность аппроксимации будет далека от теоретического предела, поэтому «инструмент», который вы используете, имеет очень значение. - zergylord; 09.08.2011

comment

Я имел в виду, что ни один инструмент не превосходит другой, все они могут потенциально достичь одинаковых характеристик аппроксимации, предел которых дается теоремой универсальной аппроксимации. На практике я согласен, что некоторые методы сложнее настроить, чем другие. - Panagiotis Panagi; 10.08.2011

comment

Спасибо за ссылку на статью; после просмотра выясняется, что мы просто разговаривали друг с другом. Извините за недопонимание. - Panagiotis Panagi; 10.08.2011

comment

Также может быть уместным отметить, что все вышеперечисленное применимо только к нейронным сетям с прямой связью, обученным с помощью обратного распространения. Я предполагаю, что это то, что вы бы использовали, но на всякий случай я подумал, что укажу на это. - seaotternerd; 25.06.2013

arrow_upward
2
arrow_downward

Мне кажется, что нейронные сети возвращаются. Например, в этом году на ICML 2011 было много статей о нейронных сетях. Я бы точно не считал их заброшенными. При этом я бы не стал использовать их для обучения с подкреплением.

carlosdc 07.08.2011

arrow_upward
0
arrow_downward

Нейронные сети - достойный общий способ аппроксимации сложных функций, но они редко бывают лучшим выбором для какой-либо конкретной учебной задачи. Их сложно спроектировать, они медленно сходятся и застревают в локальных минимумах.

Если у вас нет опыта работы с нейронными сетями, возможно, вам будет удобнее использовать более простой метод обобщения RL, например грубое кодирование.

Don Reba 02.08.2011

arrow_upward
0
arrow_downward

Теоретически было доказано, что нейронные сети могут аппроксимировать любую функцию (при бесконечном количестве скрытых нейронов и необходимых входных данных), поэтому нет, я не думаю, что нейронные сети когда-либо будут отказываться от программного обеспечения.

SVM великолепны, но их нельзя использовать для всех приложений, в то время как нейронные сети можно использовать для любых целей.

Использование нейронных сетей в сочетании с обучением с подкреплением является стандартом и хорошо известно, но будьте осторожны при построении и отладке конвергенции вашей нейронной сети, чтобы убедиться, что она работает правильно, поскольку нейронные сети, как известно, сложно реализовать и правильно обучить.

Также будьте очень осторожны с представлением проблемы, которую вы даете своей нейронной сети (то есть: входные узлы): могли бы вы или мог бы эксперт решить проблему, учитывая то, что вы даете в качестве входных данных в свою сеть? Очень часто люди, внедряющие нейронные сети, не предоставляют достаточно информации, чтобы нейронная сеть могла рассуждать, это не так уж редко, так что будьте осторожны с этим.

gaborous 28.12.2013

Неужели нейронные сети отказываются от ПО?

Ответы (4)

Похожие вопросы