Неужели нейронные сети отказываются от ПО?

Я планирую использовать нейронные сети для аппроксимации функции ценности в алгоритме обучения с подкреплением. Я хочу сделать это, чтобы ввести некоторое обобщение и гибкость в том, как я представляю состояния и действия.

Мне кажется, что нейронные сети - правильный инструмент для этого, однако у меня здесь ограниченная видимость, поскольку я не являюсь экспертом в области искусственного интеллекта. В частности, похоже, что в наши дни нейронные сети заменяются другими технологиями, например поддерживают векторные машины, но я не уверен, является ли это вопросом моды или есть какие-то реальные ограничения в нейронных сетях, которые могут обречь мой подход. У вас есть какие-либо предложения?

Спасибо,
Туннуз


person tunnuz    schedule 02.08.2011    source источник


Ответы (4)


Это правда, что нейронные сети больше не в моде, как когда-то, но вряд ли они умерли. Общей причиной того, что они попали в немилость, стало появление машины опорных векторов, поскольку они сходятся во всем мире и требуют меньшего количества параметров.

Тем не менее, SVM очень обременительны для реализации и не могут быть естественным образом обобщены на обучение с подкреплением, как это делают ANN (SVM в основном используются для автономных задач принятия решений).

Я бы посоветовал вам придерживаться ИНС, если ваша задача кажется подходящей для одной, поскольку в сфере обучения с подкреплением ИНС по-прежнему находятся на переднем крае в производительности.

Вот отличное место для начала; просто ознакомьтесь с разделом «Изучение временной разницы», так как это стандартный способ, которым ИНС решают задачи обучения с подкреплением.

Одно предостережение: недавняя тенденция в машинном обучении заключается в использовании множества различных обучающих агентов вместе с помощью упаковки или ускорения. Хотя я не видел этого так часто в обучении с подкреплением, я уверен, что использование этой стратегии все равно будет гораздо более мощным, чем одна ИНС. Но если вам действительно не нужна производительность мирового класса (именно она выиграла конкурс netflix), я бы избегал этой чрезвычайно сложной техники.

person zergylord    schedule 02.08.2011
comment
Аргумент сложности реализации SVM спорный, поскольку всю тяжелую работу берут на себя библиотеки. - person Don Reba; 03.08.2011
comment
В некоторых случаях вы правы, но, конечно, не во всех. Он не упомянул свой язык программирования или мотивацию, так что ручная реализация не исключена. - person zergylord; 03.08.2011
comment
Глобальная конвергенция? Никакая аппроксимационная техника не может гарантировать глобальную сходимость без бесконечных параметров. - person Panagiotis Panagi; 08.08.2011
comment
Любой метод аппроксимации, при котором результат может быть истолкован как выпуклая функция, гарантированно сходится к глобальному решению ... Теперь я не уверен, что это так для SVM, поэтому, пожалуйста, предоставьте некоторые доказательства того, что они фактически аппроксимируют локально и я соответственно изменю свой ответ. - person zergylord; 08.08.2011
comment
Тогда вы должны были сказать, что когда аппроксимируемая функция является выпуклой, то глобальная сходимость гарантирована. Но это только частный случай. В общем, любой метод аппроксимации (независимо от того, какой инструмент вы используете) может гарантировать ограниченность ошибки аппроксимации только в пределах компактной (конечной) области. Вне этой области ничего нельзя сказать об ошибке аппроксимации. Если вы хотите увеличить размер этой области аппроксимации, вам нужно указать больше параметров. Число параметров стремится к бесконечности, поскольку область приближения стремится ко всему пространству. - person Panagiotis Panagi; 09.08.2011
comment
В качестве доказательства взгляните на www2.in.tu-clausthal .de / ~ hammer / paper / postscripts / (стр. 5, абзац: Возможности аппроксимации). Суть в том, что инструмент, который вы используете для аппроксимации, не имеет большого значения, когда речь идет о наилучшей достижимой производительности аппроксимации. Все эти методы следуют теореме об универсальной аппроксимации. Который в основном утверждает, что любой метод аппроксимации приведет к неизбежной ошибке аппроксимации, которая: (а) может быть сделана сколь угодно малой внутри компактной (локальной, конечной) области, (б) может стать большой за пределами этой области. - person Panagiotis Panagi; 09.08.2011
comment
Спасибо за ссылку на статью; после просмотра выясняется, что мы просто разговаривали друг с другом. Я никогда не имел в виду, что SVM могут идеально смоделировать произвольную функцию для всех входных значений; как вы отметили, ни один разумный алгоритм не может этого сделать. Я просто утверждал, что SVM избегают проблемы локальных оптимумов, которые можно сформулировать как сходящиеся к глобальным оптимумам. Это утверждение подтверждается в той самой статье, которую вы процитировали во введении. - person zergylord; 09.08.2011
comment
Суть в том, что инструмент, который вы используете для аппроксимации, не имеет большого значения, когда речь идет о наилучшей достижимой производительности аппроксимации - это верно только в самом техническом смысле, который можно вообразить. В любом реальном приложении наилучшая достижимая производительность аппроксимации будет далека от теоретического предела, поэтому «инструмент», который вы используете, имеет очень значение. - person zergylord; 09.08.2011
comment
Я имел в виду, что ни один инструмент не превосходит другой, все они могут потенциально достичь одинаковых характеристик аппроксимации, предел которых дается теоремой универсальной аппроксимации. На практике я согласен, что некоторые методы сложнее настроить, чем другие. - person Panagiotis Panagi; 10.08.2011
comment
Спасибо за ссылку на статью; после просмотра выясняется, что мы просто разговаривали друг с другом. Извините за недопонимание. - person Panagiotis Panagi; 10.08.2011
comment
Также может быть уместным отметить, что все вышеперечисленное применимо только к нейронным сетям с прямой связью, обученным с помощью обратного распространения. Я предполагаю, что это то, что вы бы использовали, но на всякий случай я подумал, что укажу на это. - person seaotternerd; 25.06.2013

Мне кажется, что нейронные сети возвращаются. Например, в этом году на ICML 2011 было много статей о нейронных сетях. Я бы точно не считал их заброшенными. При этом я бы не стал использовать их для обучения с подкреплением.

person carlosdc    schedule 07.08.2011

Нейронные сети - достойный общий способ аппроксимации сложных функций, но они редко бывают лучшим выбором для какой-либо конкретной учебной задачи. Их сложно спроектировать, они медленно сходятся и застревают в локальных минимумах.

Если у вас нет опыта работы с нейронными сетями, возможно, вам будет удобнее использовать более простой метод обобщения RL, например грубое кодирование.

person Don Reba    schedule 02.08.2011

Теоретически было доказано, что нейронные сети могут аппроксимировать любую функцию (при бесконечном количестве скрытых нейронов и необходимых входных данных), поэтому нет, я не думаю, что нейронные сети когда-либо будут отказываться от программного обеспечения.

SVM великолепны, но их нельзя использовать для всех приложений, в то время как нейронные сети можно использовать для любых целей.

Использование нейронных сетей в сочетании с обучением с подкреплением является стандартом и хорошо известно, но будьте осторожны при построении и отладке конвергенции вашей нейронной сети, чтобы убедиться, что она работает правильно, поскольку нейронные сети, как известно, сложно реализовать и правильно обучить.

Также будьте очень осторожны с представлением проблемы, которую вы даете своей нейронной сети (то есть: входные узлы): могли бы вы или мог бы эксперт решить проблему, учитывая то, что вы даете в качестве входных данных в свою сеть? Очень часто люди, внедряющие нейронные сети, не предоставляют достаточно информации, чтобы нейронная сеть могла рассуждать, это не так уж редко, так что будьте осторожны с этим.

person gaborous    schedule 28.12.2013