Я планирую использовать нейронные сети для аппроксимации функции ценности в алгоритме обучения с подкреплением. Я хочу сделать это, чтобы ввести некоторое обобщение и гибкость в том, как я представляю состояния и действия.
Мне кажется, что нейронные сети - правильный инструмент для этого, однако у меня здесь ограниченная видимость, поскольку я не являюсь экспертом в области искусственного интеллекта. В частности, похоже, что в наши дни нейронные сети заменяются другими технологиями, например поддерживают векторные машины, но я не уверен, является ли это вопросом моды или есть какие-то реальные ограничения в нейронных сетях, которые могут обречь мой подход. У вас есть какие-либо предложения?
Спасибо,
Туннуз