Я поигрался с TensorFlow
и сделал общую полностью подключенную модель.
На каждом слое я применяю
sigmoid(WX + B)
который, как всем известно, хорошо работает.
Затем я начал возиться с функцией, которая применяется на каждом уровне, и обнаружил, что такие функции, как
sigmoid(U(X^2) + WX + B)
работают так же хорошо, когда они оптимизированы.
Что достигается изменением этой внутренней функции? Существует ли функциональное приложение, в котором изменение внутренней функции улучшит обучение модели, или любая функция, которая объединяет входные данные и некоторые веса, будет иметь одинаковые возможности обучения независимо от того, какие данные изучаются?
Мне известно о многих других моделях нейронных сетей (таких как сверточные сети, рекуррентные сети, остаточные сети и т. д.), поэтому я не ищу объяснения различных видов сетей (если, конечно, определенный тип сети непосредственно относится к тому, о чем я говорю). В основном интересует простой полносвязный сценарий.