Вот ссылка на оптимизаторы tensorflow. И там вы можете видеть, что RMSprop принимает импульс в качестве аргумента, в то время как Адам этого не делает. Так что я в замешательстве. Оптимизация Адама притворяется оптимизацией RMSprop с импульсом, например:
Адам = RMSprop + Momentum
Но почему тогда у RMSprop есть параметр импульса, а у Адама нет?