Я пытался понять softmax и придумал простой пример ниже.
def simpleSoftmax(allValues):
return np.exp(allValues) / np.sum(np.exp(allValues), axis=0)
Вызов
simpleSoftmax([3,2,4])
array([ 0.24472847, 0.09003057, 0.66524096])
В этом случае 0,66 имеет более высокую вероятность. Понял.
Теперь это должно быть сделано как
(3/9)*100 = 33.33
(2/9)*100 = 22.22
(4/9)*100 = 44.44
Теперь, если мы увидим, что 44,44 принимает более высокое значение, и результат такой же, как у softmax.
Я уверен, что за этим softmax скрывается что-то интересное в отношении устаревшего усреднения. Однако я не понимаю, какая разница между этими двумя способами?