как вывод тензорного потока в fp16 с моделью, обученной в fp32

Есть ли какой-нибудь простой способ достижения наилучшей производительности fp16 в NV V100/P100? Например. У меня есть модель и реализация, обучаемые в fp32. Приложение работает отлично. Теперь я хотел бы изучить опыт fp16. Есть ли простой способ включить это.


person xiaoyong    schedule 03.10.2017    source источник
comment
у меня очень похожая проблема. Я хочу взять свою обученную модель fp32 и выполнить вывод с помощью fp16. Вы поняли нашу или любую идею, как это сделать?   -  person user179156    schedule 02.11.2018


Ответы (1)


попробуйте этот метод, и я обнаружил, что вывод с fp16 быстрее на GPU с архитектурой Pascal, может кто-нибудь дать объяснение?

person 7oud    schedule 31.01.2019