Есть ли какой-нибудь простой способ достижения наилучшей производительности fp16 в NV V100/P100? Например. У меня есть модель и реализация, обучаемые в fp32. Приложение работает отлично. Теперь я хотел бы изучить опыт fp16. Есть ли простой способ включить это.
как вывод тензорного потока в fp16 с моделью, обученной в fp32
comment
у меня очень похожая проблема. Я хочу взять свою обученную модель fp32 и выполнить вывод с помощью fp16. Вы поняли нашу или любую идею, как это сделать?
- person user179156   schedule 02.11.2018
Ответы (1)
попробуйте этот метод, и я обнаружил, что вывод с fp16 быстрее на GPU с архитектурой Pascal, может кто-нибудь дать объяснение?
person
7oud
schedule
31.01.2019