Calc atan2 с неоном

Мне была найдена библиотека но не было

void atan2fv_neon_hfp(float *y, float *x,float *res,int len)

для вычисления len поплавков один раз.

Как написать неоновую версию для atan2fv_neon_hfp?


person WateLemon    schedule 18.09.2013    source источник
comment
Обратите внимание на точность NEON отличается от стандартных библиотек.   -  person artless noise    schedule 18.09.2013


Ответы (1)


Глядя на реализацию atan2f_neon_hfp, не похоже, что есть что-то, что нельзя было бы тривиально векторизовать (путем загрузки пар в d16 и d17 вместо vdup'ирования в них), но вам нужно знать ARM/ НЕОН в сборе. В качестве альтернативы вы можете просто вызвать скалярную версию в цикле.

person Sneftel    schedule 18.09.2013
comment
поскольку math-neon, atan2f_neon_hfp не очень быстр для нескольких поплавков, я хочу найти способ вычислять 4x поплавки каждый раз, когда использую неон. Я новичок в неоне. Поэтому я хочу найти пример, чтобы узнать больше навыков в neon.scalar версия в цикле не может решить мою проблему. Она все еще медленная для нескольких поплавков. - person WateLemon; 19.09.2013