У меня есть задача с интенсивными вычислениями, для реализации которой я использовал CUDA, и теперь я хочу сделать ее еще быстрее с помощью FPGA (если возможно).
Система, которую я хочу реализовать, представляет собой серию вычислений, каждое из которых похоже на умножение матриц в смысле параллельности. Он также имеет некоторые непараллельные части между ними. Работает с большими объемами данных.
Хотя я хочу, чтобы это было как можно быстрее, у меня достаточно времени, чтобы учиться и исследовать возможности ПЛИС.
здесь я прошу совета о том, как мне начать свой путь? Какую ПЛИС выбрать и где об этом узнать. любой веб-сайт или онлайн-класс или книги? Я все равно решил сделать это, но ваше представление о том, будет ли это быстрее на FPGA или нет, также будет полезно.