в настоящее время мы работаем над проверкой концепции Apache Beam Pipeline в облачном потоке данных. Мы помещаем некоторые файлы (без текста, в специальном двоичном формате) в Google Cloud Buckets и хотели бы прочитать эти файлы как byte[] и десериализовать их в потоке. Однако мы не можем найти источник Beam, способный читать нетекстовые файлы. Единственная идея состоит в том, чтобы расширить класс FileBasedSource
, но мы считаем, что должно быть более простое решение, так как это кажется довольно простой задачей.
Спасибо, ребята, за вашу помощь.