Обратите внимание, что этот вопрос отличается от Как мы загружаем видео с URL-адресом большого двоичного объекта [ закрытый], поскольку он не требует взаимодействия человека с браузером.
У меня есть следующая проблема:
- У меня есть список URL-адресов. Они указывают на HTML-страницы, имеющие одинаковую базовую структуру.
- В середине страницы есть изображение; при нажатии загружается плеер.
- Плеер как блоб ссылается на плейлист m3u8, хотя это не видно в самом HTML (он виден на вкладке «Сеть» в Chrome).
- Плеер транслирует короткое видео.
Что я должен сделать:
- Программно получить доступ к различным URL-адресам. Получите HTML и нажмите на проигрыватель изображений.
- Получите ссылку на большой двоичный объект и используйте ее, чтобы получить список воспроизведения m3u8.
- Скачать стрим в виде видео (бонусные баллы за скачивание в формате gif).
Обратите внимание, что решение не требует взаимодействия человека с браузером. С точки зрения API вход должен быть списком URL-адресов, а вывод — списком видео/гифок.
Пример страницы можно найти здесь на случай, если вы захотите протестировать свое решение.
Насколько я понимаю, я могу использовать Selene, чтобы получить HTML и щелкнуть изображение, чтобы запустить проигрыватель. Однако я понятия не имею, как обработать блоб, чтобы получить m3u8, а затем использовать его для реального видео.