Я выполняю проект веб-скрейпинга этого веб-сайта.
На данный момент я хотел бы извлечь имя исполнителя из такого URL-адреса: https://lsdb.eu/artists/view/225/
Поскольку есть исполнитель под номером 225, страница существует. Однако https://lsdb.eu/artists/view/226/
не существует, но существуют страницы с номерами выше 226.
Есть ли способ очистить веб-сайт, чтобы увидеть, какие https://lsdb.eu/artists/view/xxx/
URL-адреса действительны?
try
, чтобы она просто пропускала плохие URL-адреса и переходила к следующему. В качестве альтернативыhttr::GET
разрешает доступ к ответу сайта, поэтомуGET("https://lsdb.eu/artists/view/225/")$status_code
вернет 200 (хорошо), тогда какGET("https://lsdb.eu/artists/view/226/")$status_code
вернет 404 (плохо). - person roarkz   schedule 10.08.2017