Я пытался составить список всех аккаунтов 1000 лучших инстаграмеров с этого сайта: 'https://hypeauditor.com/top-instagram/'. Список, возвращаемый из lxml, пуст как для lxml.html, так и для lxml.etree.
Я пытался удалить tbody, удалить text() и верхний xpath, но все это не удалось. что стоит отметить, так это то, что с верхним xpath он мне что-то вернул, но это все, кроме /n.
Сначала я попробовал lxml.etree
market_url='https://hypeauditor.com/top-instagram/'
r_market=requests.get(market_url)
s_market=etree.HTML(r_market)`
file_market=s_market.xpath('//*[@id="bloggers-top-table"]/tr[1]/td[3]/a/text()')
затем я также попробовал lxml.html.
tree=html.fromstring(r_market.content)
result=tree.xpath('//*[@id="bloggers-top-table"]/tr/td/h4/text()')
кроме того, я попробовал этот xpath:
s_market.xpath('//*[@id="bloggers-top-table"]/tbody/text()')
Это не дало мне никакой ошибки. Но после всех попыток он все равно выдает мне пустой список или список, полный n/.
Я не очень разбираюсь в веб-скрапинге, поэтому, возможно, я только что где-то допустил глупую ошибку, но, поскольку без данных я не могу запустить свою модель машинного обучения, я действительно борюсь, пожалуйста, помогите.