это моя первая попытка кодирования, поэтому, пожалуйста, простите мою глупость. Я пытаюсь изучить веб-скрапинг, практикуясь по этой ссылке: https://data.gov.sg/dataset/industrial-arbitration-court-awards-by-nature-of-trade-disputes?view_id=d3e444ef-54ed-4d0b-b715-1ee465f6d882&resource_id=c24d0d00-2d12-4f68-8fc9-4121433332e0
Я честно потратил часы, пытаясь понять, что не так с моим кодом здесь:
import csv
import requests
from BeautifulSoup import BeautifulSoup
url = 'https://data.gov.sg/dataset/industrial-arbitration-court-awards-by-nature-of-trade-disputes?view_id=d3e444ef-54ed-4d0b-b715-1ee465f6d882&resource_id=c24d0d00-2d12-4f68-8fc9-4121433332e0'
response = requests.get(url)
html = response.content
soup = BeautifulSoup(html)
table = soup.find('tbody')
list_of_rows = []
for row in table.find('tr'):
list_of_cells = []
for cell in row.findAll('td'):
list_of_cells.append()
list_of_rows.append(list_of_cells)
outfile = open("./indarb.csv","wb")
writer = csv.writer(outfile)
Затем мой терминал выдает это: объект «NoneType» не имеет атрибута «найти», говоря, что в строке 13 есть ошибка. Не уверен, что это помогает в запросах, но это список того, что я пробовал:
Различные перестановки «найти»/«найтивсе»
- Вместо «.find» используется «.findAll».
- Вместо «.findAll» используется «.find»
Различные перестановки для строки 10
- Попробовал суп.найти('tbody')
- Пробовал суп.найти('стол')
- Открытый исходный код, попробовал soap.find('table', attrs={'class':'table table-уплотненный'})
Различные перестановки для строки 13
- аналогично пробовал только с тегом 'tr'; или
- пытался добавить материал 'attrs={}'
Я действительно пытался, но не могу понять, почему я не могу очистить эту простую таблицу из 10 строк. Если бы кто-нибудь мог опубликовать код, который работает, это было бы феноменально. Спасибо за ваше терпение!