Вопросы по теме 'urlopen'
Веб-скрейпинг urlopen в python
Я пытаюсь получить данные с этого сайта: http://www.boursorama.com/includes/cours/last_transactions.phtml?symbole=1xEURUS
Кажется, что urlopen не получает html-код, и я не понимаю, почему. Это выглядит так:
html =...
12327 просмотров
schedule
16.09.2022
Веб-парсинг страницы JavaScript с помощью Python
Я пытаюсь разработать простой парсер. Я хочу извлечь текст без HTML-кода. Фактически, я добиваюсь этой цели, но я видел, что на некоторых страницах, где загружен JavaScript, я не получал хороших результатов.
Например, если какой-то код JavaScript...
331746 просмотров
schedule
07.04.2022
Как установить заголовок, который не позволяет сайту отправлять ответ в кодировке gzip
я использую python urllib2.urlopen для получения html-контента, и я получаю ответ в формате gzip. могу ли я установить заголовки, чтобы он не был заархивирован?
мой код
response = urlopen(url,None , TIMEOUT)
html = response.read() # read...
282 просмотров
schedule
30.11.2022
python: нельзя использовать urlopen!! из urllib, urllib2, ошибка clientcookie urlopen ssl
Я сделал некоторый код для доступа к конкретному сайту вместо пользователя. Это очень похоже на программу автоматического входа в систему. Моя программа получает идентификатор пользователя и пароль от пользователя и пытается получить доступ к...
3817 просмотров
schedule
09.06.2023
Странности чтения Python3 urlopen (gzip)
Я получаю URL от Schema.org. Это content-type="text/html"
Иногда read() работает как положено b'‹ !DOCTYPE html> ....'
Иногда read() возвращает что-то еще b'\x1f\x8b\x08\x00\x00\x00\x00...'
try:
with...
519 просмотров
schedule
20.02.2022
Избегайте загрузки изображений с помощью Beautifulsoup и urllib.request.
Я использую BeautifulSoup (анализатор 'lxml' ) с urllib.request.urlopen() для получения текстовой информации с веб-сайта. Однако, когда я проверяю сетевой раздел в своем мониторе активности, я вижу, что python загружает много данных. Это...
142 просмотров
schedule
11.08.2022
python urlopen: только первый атрибут URL-адреса берется через данные
Я пытаюсь удалить веб-сайт. Он состоит из футбольного веб-сайта, на котором перечислены все матчи всех сезонов. Итак, я пытаюсь удалить html-страницы каждой игры каждого сезона. Вот URL: http://www.lfp.fr/ligue1/calendrier_resultat#sai=77&jour=1...
26 просмотров
schedule
12.03.2023
UnicodeEncodeError с urlopen(..net/cé..)
Я пытаюсь открыть URL-адрес, содержащий символ Юникода (é). Когда я пишу его непосредственно в функции, я получаю следующую ошибку:
from urllib.request import urlopen
uClient = urlopen("https://www.mypage.net/céline")
>>>...
46 просмотров
schedule
10.08.2022
Запрос Urllib занимает слишком много времени, чтобы ответить
Ниже мой код. Последняя строка требует слишком много времени для ответа. Прошло более 30 минут, но ответа до сих пор нет. Я ценю, если у кого-то есть какие-либо идеи.
import urllib.request
html =...
238 просмотров
schedule
06.10.2023
Ошибка Urlopen, неизвестный тип URL-адреса при запуске скрипта Python из CMD
Моя цель – запустить сценарий из планировщика задач Windows.
Однако я думаю, что планировщик использует CMD для запуска кода - и CMD не хочет запускать мой скрипт!
Когда я запускаю сценарий из командной строки Anaconda или Spyder, сценарий...
139 просмотров
schedule
07.06.2022
Я получаю сообщение об ошибке «невозможно импортировать« urlopen »из« urllib », работающего на python3 на Mac с установленным Beautiful Soup.
Я не могу запустить этот код «из urlopen import urllib» на Mac, используя Beautiful Soup для очистки веб-страниц.
Я установил Beautiful Soup и импортировал его вместе с request и lxml.
from urllib import urlopen Traceback...
1929 просмотров
schedule
23.12.2022