Вопросы по теме 'urlopen'

Веб-скрейпинг urlopen в python
Я пытаюсь получить данные с этого сайта: http://www.boursorama.com/includes/cours/last_transactions.phtml?symbole=1xEURUS Кажется, что urlopen не получает html-код, и я не понимаю, почему. Это выглядит так: html =...
12327 просмотров
schedule 16.09.2022

Веб-парсинг страницы JavaScript с помощью Python
Я пытаюсь разработать простой парсер. Я хочу извлечь текст без HTML-кода. Фактически, я добиваюсь этой цели, но я видел, что на некоторых страницах, где загружен JavaScript, я не получал хороших результатов. Например, если какой-то код JavaScript...
331746 просмотров
schedule 07.04.2022

Как установить заголовок, который не позволяет сайту отправлять ответ в кодировке gzip
я использую python urllib2.urlopen для получения html-контента, и я получаю ответ в формате gzip. могу ли я установить заголовки, чтобы он не был заархивирован? мой код response = urlopen(url,None , TIMEOUT) html = response.read() # read...
282 просмотров
schedule 30.11.2022

python: нельзя использовать urlopen!! из urllib, urllib2, ошибка clientcookie urlopen ssl
Я сделал некоторый код для доступа к конкретному сайту вместо пользователя. Это очень похоже на программу автоматического входа в систему. Моя программа получает идентификатор пользователя и пароль от пользователя и пытается получить доступ к...
3817 просмотров
schedule 09.06.2023

Странности чтения Python3 urlopen (gzip)
Я получаю URL от Schema.org. Это content-type="text/html" Иногда read() работает как положено b'‹ !DOCTYPE html> ....' Иногда read() возвращает что-то еще b'\x1f\x8b\x08\x00\x00\x00\x00...' try: with...
519 просмотров
schedule 20.02.2022

Избегайте загрузки изображений с помощью Beautifulsoup и urllib.request.
Я использую BeautifulSoup (анализатор 'lxml' ) с urllib.request.urlopen() для получения текстовой информации с веб-сайта. Однако, когда я проверяю сетевой раздел в своем мониторе активности, я вижу, что python загружает много данных. Это...
142 просмотров

python urlopen: только первый атрибут URL-адреса берется через данные
Я пытаюсь удалить веб-сайт. Он состоит из футбольного веб-сайта, на котором перечислены все матчи всех сезонов. Итак, я пытаюсь удалить html-страницы каждой игры каждого сезона. Вот URL: http://www.lfp.fr/ligue1/calendrier_resultat#sai=77&jour=1...
26 просмотров
schedule 12.03.2023

UnicodeEncodeError с urlopen(..net/cé..)
Я пытаюсь открыть URL-адрес, содержащий символ Юникода (é). Когда я пишу его непосредственно в функции, я получаю следующую ошибку: from urllib.request import urlopen uClient = urlopen("https://www.mypage.net/céline") >>>...
46 просмотров
schedule 10.08.2022

Запрос Urllib занимает слишком много времени, чтобы ответить
Ниже мой код. Последняя строка требует слишком много времени для ответа. Прошло более 30 минут, но ответа до сих пор нет. Я ценю, если у кого-то есть какие-либо идеи. import urllib.request html =...
238 просмотров
schedule 06.10.2023

Ошибка Urlopen, неизвестный тип URL-адреса при запуске скрипта Python из CMD
Моя цель – запустить сценарий из планировщика задач Windows. Однако я думаю, что планировщик использует CMD для запуска кода - и CMD не хочет запускать мой скрипт! Когда я запускаю сценарий из командной строки Anaconda или Spyder, сценарий...
139 просмотров
schedule 07.06.2022

Я получаю сообщение об ошибке «невозможно импортировать« urlopen »из« urllib », работающего на python3 на Mac с установленным Beautiful Soup.
Я не могу запустить этот код «из urlopen import urllib» на Mac, используя Beautiful Soup для очистки веб-страниц. Я установил Beautiful Soup и импортировал его вместе с request и lxml. from urllib import urlopen Traceback...
1929 просмотров
schedule 23.12.2022