Статьи по тематике import.io

Вопросы по теме 'import.io'

Import.io (веб-краулер) продолжает запрашивать без вывода

Пример скрипта от Import.io не будет отображать никаких результатов после запроса с использованием формы. Все отображается на http://loop.netai.net/ . Предполагается, что пользователь может вводить данные, например, Intel i7, а затем сценарий...

67 просмотров

javascript web-crawler import.io

06.01.2024

Как import.io может записывать просканированные данные в файл в режиме реального времени

В настоящее время у меня есть сканер, настроенный в import.io, который сканирует очень большое количество страниц (десятки тысяч). Как только этот поисковый робот закончит работу, я попытаюсь просмотреть данные и увижу, что все они потеряны, что, как...

111 просмотров

web-crawler import.io

20.07.2022

Можно ли перезапустить веб-краулер в import.io?

Мой компьютер выключился во время работы сканера, и теперь мне нужно перезапустить его.

65 просмотров

web-scraping web-crawler import.io

20.06.2022

Массовое извлечение с помощью Authenticated Connector (import.io)

Я новичок в import.io и на этом форуме. Я пытаюсь извлечь информацию из целевой базы данных, где мне нужно выполнить запрос с вводом. С помощью службы поддержки я успешно создал аутентифицированный соединитель. При наличии нескольких входных...

322 просмотров

api connector bulk extraction import.io

05.04.2023

Поисковый робот import.io для нестандартной системы пагинации

Я пытаюсь создать сканер import.io для этого сайта http://theaccelblog.squarespace.com/ , но когда я нажимаю «Далее», чтобы перейти к следующей странице для обучения, я возвращаюсь к первой странице из-за используемой системы нумерации страниц....

142 просмотров

import.io

01.06.2022

Массовый экстратор через APi

Я создал экстрактор с пользовательским интерфейсом для окон. У меня есть несколько страниц, поэтому я выбрал массовый экстрактор. Я накормил около 10+ URL-адресов и кликнул по запросу. Отлично все работает, выходит красиво. Однако я перехожу к...

115 просмотров

import.io

08.01.2023

регулярное выражение ничего не делает в import.io

Я пытаюсь понять, как использовать регулярные выражения на import.io. У меня есть столбец HTML, который успешно извлекает данные из ссылки на веб-странице. Я хочу извлечь только часть строки запроса по ссылке, поэтому я иду в поле регулярного...

157 просмотров

import.io

24.08.2022

поиск слова на нескольких веб-сайтах с различной структурой с помощью import.io

У меня есть список из более чем 10 000 веб-сайтов, и я хотел бы найти ключевое слово на всех из них. Ожидаемый результат должен быть чем-то вроде ссылки и столбца со значениями 1, если веб-сайт содержит ключевое слово, и 0, если его нет. Есть ли...

149 просмотров

extract web-crawler import.io

05.02.2023

Import.io не находит ссылки

Я использую экстрактор рабочего стола import.io для извлечения ссылок с этой страницы: http://plusaccessible.org/yakaldir/html/arts_litterature.htm Он извлекает только заголовки ссылок: ВопросВояж forum.baroussemania.com Сен-Мартен...

42 просмотров

import.io

25.12.2022

Как загрузить все экстракторы вместе с конечными точками для запроса RESTful?

Я использую import.io для извлечения большого количества данных с сотен веб-страниц. Я уже создал экстракторы для этих URL-адресов и продолжаю добавлять новые. Я разработал автоматизированный процесс, который рекурсивно отправляет HTTP-запрос к...

103 просмотров

import.io

31.05.2022

XPath — извлечь конкретное имя файла из строки

Я пытаюсь извлечь только имя файла из ссылки javascript в import.io, например, googlebolver.htm из href="javascript:finpopup('googlebolver.htm',920,620,0)" Мне удалось перейти по «ссылке» ( javascript:finpopup('googlebolver.htm',920,620,0) ) со...

347 просмотров

xpath import.io

14.06.2023

Регулярное выражение URL из данных, извлеченных из ‹script›

У меня проблема с правильным распознаванием строки и исключением некоторого мусора из строки с URL-адресами, извлеченными из html. Вот моя строка:...

72 просмотров

url regex import.io

05.01.2023

Вопросы по теме 'import.io'

Похожие вопросы