Вопросы по теме 'import.io'

Import.io (веб-краулер) продолжает запрашивать без вывода
Пример скрипта от Import.io не будет отображать никаких результатов после запроса с использованием формы. Все отображается на http://loop.netai.net/ . Предполагается, что пользователь может вводить данные, например, Intel i7, а затем сценарий...
67 просмотров
schedule 06.01.2024

Как import.io может записывать просканированные данные в файл в режиме реального времени
В настоящее время у меня есть сканер, настроенный в import.io, который сканирует очень большое количество страниц (десятки тысяч). Как только этот поисковый робот закончит работу, я попытаюсь просмотреть данные и увижу, что все они потеряны, что, как...
111 просмотров
schedule 20.07.2022

Можно ли перезапустить веб-краулер в import.io?
Мой компьютер выключился во время работы сканера, и теперь мне нужно перезапустить его.
65 просмотров
schedule 20.06.2022

Массовое извлечение с помощью Authenticated Connector (import.io)
Я новичок в import.io и на этом форуме. Я пытаюсь извлечь информацию из целевой базы данных, где мне нужно выполнить запрос с вводом. С помощью службы поддержки я успешно создал аутентифицированный соединитель. При наличии нескольких входных...
322 просмотров
schedule 05.04.2023

Поисковый робот import.io для нестандартной системы пагинации
Я пытаюсь создать сканер import.io для этого сайта http://theaccelblog.squarespace.com/ , но когда я нажимаю «Далее», чтобы перейти к следующей странице для обучения, я возвращаюсь к первой странице из-за используемой системы нумерации страниц....
142 просмотров
schedule 01.06.2022

Массовый экстратор через APi
Я создал экстрактор с пользовательским интерфейсом для окон. У меня есть несколько страниц, поэтому я выбрал массовый экстрактор. Я накормил около 10+ URL-адресов и кликнул по запросу. Отлично все работает, выходит красиво. Однако я перехожу к...
115 просмотров
schedule 08.01.2023

регулярное выражение ничего не делает в import.io
Я пытаюсь понять, как использовать регулярные выражения на import.io. У меня есть столбец HTML, который успешно извлекает данные из ссылки на веб-странице. Я хочу извлечь только часть строки запроса по ссылке, поэтому я иду в поле регулярного...
157 просмотров
schedule 24.08.2022

поиск слова на нескольких веб-сайтах с различной структурой с помощью import.io
У меня есть список из более чем 10 000 веб-сайтов, и я хотел бы найти ключевое слово на всех из них. Ожидаемый результат должен быть чем-то вроде ссылки и столбца со значениями 1, если веб-сайт содержит ключевое слово, и 0, если его нет. Есть ли...
149 просмотров
schedule 05.02.2023

Import.io не находит ссылки
Я использую экстрактор рабочего стола import.io для извлечения ссылок с этой страницы: http://plusaccessible.org/yakaldir/html/arts_litterature.htm Он извлекает только заголовки ссылок: ВопросВояж forum.baroussemania.com Сен-Мартен...
42 просмотров
schedule 25.12.2022

Как загрузить все экстракторы вместе с конечными точками для запроса RESTful?
Я использую import.io для извлечения большого количества данных с сотен веб-страниц. Я уже создал экстракторы для этих URL-адресов и продолжаю добавлять новые. Я разработал автоматизированный процесс, который рекурсивно отправляет HTTP-запрос к...
103 просмотров
schedule 31.05.2022

XPath — извлечь конкретное имя файла из строки
Я пытаюсь извлечь только имя файла из ссылки javascript в import.io, например, googlebolver.htm из href="javascript:finpopup('googlebolver.htm',920,620,0)" Мне удалось перейти по «ссылке» ( javascript:finpopup('googlebolver.htm',920,620,0) ) со...
347 просмотров
schedule 14.06.2023

Регулярное выражение URL из данных, извлеченных из ‹script›
У меня проблема с правильным распознаванием строки и исключением некоторого мусора из строки с URL-адресами, извлеченными из html. Вот моя строка:...
72 просмотров
schedule 05.01.2023