Я хочу преобразовать необработанные данные поиска html whois в json или xml, используя php или любой другой язык

Я получил этот код для поиска whois из здесь.

но я получаю необработанные данные или данные html.. я получаю вывод, но не в читаемом формате, например, в json или xml.. как я могу преобразовать это в json.. вставка примера вывода

ttmm.com domain lookup results from whois.ename.com server:

enter code here Domain Name: ttmm.com
Registry Domain ID:
Registrar WHOIS Server: whois.ename.com
Registrar URL: http://www.ename.net
Updated Date: 1998-11-25 T05:00:00Z
Creation Date: 1998-11-25 T05:00:00Z
Registrar Registration Expiration Date: 2016-11-24 T05:00:00Z
Registrar: eName Technology Co.,Ltd.
Registrar IANA ID: 1331
Registrar Abuse Contact Email: [email protected]
Registrar Abuse Contact Phone: +86.4000044400
Domain Status: clientDeleteProhibited
https://www.icann.org/epp#clientDeleteProhibited
Domain Status: clientTransferProhibited             https://www.icann.org/epp#clientTransferProhibited
 Registry Registrant ID:Not Available From Registry
Registrant Name: chousteven
Registrant Organization: hua you
Registrant Street: an yuan cun daxue cheng
Registrant City: ping xiang shi
Registrant State/Province: jiang xi
Registrant Postal Code: 337000
Registrant Country: CN
Registrant Phone: +86.15979220355
Registrant Phone Ext:
Registrant Fax: +86.15979220355
Registrant Fax Ext:
Registrant Email: [email protected]
Registry Admin ID:Not Available From Registry
Admin Name: chousteven
Admin Organization: hua you
Admin Street: an yuan cun daxue cheng
Admin City: ping xiang shi
Admin State/Province: jiang xi
Admin Postal Code: 337000
Admin Country: CN
Admin Phone: +86.15979220355
Admin Phone Ext:
Admin Fax: +86.15979220355
Admin Fax Ext:
Admin Email: [email protected]
Registry Tech ID:Not Available From Registry
Tech Name: chousteven
Tech Organization: hua you
Tech Street: an yuan cun daxue cheng
Tech City: ping xiang shi
Tech State/Province: jiang xi
Tech Postal Code: 337000
Tech Country: CN
Tech Phone: +86.15979220355
Tech Phone Ext:
Tech Fax: +86.15979220355
Tech Fax Ext:
Tech Email: [email protected]
Name Server: ns1.alidns.com
Name Server: ns2.alidns.com
DNSSEC: unsigned
URL of the ICANN WHOIS Data Problem Reporting System:    http://wdprs.internic.net/
>>> Last update of WHOIS database: 2015-11-19 T12:53:51Z <<<
For more information on Whois status codes, please visit
https://www.icann.org/resources/pages/epp-status-codes-2014-06-16-en

person Aniket Karne    schedule 19.11.2015    source источник
comment
А что вы пробовали? Покажите нам всем код того, что вы пробовали.   -  person Tigger    schedule 21.11.2015
comment
Я дал ссылку на код.   -  person Aniket Karne    schedule 23.11.2015
comment
Вы можете разобрать этот вывод в json или xml. Или вы можете использовать некоторые из служб, которые имеют API для загрузки данных WHOIS в формате json или xml. Некоторые выглядят бесплатными, а некоторые платными.   -  person Quickpick    schedule 31.12.2015
comment
Это очень легко сделать. Если вы хотите сделать это в PHP, просто переберите его построчно, разделите его на двоеточие, а затем перепишите строку в JSON. Попробуйте, и если у вас не получится, вернитесь и покажите, что вы пробовали.   -  person Jim Archer    schedule 31.12.2015
comment
@JimArcher К сожалению, это не так просто. Не все регистраторы используют именно этот формат.   -  person    schedule 31.12.2015
comment
@JimArcher да, Джим Сумраквафф сказал, что это правильно, не все серверы отправляют данные в json или xml. Так что нет простого решения для этого.   -  person Aniket Karne    schedule 31.12.2015
comment
@Aniket Karne Можете ли вы поделиться своим php-кодом, чтобы получить такие данные whois, используя мой php-скрипт? Я не могу получить контактную/административную/техническую информацию домена.   -  person Anakbhai Gida    schedule 15.04.2018


Ответы (2)


Много пользовательского разбора. Извиняюсь. Простого решения нет.

Стандартного формата ответов WHOIS не существует. Как минимум, большинство реестров имеют несколько иной формат ответов; кроме того, «тонкие реестры», такие как .COM и .NET, требуют, чтобы каждый регистратор реализовал свой собственный сервер WHOIS, каждый из которых имеет свой немного отличающийся уникальный формат.

Как уже отмечали другие, существуют платные API-интерфейсы, которые могут выполнять этот анализ за вас. В зависимости от ваших потребностей, это может быть более подходящим решением, чем пытаться самостоятельно анализировать несколько тысяч различных форматов.

person Community    schedule 30.12.2015
comment
Да, я пытался сделать это сам, но это невозможно, если сервер отправляет данные в необработанном формате, и мы не можем его изменить. Платный API является ключевым. - person Aniket Karne; 31.12.2015
comment
Это неправда. ICANN требует, чтобы каждый регистратор внедрил сервер whois с портом 43, но они очень подробно диктуют формат выходных данных whois. Если вы подключитесь к whois-серверу регистратора через порт 43 и отправите спонсируемое им доменное имя, а затем CR/LF, вы получите его обратно. Вы можете разделить его на двоеточие, а затем проанализировать другие строки. Это довольно просто. Платный API мог быть полезен много лет назад, до того, как формат вывода был продиктован, но не сейчас. - person Jim Archer; 12.01.2016
comment
@JimArcher В общем случае это не так. ICANN RAA 2013 действительно рекомендует формат для ответов WHOIS, но не все регистраторы согласились с этой версией документа, поэтому многие серверы WHOIS по-прежнему используют нестандартные форматы. Кроме того, нДВУ не связаны RAA ICANN, и большинство из них используют идиосинкразические форматы для ответов WHOIS. (Некоторые, например .ES, вообще не предоставляют публичный WHOIS!) - person ; 12.01.2016
comment
@JimArcher …Кроме того, некоторые серверы WHOIS будут сильно ограничивать скорость запросов и будут предоставлять сокращенный ответ или вообще не отвечать, как только вы достигнете этого ограничения. GoDaddy особенно плохо относится к этому. - person ; 12.01.2016
comment
@duskwuff У вас есть хорошее замечание о реестрах, не находящихся под контролем ICANN (им повезло). Но когда дело доходит до регистраторов, подчиняющихся ICANN, независимо от того, подписали они соглашение или нет, у ICANN есть способ заставить регистраторов делать то, что они не обязаны делать. Я могу разглагольствовать об этом хоть целый день, но в данном случае большинство регистраторов, которых я проверял, соответствуют новому стандарту. - person Jim Archer; 12.01.2016
comment
@duskwuff Что касается ограничения скорости, я не могу винить в этом регистраторов. Обычно они вносят в белый список других регистраторов, но любой, кто не является регистратором и выполняет массовые запросы whois, скорее всего, делает это с гнусной целью или, по крайней мере, с целью, противоречащей интересам спонсирующего регистратора. - person Jim Archer; 12.01.2016
comment
@duskwuff У меня есть регистратор, и я могу с уверенностью сказать, что изменения RAA имеют большое значение, как только ICANN решит сделать из этого большое дело (то есть в любое время, когда они получат жалобу или просто захотят), и 2 , GoDaddy вообще мало что волнует, они вроде делают что хотят. Во всяком случае, похоже, что мы действительно не сильно расходимся во мнениях. - person Jim Archer; 13.01.2016

разбить текст на строки. читать каждую строчку. проверьте каждую строку на наличие ключевого слова с истекающим сроком действия. если нашел попробуй вернуть нужный.

person kk4You    schedule 11.09.2019