Откуда MaxMind получает данные и как вы можете получить к ним доступ?

Из каких источников базы данных геолокации, такие как http://www.maxmind.com/, получают данные? Как я понял, в реестре IP-адресов, таких как ARIN и RIPE, просто хранится информация о том, какой компании назначен диапазон IP-адресов, поэтому он должен быть от провайдера, верно? Если да, то должен быть какой-то способ доступа к этому.


person Sultanen    schedule 07.08.2013    source источник
comment
Этот вопрос кажется не по теме, потому что он касается программирования.   -  person Filburt    schedule 08.08.2013
comment
Ну, это зависит от того, я намерен программно запрашивать информацию, я думал, что stackoverflow был подходящим местом, чтобы задать такой вопрос, даже если это не вопрос кода напрямую.   -  person Sultanen    schedule 08.08.2013


Ответы (2)


У меня был тот же вопрос, и я нашел следующую информацию.

Поскольку я использую информацию MaxMind, я хотел, чтобы они были достоверными, на их веб-сайте говорится: «MaxMind периодически проверяет точность баз данных GeoIP2 и GeoIP Legacy. В наших недавних тестах загружаемые базы данных имели точность 99,8% на уровне страны, точность 90%. на уровне штата в США и с точностью 86 % для городов США в радиусе 50 км. Дополнительные сведения см. в разделе Покрытие и точность GeoIP2 в городах. MaxMind периодически проверяет точность данных, используемых в продуктах и ​​услугах GeoIP2. рассчитывается путем проверки известных пар IP-адресов и местоположений веб-пользователя с данными веб-сервиса MaxMind GeoIP2 Precision, а также предложений баз данных GeoIP2 City и GeoLite2 City».

источник: https://support.maxmind.com/geoip-faq/geoip2-and-geoip-legacy-databases/how-accurate-are-your-geoip2-and-geoip-legacy-databases/

Что касается информации о интернет-провайдере, они заявляют: «Название интернет-провайдера в США имеет точность около 95%. За пределами США точность колеблется от 50% до 80%, в зависимости от страны. Данные, как правило, более точны для стран с большим количеством пользователей Интернета. "

источник: https://www.maxmind.com/en/geoip2-isp-database

Что касается процесса, следующий ответ показался информативным:

https://www.quora.com/How-does-IP-geolocation-service-providers-collect-data-or-how-does-IP-geolocation-databases-are-filled:

Базы данных IP-геолокации обычно собираются на основе следующего:

  1. IP-паук — трассировка маршрутов и другие автоматизированные методы, предназначенные для картирования инфраструктуры маршрутизации в Интернете. Эти методы могут быть довольно сложными и трудоемкими, учитывая задачу (более 4 миллиардов IP-адресов, которые постоянно выделяются, освобождаются или перемещаются). Кроме того, с IPv6 это становится на порядки сложнее.

  2. Данные, предоставляемые пользователями, привязанными к IP-адресам. Некоторые компании берут анонимные пользовательские данные (почтовые индексы/город), привязанные к IP-адресам, и используют их для заполнения своих баз данных. Очевидно, что эти данные необходимо тщательно очистить, чтобы убедиться, что они надежны.

  3. Обмен отношениями с интернет-провайдерами. Часто связываются с такими компаниями, как моя (Digital Element...http://www.digitalelement.com/). интернет-провайдерами, чтобы убедиться, что наши данные точны, потому что они не хотят, чтобы их пользователи были неправильно нацелены на такие сервисы, как Hulu или ESPN, и, возможно, были заблокированы от контента, когда в противном случае они должны были бы иметь возможность его получить. Эти данные обычно очень точны, при условии, что они постоянно обновляются, потому что интернет-провайдеры прекрасно знают местоположение своих собственных IP-адресов.

  4. Данные реестра — глядя на ARIN, RIPE и т. д. [Как правило, не так точно.] \

person mBo    schedule 04.12.2018
comment
интересно, в настоящее время есть много компаний, предлагающих эти услуги, но никто не знает, кто они это делают, и у них нет какого-либо проекта с открытым исходным кодом, который использует алгоритмы трассировки и т. д. для создания таких баз данных. - person user889030; 09.05.2021

Существует ряд баз данных MAXMIND, некоторые из них бесплатны, а некоторые имеют коммерческую лицензию. Частично информация в этих базах данных поступает из других общедоступных баз данных, таких как RIPE, и частично из внутренней обработки/сопоставления MAXMIND.

Вы можете написать свои собственные инструменты для анализа базы данных RIPE, извлечения всех полей и создания собственной базы данных, если хотите, или вы можете заплатить тому, кто уже сделал это.

Если вы собираетесь запрашивать их базы данных программно, на dev.maxmind.com есть API для большинства языков.

Просто предостережение: если вы используете базу данных MAXMIND GeoASN для поиска ASN по IP-адресу, имя AS не обязательно будет совпадать с именем интернет-провайдера, связанным с данным IP-адресом. (например, AS2856 разрешается для многих различных организаций, включая BT и TalkTalk). Вот почему база данных GeoISP включает диапазоны IP-адресов, а не ASN.

-- ab1

person ab77    schedule 13.09.2013