Из каких источников базы данных геолокации, такие как http://www.maxmind.com/, получают данные? Как я понял, в реестре IP-адресов, таких как ARIN и RIPE, просто хранится информация о том, какой компании назначен диапазон IP-адресов, поэтому он должен быть от провайдера, верно? Если да, то должен быть какой-то способ доступа к этому.
Откуда MaxMind получает данные и как вы можете получить к ним доступ?
Ответы (2)
У меня был тот же вопрос, и я нашел следующую информацию.
Поскольку я использую информацию MaxMind, я хотел, чтобы они были достоверными, на их веб-сайте говорится: «MaxMind периодически проверяет точность баз данных GeoIP2 и GeoIP Legacy. В наших недавних тестах загружаемые базы данных имели точность 99,8% на уровне страны, точность 90%. на уровне штата в США и с точностью 86 % для городов США в радиусе 50 км. Дополнительные сведения см. в разделе Покрытие и точность GeoIP2 в городах. MaxMind периодически проверяет точность данных, используемых в продуктах и услугах GeoIP2. рассчитывается путем проверки известных пар IP-адресов и местоположений веб-пользователя с данными веб-сервиса MaxMind GeoIP2 Precision, а также предложений баз данных GeoIP2 City и GeoLite2 City».
Что касается информации о интернет-провайдере, они заявляют: «Название интернет-провайдера в США имеет точность около 95%. За пределами США точность колеблется от 50% до 80%, в зависимости от страны. Данные, как правило, более точны для стран с большим количеством пользователей Интернета. "
источник: https://www.maxmind.com/en/geoip2-isp-database
Что касается процесса, следующий ответ показался информативным:
Базы данных IP-геолокации обычно собираются на основе следующего:
IP-паук — трассировка маршрутов и другие автоматизированные методы, предназначенные для картирования инфраструктуры маршрутизации в Интернете. Эти методы могут быть довольно сложными и трудоемкими, учитывая задачу (более 4 миллиардов IP-адресов, которые постоянно выделяются, освобождаются или перемещаются). Кроме того, с IPv6 это становится на порядки сложнее.
Данные, предоставляемые пользователями, привязанными к IP-адресам. Некоторые компании берут анонимные пользовательские данные (почтовые индексы/город), привязанные к IP-адресам, и используют их для заполнения своих баз данных. Очевидно, что эти данные необходимо тщательно очистить, чтобы убедиться, что они надежны.
Обмен отношениями с интернет-провайдерами. Часто связываются с такими компаниями, как моя (Digital Element...http://www.digitalelement.com/). интернет-провайдерами, чтобы убедиться, что наши данные точны, потому что они не хотят, чтобы их пользователи были неправильно нацелены на такие сервисы, как Hulu или ESPN, и, возможно, были заблокированы от контента, когда в противном случае они должны были бы иметь возможность его получить. Эти данные обычно очень точны, при условии, что они постоянно обновляются, потому что интернет-провайдеры прекрасно знают местоположение своих собственных IP-адресов.
Данные реестра — глядя на ARIN, RIPE и т. д. [Как правило, не так точно.] \
Существует ряд баз данных MAXMIND, некоторые из них бесплатны, а некоторые имеют коммерческую лицензию. Частично информация в этих базах данных поступает из других общедоступных баз данных, таких как RIPE, и частично из внутренней обработки/сопоставления MAXMIND.
Вы можете написать свои собственные инструменты для анализа базы данных RIPE, извлечения всех полей и создания собственной базы данных, если хотите, или вы можете заплатить тому, кто уже сделал это.
Если вы собираетесь запрашивать их базы данных программно, на dev.maxmind.com есть API для большинства языков.
Просто предостережение: если вы используете базу данных MAXMIND GeoASN для поиска ASN по IP-адресу, имя AS не обязательно будет совпадать с именем интернет-провайдера, связанным с данным IP-адресом. (например, AS2856 разрешается для многих различных организаций, включая BT и TalkTalk). Вот почему база данных GeoISP включает диапазоны IP-адресов, а не ASN.
-- ab1