API или любой другой способ получить доступ к списку IMDB TOP 250?

Я провел обширное исследование и обнаружил, что не могу найти API. Есть ли доступный API для попадания в ТОП 250?

Или другой способ получить доступ к списку?

Я попытался получить доступ к HTML-странице страницы и выполнить синтаксический анализ в моем бэкэнде JSP. Но проблема в том, что я получаю только скелет, список загружается как AJAX.

Любой способ очистить его?

Любая идея использования будет оценена ...


person vivek_jonam    schedule 27.07.2012    source источник
comment
Почему бы не сделать запрос к конечной точке, которую вызывает скрипт (выполнить вызов ajax)?   -  person james_bond    schedule 27.07.2012
comment
возможный дубликат Предоставляет ли IMDB API?   -  person Ernest Friedman-Hill    schedule 27.07.2012
comment
Ссылка в моем комментарии выше содержит решение.   -  person Ernest Friedman-Hill    schedule 27.07.2012
comment
но ни одно решение не может попасть в список ТОП 250 .. Я конкретно в списке ТОП 250   -  person vivek_jonam    schedule 27.07.2012


Ответы (5)


Самый простой способ - просто загрузить данные из альтернативных интерфейсов IMDb.

Вам нужен файл rating.list.gz. 250 лучших фильмов перечислены в первом разделе.

person David Chappelle    schedule 21.03.2013
comment
Я считаю, что они обновляются еженедельно. И в любом случае 250 лучших фильмов не будут сильно меняться изо дня в день. - person David Chappelle; 26.03.2013
comment
Я написал сценарий, преобразующий все файлы .list.gz в JSON, что должно упростить работу с: github.com/ oxplot / imdb2json - person Mansour; 31.10.2015
comment
Мансур: эти файлы уже огромны, и я думаю, JSON еще больше из-за тегов для форматирования. Большинство людей загружают их в реляционную базу данных для запросов. Я сделал это для SQL Server, а другие написали парсер для python / mysql. - person David Chappelle; 02.11.2015

Да, теперь есть API под названием omdbapi

http://www.omdbapi.com/
person redchief    schedule 09.09.2015
comment
Хороший..! Но у него очень ограниченный функционал. - person Jay Modi; 08.10.2015
comment
@JayModi, я знаю, что это единственный в своем роде, насколько я знаю - person redchief; 08.10.2015

Я тоже столкнулся с этой проблемой, и я решил ее соскабливать. Вот код Python:

import requests
import re

top250_url = "http://akas.imdb.com/chart/top"


def get_top250():
    r = requests.get(top250_url)
    html = r.text.split("\n")
    result = []
    for line in html:
        line = line.rstrip("\n")
        m = re.search(r'data-titleid="tt(\d+?)">', line)
        if m:
            _id = m.group(1)
            result.append(_id)
    #
    return result

Он возвращает идентификаторы IMDb 250 лучших фильмов. Затем, используя пакет imdbpy, вы можете запросить всю информацию о фильме, поскольку у вас есть идентификатор фильма.

person Jabba    schedule 19.08.2016

Доступно оттуда:

http://api.myapifilms.com/imdb.do

Получите URL-адрес: (Вам понадобится бесплатный токен)

 http://api.myapifilms.com/imdb/top?token=GET A FREE API KEY&format=json&data=0

(Не мой сайт)

person Callombert    schedule 09.11.2015

https://www.theimdbapi.com/, этот отличный, я уже давно использую

person Chali    schedule 11.02.2021