После использования API Google Cloud Vision я получил значения MID в формате /m/XXXXXXX
(хотя не обязательно 7 символов в конце). Что я хотел бы сделать, так это определить, насколько специфично одно значение MID по сравнению с другими. По сути, насколько широким или уточненным является термин. Например, термин Автомобиль может быть уровня 1, а термин Фургон может быть уровня 2.
Я попытался запустить значения MID через Google Knowledge Graph API, но, к сожалению, этих MID нет в этой базе данных и они не возвращают никакой информации. Например, у меня есть несколько MID и описаний:
/m/07s6nbt = text
/m/03gq5hm = font
/m/01n5jq = poster
/m/067408 = album cover
Моя первоначальная мысль о том, почему эти MID ничего не возвращают в Knowledge Graph API, заключается в том, что они не были перенесены после прекращения поддержки Freebase. Я понимаю, что Google предоставляет дамп RDF для Freebase, но я не уверен, как читать эти данные в Python и использовать их для определения глубины середины в иерархии.
Если невозможно определить уровень категории значения MID, количество подключений, которые имел термин, также будет подходящим прокси. Предполагая, что более широкие термины имеют больше связей с другими терминами, чем более точные термины. Я нашел статью, в которой обсуждается количество "краев «У MID есть, что, как я полагаю, означает количество соединений. Тем не менее, они выполняют некоторое преобразование между значениями MID в длинные значения и используют различные сценарии, которые продолжают выдавать мне многочисленные ошибки в Python. Я надеялся на простую таблицу со значениями MID в одном столбце и количеством подключений в другом, но я потерялся в их коде, преобразовании значений и ошибках Python.
Если у вас есть какие-либо предложения по простому определению количества соединений MID или его иерархического уровня, мы будем очень признательны. Благодарю вас!