Запрос Janusgraph возвращает фрейм данных для выполнения анализа с использованием GraphFrame

Я использую JanusGraph, HBase и Python (через gremlin_python) для создания и хранения образца графика. Теперь я хотел бы провести анализ графиков (например, рейтинг страницы) и придерживаться Python. Мне интересно, можно ли запросить график из JanusGraph в формате DataFrame, а затем загрузить его в GraphFrame для расчета pageRank?

Ключевые вопросы заключаются в том, как я могу связать JanusGraph + GraphFrame с помощью Python, т.е. 1. запросить график, который возвращается в одном формате 2. вызвать GraphFrame API для вычисления PageRank.


person twfx    schedule 03.08.2018    source источник


Ответы (1)


Насколько мне известно, не существует официального коннектора для преобразования результатов запроса JanusGraph в Spark DataFrame (а затем Graph в GraphFrame).

Таким образом, вы должны вручную написать код для выполнения преобразования. Вы можете использовать пакет gremlin-python для запроса JanusGraph, а затем с помощью Spark передать набор результатов в Spark DataFrame.

person Shu    schedule 19.12.2018