Алгоритм MST Прима в Python

Я пытаюсь реализовать алгоритм Прима для графа, состоящего из городов в качестве вершин, но я застрял. Мы будем очень признательны за любые советы.

Я читаю данные из текстового файла и пытаюсь получить результат (общее расстояние) и список ребер в кортежах. Например, если начать с Хьюстона, первое ребро будет ('ХЬЮСТОН', 'САН-АННТОНИО').

Я реализовал граф/дерево, используя словарь с соседними вершинами и их расстоянием, например:

{'HOUSTON': [('LUBBOCK', '535'), ('MIDLAND/ODESSA', '494'), ('MISSION/MCALLEN/EDINBURG', '346'), ('SAN ANTONIO', '197')], 
'HARLINGEN/SAN BENITO': [('HOUSTON', '329')], 
'SAN ANTONIO': [], 
'WACO': [], 
'ABILENE': [('DALLAS/FORT WORTH', '181')], 
'LUBBOCK': [('MIDLAND/ODESSA', '137')], 
'COLLEGE STATION/BRYAN': [('DALLAS/FORT WORTH', '181'), ('HOUSTON', '97')], 
'MISSION/MCALLEN/EDINBURG': [], 
'AMARILLO': [('DALLAS/FORT WORTH', '361'), ('HOUSTON', '596')], 
'EL PASO': [('HOUSTON', '730'), ('SAN ANTONIO', '548')], 
'DALLAS/FORT WORTH': [('EL PASO', '617'), ('HOUSTON', '238'), ('KILLEEN', '154'), ('LAREDO', '429'), ('LONGVIEW', '128'), ('LUBBOCK', '322'), ('MIDLAND/ODESSA', '347'), ('MISSION/MCALLEN/EDINBURG', '506'), ('SAN ANGELO', '252'), ('SAN ANTONIO', '271'), ('WACO', '91'), ('WICHITA FALLS', '141')], 
'KILLEEN': [], 
'SAN ANGELO': [], 
'MIDLAND/ODESSA': [], 
'WICHITA FALLS': [], 
'CORPUS CHRISTI': [('DALLAS/FORT WORTH', '377'), ('HOUSTON', '207')], 
'AUSTIN': [('DALLAS/FORT WORTH', '192'), ('EL PASO', '573'), ('HOUSTON', '162')], 
'LONGVIEW': [], 
'BROWNSVILLE': [('DALLAS/FORT WORTH', '550'), ('HOUSTON', '355')], 
'LAREDO': [('SAN ANTONIO', '157')]}

вот что у меня есть до сих пор:

import csv
import operator

def prim(file_path):
    with open(file_path) as csv_file:
        csv_reader = csv.reader(csv_file, delimiter = "\t")
        dict = {}
        for row in csv_reader:
            if row[0] == 'City':
                continue
            if row[0] in dict:
                dict[row[0]].append((row[1],row[3]))
                if row[1] not in dict:
                    dict[row[1]] = []
            else:
                dict[row[0]] = [(row[1], row[3])]

    V = dict.keys()
    A = ['HOUSTON']
    score = 0 # score result
    E = [] # tuple result

    while A != V:
        for x in A:
            dict[x].sort(key=lambda x: x[1])
            for y in dict[x]:
                if y[0] in V and y[0] not in A:
                    A.append(y[0])
                    E.append((x, y[0]))
                    score += int(y[1])
                    break
            break
        break

    print("Edges:")
    print(E)
    print("Score:")
    print(score)

prim("Texas.txt")

Это дает правильный первый край из-за этого последнего оператора break, но когда я удаляю оператор break, он бесконечно зацикливается, и я не могу точно понять, почему и как это исправить. Я понимаю, что могу реализовать этот алгоритм совершенно неправильно и неэффективно, поэтому я был бы очень признателен за любые советы или советы о том, куда идти отсюда/что делать по-другому и почему. Заранее спасибо!!

python prims-algorithm minimum-spanning-tree

adam.code 12.11.2019 источник

Ответы (1)

arrow_upward
0
arrow_downward

Есть три основные проблемы с вашей реализацией:

Ваш график хранится как ориентированный граф. Алгоритм Прима нельзя применять к ориентированным графам (ссылка). Если вы действительно хотите обработать ориентированный граф, комментарии в связанном вопросе содержат информацию о том, как вычислить MST-эквивалент ориентированного графа (ссылка).

Это также связано с тем, почему ваш алгоритм застревает: он исследует все вершины, достижимые через направленное ребро из начальной вершины. Вершин в графе больше, но они не могут быть достигнуты из начальной вершины при обходе ребер в фиксированном направлении. Следовательно, алгоритм не может увеличить промежуточное дерево, чтобы включить дополнительные вершины, и зависает.

Однако я предполагаю, что вы действительно хотите, чтобы граф был неориентированным. В этом случае вы могли бы, например, вычислить симметричное замыкание графа, продублировав каждое ребро в обратном направлении. Или, в качестве альтернативы, вы можете адаптировать свой алгоритм для проверки как исходящих, так и входящих ребер.
В алгоритме Прима каждая итерация добавляет ребро к промежуточному дереву. Это делается путем выбора ребра минимального веса, соединяющего промежуточное дерево с вершиной из оставшейся части графа. Однако в вашем коде вместо этого вы сортируете исходящие ребра каждой вершины в промежуточном дереве по их весу и добавляете все ребра, указывающие на вершину, которая еще не включена в промежуточное дерево. Это даст вам неправильные результаты. Рассмотрим следующий пример:

Предположим, мы начинаем с a. Ваш подход сортирует ребра a по их весу и добавляет их в указанном порядке. Поэтому он добавляет ребра a-b и a-c к промежуточному дереву. Все вершины графа теперь содержатся в промежуточном дереве, поэтому алгоритм завершает работу. Однако дерево b-a-c не является минимальным остовным деревом.

Поэтому вместо этого из a вы должны выбрать минимальное ребро, которое равно a-b. Затем вы должны искать ребро минимального веса из любой вершины промежуточного дерева. Это будет край b-c. Затем вы добавите это ребро к промежуточному дереву, что в конечном итоге приведет к MST a-b-c.
Условие цикла A != V никогда не будет выполнено, даже если A содержит все вершины графа. Это связано с тем, что A — это список, а V — результат dict.keys(), который является не списком, а просмотреть объект. Объект представления является итерируемым, и ключи будут даны в том же порядке, в котором они были вставлены, но он никогда не будет оцениваться как равный списку, даже если список содержит одни и те же элементы.

Даже если вы превратите V в список (например, с V = list(dict.keys()), этого будет недостаточно, так как списки равны только в том случае, если они содержат одни и те же элементы в одном и том же порядке. Однако у вас нет гарантии, что алгоритм вставит вершины в A в том же порядке, в котором ключи были вставлены в словарь.

Следовательно, вы должны использовать другой подход для условия цикла. Одним из возможных решений было бы инициализировать V и A как sets, то есть с V = set(dict.keys()) и A = set(['HOUSTON']). Это позволит вам сохранить A != V в качестве условия цикла. Или вы можете сохранить A список, но только проверять, равен ли размер A размеру V на каждой итерации. Поскольку алгоритм вставляет в A только в том случае, если вершина еще не содержится в A, когда len(A) == len(dict) следует, что A содержит все вершины.

Вот пример фиксированного кода. Сначала выполняется симметричное замыкание входного графа. В качестве условия цикла проверяется, не равен ли размер A общему количеству вершин. В цикле он вычисляет ребро минимального веса, которое соединяет вершину в A с вершиной, не входящей в A:

    # Compute symmetric closure
    for v, edges in dict.items():
        for neighbor, weight in edges:
            edges_neighbor = dict[neighbor]
            if (v, weight) not in edges_neighbor:
              dict[neighbor].append((v, weight))

    A = ['HOUSTON']
    score = 0
    E = []

    while len(A) != len(dict):

        # Prepend vertex to each (target,weight) pair in dict[x]
        prepend_source = lambda x: map(lambda y: (x, *y), dict[x])
        edges = itertools.chain.from_iterable(map(prepend_source, A))

        # Keep only edges where the target is not in A
        edges_filtered = filter(lambda edge: edge[1] not in A, edges)

        # Select the minimum edge
        edge_min = min(edges_filtered, key=lambda x: int(x[2]))

        A.append(edge_min[1])
        E.append((edge_min[0], edge_min[1]))
        score += int(edge_min[2])

Обратите внимание, что эта реализация по-прежнему предполагает, что граф связан. Если вы хотите обрабатывать несвязанные графы, вам придется применить эту процедуру для каждого связанного компонента графа (в результате получится лес MST).

f9c69e9781fa194211448473495534 24.01.2021

Алгоритм MST Прима в Python

Ответы (1)

Похожие вопросы