Javascript Union Pairs Union Найти

Я работаю над поиском профсоюза. Я хочу сгруппировать пары чисел на основе того, разделяет ли один из индексов число с индексом другой пары. Так:

У меня есть массив таких пар:

pairs: [[1,3], [6,8], [3,8], [2,7]]

как лучше всего сгруппировать их в такие союзы:

[ [ 1, 3, 8, 6 ], [ 2, 7 ] ]

([1,3] и [3,8] идут вместе, потому что они разделяют 3. Эта группа объединяется с [6,8], потому что они разделяют 8. Как лучше всего сделать это в javascript?

Вот другие примеры:

pairs: [[8,5], [10,8], [4,18], [20,12], [5,2], [17,2], [13,25],[29,12], [22,2], [17,11]]

into [ [ 8, 5, 10, 2, 17, 22, 11 ],[ 4, 18 ],[ 20, 12, 29 ],[ 13, 25 ] ]

Изменить Вот метод, который я сейчас использую:

findUnions = function(pairs, unions){
   if (!unions){
       unions = [pairs[0]];
       pairs.shift();
   }else{
       if(pairs.length){
           unions.push(pairs[0])
           pairs.shift()
       }
   }

    if (!pairs.length){
        return unions
    }
    unite = true
    while (unite && pairs.length){
        unite = false
        loop1:
        for (i in unions){
            loop2:
            var length = pairs.length;
            for (j=0;j<length;j++){
                if (unions[i].includes(pairs[j][0])){
                    if (!unions[i].includes(pairs[j][1])){
                        unions[i].push(pairs[j][1])
                        pairs.splice(j, 1)
                        j-=1;
                        length-=1
                        unite = true
                    }else{
                        pairs.splice(j, 1)
                        j-=1
                        length-=1
                    }
                }else if (unions[i].includes(pairs[j][1])){
                     unions[i].push(pairs[j][0])
                     pairs.splice(j, 1)
                     unite = true
                    j-=1
                    length-=1
                }
            }
        }
    }
    return findUnions(pairs, unions)
}

person Stephen Agwu    schedule 25.07.2017    source источник
comment
Почему 8 раньше 6 в [1, 3, 8, 6 ]? Конкретный заказ не является требованием?   -  person guest271314    schedule 26.07.2017
comment
Я бы назвал это поиском клики, а не поиском союза   -  person Joe Frambach    schedule 26.07.2017
comment
нет требований к заказу. 8 предшествует 6, потому что мой текущий алгоритм сначала добавляет (3,8), но это не важно   -  person Stephen Agwu    schedule 26.07.2017
comment
Джо Фрамбах, я отредактирую пост, чтобы сказать это. Я самоучка, поэтому я не силен в конкретных терминах   -  person Stephen Agwu    schedule 26.07.2017
comment
@JoeFrambach Что такое клика в компьютерном программировании?   -  person guest271314    schedule 26.07.2017
comment
Подобно этому en.wikipedia.org/wiki/Clique_(graph_theory), где пару [x, y] можно рассматривать как ребро от узла x до узла y. На выходе — набор кликов.   -  person Joe Frambach    schedule 26.07.2017
comment
@JoeFrambach Интересно. Один и тот же термин может иметь разное значение в зависимости от контекста.   -  person guest271314    schedule 26.07.2017
comment
Извините, клика неверна. Это означает, что все узлы связаны со всеми другими узлами клики, а это не то, что вам нужно. Вы ищете алгоритмы разбиения графа или что-то в этом роде. Я отмечу этот вопрос соответствующим образом.   -  person Joe Frambach    schedule 26.07.2017
comment
@JoeFrambach Я считаю, что forest — это термин, который вы искали. И непересекающееся объединение или поиск объединения — это тип алгоритма, который он ищет. И лес dfs, на мой взгляд, самый простой из них. Хотя википедия дает интересный вариант здесь.   -  person bowheart    schedule 26.07.2017


Ответы (3)


Метод:

finalArray = [], positions = {};    
for i to Array.length
   for j=i+1 to Array.length
       find match between arr[i] and arr[j]
       if match found
          pos = postion mapped to either i or j in positions
          add elements of arr[i] or arr[j] or both depending on pos.
return finalArray

В методе мы продолжаем хранить позиции массивов, которые мы добавляем в finalArray, в объекте position, а позже мы можем использовать этот объект, чтобы найти подходящую позицию для добавления элементов совпадающих массивов в finalArray.

function mergeArrays(finalArray, pos, subArray) {
for (var k = 0; k < subArray.length; k++) {
    if (finalArray[pos].indexOf(subArray[k]) < 0)
        finalArray[pos].push(subArray[k]);
}

}

function unionArrays(arr) {
var finalArray = [arr[0]],
    positions = {
        0: 0
    };
for (var i = 0; i < arr.length; i++) {
    for (var j = i + 1; j < arr.length; j++) {
        for (var k = 0; k < arr[i].length; k++) {
            if (arr[j].indexOf(arr[i][k]) >= 0) {
                if (i in positions) {
                    mergeArrays(finalArray, positions[i], arr[j]);
                    positions[j] = positions[i];
                } else if (j in positions) {
                    mergeArrays(finalArray, positions[j], arr[i]);
                    positions[i] = positions[j];
                } else {
                    var pos = finalArray.length;
                    finalArray.push([]);
                    mergeArrays(finalArray, pos, arr[i]);
                    mergeArrays(finalArray, pos, arr[j]);
                    positions[i] = positions[j] = pos;
                }
                break;
            }

        }
    }
    if (!(i in positions)) {
        finalArray.push(arr[i]);
        positions[i] = finalArray.length - 1;
    }
}
return finalArray;
}
console.log(unionArrays([[1,3], [6,8], [3,8], [2,7]]));
console.log(unionArrays([[8,5], [10,8], [4,18], [20,12], [5,2], [17,2], [13,25],[29,12], [22,2], [17,11]]));

person Dij    schedule 26.07.2017
comment
хорошо, намного чище, чем метод, который я придумал. Я посмотрю, смогу ли я улучшить это - person Stephen Agwu; 26.07.2017
comment
хммм, кажется, ваш алгоритм в то время как уборщик может быть медленнее. Я использую этот алгоритм как часть более крупной функции, и когда я заменяю свою на вашу, время ожидания большей функции истекает (я ограничен 4000 мс). Я отредактирую исходный пост своим методом, чтобы мы могли сравнить - person Stephen Agwu; 26.07.2017
comment
@stephenagwu Я улучшил свой метод, проверьте сейчас. - person Dij; 26.07.2017
comment
Очаровательный. Наивный алгоритм, конечно, но удивительно эффективный. Я хотел бы отметить, что это не ухудшается хорошо. Но этого вполне достаточно для поставленной задачи. Хорошая работа. - person bowheart; 26.07.2017

Ах. Алгоритм, который вы ищете, - это лес dfs. В В Википедии есть много полезного о деревьях и лесах.

Лес dfs — это просто dfs (поиск в глубину), который запускается до тех пор, пока не останется непосещенных узлов. В результате получается граф («лес») связных и изолированных подграфов («деревьев»). Это те "союзы", о которых вы говорите.

Поиск в глубину намного проще (и быстрее), когда каждый узел сопоставляется с узлами, с которыми он связан. Итак, вместо этих данных:

[[1,3], [6,8], [3,8], [2,7]]

вы хотите:

{1: [3], 2: [7], 3: [1, 8], 6: [8], 7: [2], 8: [6, 3]}

Преобразование ваших данных довольно тривиально (и быстро):

function mapNodes(edges) {
    let nodeMap = {}

    edges.forEach(edge => {
        let node1 = edge[0]
        let node2 = edge[1]

        if (!nodeMap[node1]) nodeMap[node1] = [node2]
        else nodeMap[node1].push(node2)

        if (!nodeMap[node2]) nodeMap[node2] = [node1]
        else nodeMap[node2].push(node1)
    })
    return nodeMap
}

Тогда сам dfs представляет собой простой рекурсивный алгоритм, и лес dfs просто продолжает выполнять его до тех пор, пока не останется непосещенных узлов. Вот [EDIT: не так] грубый пример:

function dfsForest(nodeMap) {
    let forest = []
    let nodes = Object.keys(nodeMap)

    while (true) {
        let root = +nodes.find(node => !nodeMap[node].visited)
        if (isNaN(root)) break // all nodes visited

        forest.push(dfs(root, nodeMap))
    }
    return forest
}

function dfs(root, nodeMap, tree = []) {
    if (tree.includes(root)) return tree // base case

    tree.push(root)
    nodeMap[root].visited = true

    let connectedNodes = nodeMap[root]
    for (let i = 0; i < connectedNodes.length; i++) {
        let connectedNode = connectedNodes[i]
        dfs(connectedNode, nodeMap, tree)
    }
    return tree
}

А вот JSFiddle со всем этим.

РЕДАКТИРОВАТЬ:

Ну, я сказал, что это было грубо. Я отредактировал код и скрипку, удалив лишний массив visitedNodes и созданный им алгоритм n-квадратов. Он должен быть примерно таким же молниеносно быстрым, как сейчас.

В моих тестах требуется около 350 миллисекунд, чтобы переформатировать данные И запустить лес dfs на 5000 очень неоптимальных пар. В оптимальном случае это занимает около 50 миллисекунд. И деградирует очень хорошо. Например, удвоение общего количества ребер увеличит время выполнения от 1,5 до 2,5 раз, в зависимости от того, насколько оптимальны пары.

Фактически, вот JSFiddle с ответом @Dij. Вы увидите, если вы удвоите количество ребер, время выполнения увеличится в четыре раза (yikes). У его алгоритма есть интересная особенность: нет оптимальных/неоптимальных случаев; все занимает одинаковое количество времени. Однако даже в самом неоптимальном случае лес dfs по-прежнему немного быстрее, чем эта фиксированная скорость.

person bowheart    schedule 26.07.2017
comment
Дэн, я никогда не думал о том, чтобы сделать это таким образом. Проблема, с которой я сталкиваюсь, заключается в том, что мой алгоритм истекает при 5000 пар (максимальное количество). Я дам вам знать, что происходит с вашим. Спасибо за ответ! - person Stephen Agwu; 26.07.2017
comment
@stephenagwu Я не шутил, когда сказал, что это грубый пример. Я поспешно собрал его, не особо задумываясь о производительности. Я должен больше уважать SO, и я извиняюсь за это. Я отредактировал его сейчас, чтобы сделать его настоящим, удивительным лесом dfs. Удачного кодирования! - person bowheart; 26.07.2017

Чтобы выполнить первое требование, вы можете выполнить итерацию массива, в рамках процедуры итерации исключить текущий массив из нового массива, содержащего все соседние индексы. Проверьте, содержат ли соседние массивы один или несколько элементов текущего массива, если true, поместите элементы в новый массив.

Отфильтровать исходный массив для элементов, которые не содержат элементы ранее отфильтрованного массива.

Используйте Set для удаления повторяющихся записей из массивов.

const arr = [[1,3], [6,8], [3,8], [2,7]];

let res = [];

for (const[key, [a, b]] of Object.entries(arr)) {
  const adjacent = arr.filter((el, index) => index !== +key);

const has = adjacent.filter(el => el.includes(a) || el.includes(b));
  res = [...res, ...has.filter(prop => !res.includes(prop))];
}

let not = new Set(...arr.filter(([a, b]) => !res.some(([c, d]) => 
            a === c || b === d || a === d || b === c)));

let set = new Set();

for (const [a, b] of res) {
  if (!set.has(a)) set.add(a);
  if (!set.has(b)) set.add(b);
}

res = [[...set], [...not]];

console.log(res);

person guest271314    schedule 26.07.2017
comment
вау спасибо за этот ответ. Я немного новичок, поэтому я все еще пытаюсь расшифровать каждую строку. Например: строка, начинающаяся с const смежной = arr.filter... (первая), что представляет собой часть «+key». - person Stephen Agwu; 26.07.2017
comment
@stephenagwu Object.entries() возвращает массив свойств, значений объекта. Обычно при передаче массива пары свойство-значение представляют собой [индекс, массив] или [key, [a, b]] с использованием присваивания деструктурирования, где key — это индекс в виде строки, [a, b] представляет элементы массива, например 1 : a, 3: b. Свойства объекта представляют собой строки, оператор + приводит индекс : key массива к числу. Вероятно, эффективность процедуры может быть улучшена. - person guest271314; 26.07.2017
comment
о, так это будет то же самое, что и использование parseInt(key)? - person Stephen Agwu; 26.07.2017
comment
Да или Number("1") - person guest271314; 26.07.2017
comment
интересный. Из вашего кода кажется, что я знаю, как делать многие из этих вещей, просто не на таком высоком уровне. Но использование Sets было потрясающим, спасибо за ответ! - person Stephen Agwu; 26.07.2017
comment
Set использовался для удаления дубликатов из массива и, вероятно, мог заменить методы Array. - person guest271314; 26.07.2017