В чем ошибка этого кода?

На основе этого логика, данная как ответ SO на другой (аналогичный) вопрос, чтобы удалить повторяющиеся числа в массиве с временной сложностью O (N), я реализовал эту логику на C, как показано ниже. Но результат моего кода не возвращает уникальных чисел. Я попытался отладить, но не смог понять, как это исправить.

int remove_repeat(int *a, int n)
{
    int i, k;

    k = 0;
    for (i = 1; i < n; i++)
    {
        if (a[k] != a[i]) 
        {
            a[k+1] = a[i];
            k++;            
        }
    }
    return (k+1);
}

main()
{
    int a[] = {1, 4, 1, 2, 3, 3, 3, 1, 5};
    int n;
    int i;

    n = remove_repeat(a, 9);

    for (i = 0; i < n; i++)
            printf("a[%d] = %d\n", i, a[i]);


}

1] Что неверно в приведенном выше коде для удаления дубликатов.

2] Любое другое решение этой проблемы за O (N) или O (NlogN). Его логика?

c arrays duplicate-removal

goldenmean 17.07.2011 источник

comment

Что вы узнали, когда попробовали отладить? - Cody Gray 17.07.2011

comment

Ваше намерение неясно. Мне ясно, что это не работает, опишите, пожалуйста, своими словами, что вы пытаетесь кодировать. - Drakosha 17.07.2011

comment

@Cody - Эта логика пытается построить подмассив от 0 до j уникальных чисел. - goldenmean 17.07.2011

comment

@Drakosha - Что не понятно выше? Попытка реализовать логику для удаления повторяющихся элементов (в данном случае целых чисел) из массива и возврата только уникальных элементов в том же массиве, пытаясь сделать это с временной сложностью O (N). - goldenmean 17.07.2011

comment

@goldenmean - я понимаю, что вопрос в том, в чем ваша идея, т.е. КАК вы планируете это сделать. - Drakosha 17.07.2011

comment

@Drakosha - В вашем предыдущем комментарии говорилось, что мои намерения неясны. ?? - goldenmean 17.07.2011

comment

@goldenmean - я имел в виду, что трудно понять, какой алгоритм вы кодируете, объяснение его на английском языке поможет. - Drakosha 17.07.2011

comment

@goldenmean позвольте нам продолжить обсуждение в чате - Drakosha 17.07.2011

Ответы (7)

arrow_upward
1
arrow_downward

Ваш код только проверяет, совпадает ли элемент в массиве со своим непосредственным предшественником.

Если ваш массив начинается отсортированным, это сработает, потому что все экземпляры определенного числа будут смежными.

Если ваш массив не отсортирован для начала, это не сработает, потому что экземпляры определенного числа могут не быть смежными, поэтому вам нужно просмотреть все предыдущие числа, чтобы определить, был ли один из них еще не видел.

Чтобы выполнить задание за время O (N log N), вы можете отсортировать массив, а затем использовать уже имеющуюся логику для удаления дубликатов из отсортированного массива. Очевидно, это полезно только в том случае, если вы в порядке с перестановкой чисел.

Если вы хотите сохранить исходный порядок, вы можете использовать что-то вроде хеш-таблицы или набора битов, чтобы отслеживать, было ли число уже просмотрено, и копировать каждое число в вывод только тогда / если оно еще не было просмотрено. Для этого меняем ваш текущий:

if (a[k] != a[i])
    a[k+1] = a[i];

примерно так:

if (!hash_find(hash_table, a[i])) { 
    hash_insert(hash_table, a[i]);
    a[k+1] = a[i];
}

Если все ваши числа попадают в довольно узкие границы или вы ожидаете, что значения будут плотными (т.е. присутствует большинство значений), вы можете использовать битовый набор вместо хеш-таблицы. Это будет просто массив битов, установленный в ноль или единицу, чтобы указать, было ли просмотрено конкретное число.

С другой стороны, если вас больше волнует верхняя граница сложности, чем средний случай, вы можете использовать сбалансированную древовидную коллекцию вместо хеш-таблицы. Обычно это использует больше памяти и работает медленнее, но его ожидаемая сложность и сложность наихудшего случая практически идентичны (O (N log N)). Типичная хеш-таблица вырождается от постоянной сложности к линейной в худшем случае, что изменит вашу общую сложность с O (N) на O (N ²).

Jerry Coffin 17.07.2011

arrow_upward
2
arrow_downward

Сортировка кучи за время O (n log n).
Выполните итерации за O (n) раз, заменяя повторяющиеся элементы контрольным значением (например, INT_MAX).
Снова выполните сортировку кучи за O (n log n), чтобы выделить повторяющиеся элементы.

По-прежнему ограничен O (n log n).

Matt Joiner 17.07.2011

arrow_upward
1
arrow_downward

Ваш код, по-видимому, требует, чтобы ввод был отсортирован. С несортированными входными данными, с которыми вы тестируете, ваш код не будет удалять все дубликаты (только соседние).

Iridium 17.07.2011

arrow_upward
1
arrow_downward

Вы можете получить решение O (N), если количество целых чисел известно заранее и меньше, чем объем памяти, который у вас есть :). Сделайте один проход, чтобы определить уникальные целые числа, которые у вас есть, используя вспомогательное хранилище, затем другой, чтобы вывести уникальные значения.

Код ниже написан на Java, но, надеюсь, вы уловили идею.

int[] removeRepeats(int[] a) {
    // Assume these are the integers between 0 and 1000
    Boolean[] v = new Boolean[1000]; // A lazy way of getting a tri-state var (false, true, null)

    for (int i=0;i<a.length;++i) {
       v[a[i]] = Boolean.TRUE;
    } 

    // v[i] = null => number not seen
    // v[i] = true => number seen

    int[] out = new int[a.length];
    int ptr = 0;
    for (int i=0;i<a.length;++i) {
        if (v[a[i]] != null && v[a[i]].equals(Boolean.TRUE)) {
            out[ptr++] = a[i];
            v[a[i]] = Boolean.FALSE;          
        }
    }

    // Out now doesn't contain duplicates, order is preserved and ptr represents how
    // many elements are set.
    return out;
}

Jeff Foster 17.07.2011

comment

@Jeff - Это не сработает, если у меня тоже числа -ve, не так ли. Первый шаг определения, виден ли номер или нет, может потерпеть неудачу? Есть предположения? - goldenmean; 17.07.2011

comment

@Drakosha Все циклы проходят над входным массивом, поэтому я думаю, что O (N)? Или я недопонимаю? @GoldenMean, если у вас есть ограниченная вселенная (например, числа от -50 до 50, тогда вы можете просто сдвигать значения. Это в основном тот же подход, что и использование хеш-таблицы для хранения количества чисел, только вместо этого используется идеальное хеширование. традиционной реализации массива + ведра или дерева. - Jeff Foster; 17.07.2011

comment

@ Джефф Фостер: я имел в виду, что инициализация v is O(number of integers). Есть трюк для инициализации массива в O (1), но для этого требуется больше памяти. - Drakosha; 17.07.2011

comment

@ Дракоша, ладно, я согласен с этим! Спасибо - Jeff Foster; 17.07.2011

arrow_upward
1
arrow_downward

Вам понадобятся два цикла: один для прохождения источника, а другой - для проверки каждого элемента в целевом массиве.

Вы не получите O (N).

[РЕДАКТИРОВАТЬ] В статье, на которую вы ссылаетесь, предлагается отсортированный выходной массив, что означает, что поиск дубликатов в выходном массиве может быть двоичным поиском ... который равен O (LogN).

Steve Wellens 17.07.2011

comment

Я думал, что в статье сказано: «Продолжайте от элемента a [1] к a [N]». На каждом этапе i все элементы слева от a [i] составляют отсортированную кучу элементов от a [0] до a [j]. Что означает, что для каждой итерации i элементы в a слева от i в [] являются отсортированными элементами, полученными с помощью этой логики? Я что-то упускаю? - goldenmean; 17.07.2011

arrow_upward
0
arrow_downward

Ваша логика просто неверна, значит, неверен и код. Сделайте свою логику самостоятельно, прежде чем ее кодировать. Я предлагаю способ O (NlnN) с модификацией heapsort. С помощью heapsort мы соединяем от a [i] к [n], находим минимум и заменяем его на [i], верно? Итак, теперь модификация: если минимум совпадает с [i-1], то поменяйте местами минимум и [n], уменьшите номер элемента массива на 1. Это должно сработать за O (NlnN) способом.

Khoa Le 17.07.2011

arrow_upward
0
arrow_downward

Ваш код будет работать только в определенных случаях. Ясно, что вы проверяете соседние значения, но повторяющиеся значения могут встречаться в любом месте массива. Следовательно, это совершенно неправильно.

schrodinger 17.07.2011

В чем ошибка этого кода?

Ответы (7)

Похожие вопросы