Вопросы по теме 'uniq'

Гарантировано ли, что при использовании Hadoop мои редукторы получат все записи с одним и тем же ключом?
Я запускаю задание Hadoop с использованием Hive, которое должно содержать uniq строки во многих текстовых файлах. На этапе сокращения он выбирает для каждого ключа самую последнюю запись с отметкой времени. Гарантирует ли Hadoop, что каждая...
5984 просмотров
schedule 09.04.2022

Создание уникального массива perl
В настоящее время у меня очень простая проблема с захватом вывода команды оболочки с обратной галочкой. Прошу прощения, что проблема довольно простая. У меня есть отсортированный массив (@valid_runs), который, как я знаю , содержит...
2212 просмотров
schedule 08.10.2022

Удалить строки, когда три столбца идентичны
У меня есть файл, разделенный табуляцией, и я хочу удалить строки (сохранить одну копию), которые идентичны только в первых трех столбцах. Я предпочитаю делать это с помощью unix, например, awk или uniq. Входной файл: Supercontig_1.1 241783...
666 просмотров
schedule 23.07.2022

awk: как удалить повторяющиеся строки в файле и одновременно вывести их в другой файл?
В настоящее время я работаю над скриптом, который обрабатывает CSV-файлы, и одна из вещей, которые он делает, — это удаление и сохранение повторяющихся строк в файлах. Мой текущий метод сделать это - запустить uniq один раз, используя uniq -d один...
2185 просмотров
schedule 07.03.2022

удалить первую строку, если есть дубликат
Я знаю, как удалить повторяющиеся строки, используя sort и uniq , но есть ли способ удалить первую строку, которая является дубликатом, а не второй? Например, если у меня есть файл со следующими строками: aaaaaaa bbbbbbb bbbbbbb ccccccc...
269 просмотров
schedule 13.03.2023

Исключить повторяющиеся строки из двух разных файлов и создать новые?
У меня есть несколько файлов списка слов, которые основаны на слове в строке. Теперь я хочу создать новый файл, который должен быть: сравнил первый и второй файл и подставил слова из второго файла, которых нет в первом, поместив их в третий...
139 просмотров
schedule 17.11.2022

Функция UNIX Grep
У меня есть файл со столбцами, разделенными табуляцией. Я хочу вычислить уникальные записи в столбце. Однако я хочу вычислить уникальность на основе только ввода в столбце и удалить все последующие маркеры в скобках. Таблица выглядит так: 1...
156 просмотров
schedule 24.11.2022

Как распечатать только уникальные строки в BASH?
Как я могу напечатать только те строки, которые появляются в файле ровно один раз? Например, для этого файла: mountain forest mountain eagle Результат будет таким, потому что строка mountain появляется дважды: forest eagle При...
43224 просмотров
schedule 30.12.2021

уникальный файл на основе двухстрочного совпадения
У меня есть файл с такими строками. Я хотел бы сделать это уникальным, где каждый уникальный элемент состоит из двух строк. так с тех пор bob 100 здесь дважды, я бы напечатал его только один раз. Помогите, пожалуйста. Благодарность,...
59 просмотров
schedule 20.09.2023

Поиск уникальной замены -c для больших файлов
У меня есть большой файл (50 ГБ), и я хотел бы подсчитать количество вхождений в нем разных строк. Обычно я бы использовал sort bigfile | uniq -c но файл достаточно большой, поэтому сортировка занимает непомерно много времени и памяти. я...
511 просмотров

простой способ изменить вывод uniq -c?
У меня есть такой простой файл: Термин1, столбец2, столбец3 Термин2, столбец2, столбец3 Термин3, столбец2, столбец3 Термин2, столбец2, столбец3 Термин1, столбец2, столбец3 Термин2, столбец2, столбец3 Если я отсортирую по первому столбцу и...
667 просмотров
schedule 15.06.2022

elisp реализация команды uniq -c Unix для подсчета уникальных строк
Если есть данные в регионе: flower park flower stone flower stone stone flower M-x some-command должен дать мне в другом буфере: 4 flower 2 stone 1 park Затем эти данные можно отсортировать по частоте или элементу.
382 просмотров
schedule 07.11.2022

Сортировать по столбцу и uniq по другому столбцу
У меня есть таблица ниже, которая разделена с помощью ";" и отсортирована как Дата;Имя;ID;Регион;Пусто;Номер карты;Температура Мне нужно было указать максимальную температуру карт, каждая карта должна быть уникальной. Также...
39 просмотров
schedule 01.03.2023

используя sort и uniq -c в awk из второй строки данных
Подобных вопросов много, но все они (которые я видел) интересуются сортировкой и подсчетом повторяющихся строк из первой строки данных. В моем случае мне нужно оставить первую строку нетронутой и сверху, при этом вызывая sort | uniq -c для всех...
85 просмотров
schedule 25.06.2023

Linux считывает файл журнала и фильтрует, чтобы получать сообщения журнала одного типа только один раз.
В моем файле журнала у меня есть три типа сообщений журнала: информация, предупреждение и ошибка. Я хочу получить только сообщения об ошибках, но поскольку существуют разные типы сообщений об ошибках, и одно и то же сообщение об ошибке может...
93 просмотров
schedule 06.05.2023