Вопросы по теме 'uniq'
Гарантировано ли, что при использовании Hadoop мои редукторы получат все записи с одним и тем же ключом?
Я запускаю задание Hadoop с использованием Hive, которое должно содержать uniq строки во многих текстовых файлах. На этапе сокращения он выбирает для каждого ключа самую последнюю запись с отметкой времени.
Гарантирует ли Hadoop, что каждая...
5984 просмотров
schedule
09.04.2022
Создание уникального массива perl
В настоящее время у меня очень простая проблема с захватом вывода команды оболочки с обратной галочкой. Прошу прощения, что проблема довольно простая.
У меня есть отсортированный массив (@valid_runs), который, как я знаю , содержит...
2212 просмотров
schedule
08.10.2022
Удалить строки, когда три столбца идентичны
У меня есть файл, разделенный табуляцией, и я хочу удалить строки (сохранить одну копию), которые идентичны только в первых трех столбцах. Я предпочитаю делать это с помощью unix, например, awk или uniq.
Входной файл:
Supercontig_1.1 241783...
666 просмотров
schedule
23.07.2022
awk: как удалить повторяющиеся строки в файле и одновременно вывести их в другой файл?
В настоящее время я работаю над скриптом, который обрабатывает CSV-файлы, и одна из вещей, которые он делает, — это удаление и сохранение повторяющихся строк в файлах. Мой текущий метод сделать это - запустить uniq один раз, используя uniq -d один...
2185 просмотров
schedule
07.03.2022
удалить первую строку, если есть дубликат
Я знаю, как удалить повторяющиеся строки, используя sort и uniq , но есть ли способ удалить первую строку, которая является дубликатом, а не второй?
Например, если у меня есть файл со следующими строками:
aaaaaaa
bbbbbbb
bbbbbbb
ccccccc...
269 просмотров
schedule
13.03.2023
Исключить повторяющиеся строки из двух разных файлов и создать новые?
У меня есть несколько файлов списка слов, которые основаны на слове в строке.
Теперь я хочу создать новый файл, который должен быть:
сравнил первый и второй файл и подставил слова из второго файла, которых нет в первом, поместив их в третий...
139 просмотров
schedule
17.11.2022
Функция UNIX Grep
У меня есть файл со столбцами, разделенными табуляцией. Я хочу вычислить уникальные записи в столбце. Однако я хочу вычислить уникальность на основе только ввода в столбце и удалить все последующие маркеры в скобках.
Таблица выглядит так:
1...
156 просмотров
schedule
24.11.2022
Как распечатать только уникальные строки в BASH?
Как я могу напечатать только те строки, которые появляются в файле ровно один раз? Например, для этого файла:
mountain
forest
mountain
eagle
Результат будет таким, потому что строка mountain появляется дважды:
forest
eagle
При...
43224 просмотров
schedule
30.12.2021
уникальный файл на основе двухстрочного совпадения
У меня есть файл с такими строками. Я хотел бы сделать это уникальным, где каждый уникальный элемент состоит из двух строк. так с тех пор
bob
100
здесь дважды, я бы напечатал его только один раз. Помогите, пожалуйста. Благодарность,...
59 просмотров
schedule
20.09.2023
Поиск уникальной замены -c для больших файлов
У меня есть большой файл (50 ГБ), и я хотел бы подсчитать количество вхождений в нем разных строк. Обычно я бы использовал
sort bigfile | uniq -c
но файл достаточно большой, поэтому сортировка занимает непомерно много времени и памяти. я...
511 просмотров
schedule
16.12.2022
простой способ изменить вывод uniq -c?
У меня есть такой простой файл:
Термин1, столбец2, столбец3 Термин2, столбец2, столбец3 Термин3, столбец2, столбец3 Термин2, столбец2, столбец3 Термин1, столбец2, столбец3 Термин2, столбец2, столбец3
Если я отсортирую по первому столбцу и...
667 просмотров
schedule
15.06.2022
elisp реализация команды uniq -c Unix для подсчета уникальных строк
Если есть данные в регионе:
flower
park
flower
stone
flower
stone
stone
flower
M-x some-command должен дать мне в другом буфере:
4 flower
2 stone
1 park
Затем эти данные можно отсортировать по частоте или элементу.
382 просмотров
schedule
07.11.2022
Сортировать по столбцу и uniq по другому столбцу
У меня есть таблица ниже, которая разделена с помощью ";" и отсортирована как
Дата;Имя;ID;Регион;Пусто;Номер карты;Температура
Мне нужно было указать максимальную температуру карт, каждая карта должна быть уникальной. Также...
39 просмотров
schedule
01.03.2023
используя sort и uniq -c в awk из второй строки данных
Подобных вопросов много, но все они (которые я видел) интересуются сортировкой и подсчетом повторяющихся строк из первой строки данных. В моем случае мне нужно оставить первую строку нетронутой и сверху, при этом вызывая sort | uniq -c для всех...
85 просмотров
schedule
25.06.2023
Linux считывает файл журнала и фильтрует, чтобы получать сообщения журнала одного типа только один раз.
В моем файле журнала у меня есть три типа сообщений журнала: информация, предупреждение и ошибка. Я хочу получить только сообщения об ошибках, но поскольку существуют разные типы сообщений об ошибках, и одно и то же сообщение об ошибке может...
93 просмотров
schedule
06.05.2023