Вопросы по теме 'gawk'

GNU awk: доступ к захваченным группам в замещающем тексте
Кажется, это должно быть очень просто, но поведение awk gensub / gsub / sub всегда было для меня непонятным, и теперь я просто не могу заставить его делать то, что говорится в документации (и какой опыт работы с огромным количеством другие подобные...
33078 просмотров
schedule 20.02.2022

формула в гавке
У меня есть проблема, которую я пытаюсь решить в gawk. Это должно быть так просто, но мои попытки закончились ошибкой деления на ноль. То, что я пытаюсь сделать, выглядит следующим образом: maxlines = 22 (fixed value) maxnumber = > max...
123 просмотров
schedule 21.07.2022

Как сделать что-то для каждого входного текстового файла
Скажем, я прочитал следующую информацию, хранящуюся в трех разных текстовых файлах (может быть намного больше) Файл 1 1 2 rt 45 2 3 er 44 Файл 2 rf r 4 5 3 er 4 t er t yu 4 Файл 3 er tyu 3er 3r der 4r 5e edr rty tyu 4r edr 5t...
3408 просмотров
schedule 26.05.2024

Скрипт Perl или Gawk, который возвращает ключевое слово, слово до и слово после?
Мне нужен простой скрипт для запуска в Windows, который ищет в больших XML-файлах ключевое слово, а затем возвращает слово до него, ключевое слово и слово после него. Например: "Как я могу извлечь ключевые слова в контексте?" Я хочу: "извлечь...
210 просмотров
schedule 27.04.2023

удалить строки из нескольких файлов с помощью gawk/awk/sed
У меня есть два набора текстовых файлов. Первый набор находится в папке AA. Второй комплект находится в папке BB. Содержимое файла ff.txt из первого набора (папка AA) показано ниже. Name number marks john 1 60...
936 просмотров
schedule 07.08.2022

Возможно ли иметь различное поведение для первого и второго входных файлов для awk?
Например, предположим, что я запускаю следующую команду: gawk -f AppendMapping.awk Reference.tsv TrueInput.tsv Предположим, что имена файлов БУДУТ изменены. Перебирая первый файл, я хочу создать сопоставление. map[$16]=$18 При...
150 просмотров
schedule 05.02.2023

gawk не хватает памяти при просмотре больших файлов: могу ли я оптимизировать свой код?
Я использую gawk для просмотра большого текстового корпуса (около 3-4 ГБ, сборник электронных книг), чтобы распечатать каждую ассоциацию из 3 слов, которые встречаются не менее 3 раз, для получения лингвистической статистики. Вот код: содержимое...
634 просмотров
schedule 14.06.2023

awk : если ›=4 строки подряд начинаются с + или - не печатать запись
Я пытаюсь использовать awk для чтения файла и отображать только строки, которые не начинаются с + или - 4 или более раз подряд. gawk тоже подойдет. Каждая группа отделяется пустой строкой. Вот образец из файла, это строки, которые я не хочу...
654 просмотров
schedule 07.01.2024

RegExp для соответствия дате и времени из пользовательского файла журнала
Я пишу сценарий, который для достижения величия должен преобразовать формат даты и времени из файла журнала в метку времени. Я хочу это для легкого сравнения позже. Мой файл журнала имеет формат: 2012-11-06 10:32:45 <log message follows...
4998 просмотров
schedule 22.08.2022

Регулярное выражение с awk или gawk
Я начинающий пользователь awk/gawk. Если я бегу ниже, оболочка мне ничего не дает. Пожалуйста помоги! echo "A=1,B=2,3,C=,D=5,6,E=7,8,9"|awk 'BEGIN{ n = split($0, arr, /,(?=\\w+=)/) for (x=1; x<n; x++) printf "arr[%d]=%s\n", x, arr[x] }'...
1146 просмотров
schedule 29.07.2022

Строка печати после сопоставления с шаблоном регулярного выражения
Я новичок в awk и застрял в этой проблеме. В основном я ищу шаблон, и я хочу разделить каждое совпадение с помощью "--", чтобы я мог легко использовать библиотеку yaml в рубине для анализа файла awk '/(start)/,/(end)/' #awk command I am doing...
1497 просмотров
schedule 09.04.2023

awk: использовать имена полей в качестве спецификаторов столбцов
awk обычно использует $1, $2 для указания столбцов. Предположим, что есть строка заголовка с именами полей для столбцов, есть ли способ указать столбец, используя имена полей, а не количество столбцов? например, для этого файла ID, Name,...
176 просмотров
schedule 31.10.2022

awk sort многомерный массив
GNU awk поддерживает многомерные массивы : q[1][1] = "dog" q[1][2] = 999 q[2][1] = "mouse" q[2][2] = 777 q[3][1] = "bird" q[3][2] = 888 Я хотел бы отсортировать «второй столбец» q так, чтобы у меня осталось: q[1][1] = "mouse" q[1][2] =...
3619 просмотров
schedule 07.08.2022

Awk или Gawk для сопоставления и слияния данных
Связанный вопрос: https://stackoverflow.com/posts/18164848 Входной файл input.txt представляет собой Unicode txt, разделенный табуляцией, с a A e f m b B g h c C i j b B k l Я хочу сопоставить первый и второй столбец и...
229 просмотров
schedule 19.03.2023

Отметка времени до эпохи в файле CSV с помощью GAWK
Требуется преобразовать удобочитаемые временные метки в эпоху/время Unix в файле CSV с помощью GAWK при подготовке к загрузке в базу данных MySQL. Пример данных: {null};2013-11-26;Text & Device;Location;/file/path/to/;Tuesday, November 26...
7349 просмотров
schedule 18.07.2023

В gawk gensub печатает только одну обратную косую черту
Здесь внизу я ожидал две косые черты, но получил одну, $ awk '{$0=gensub(/\[/,"\\\\","g")}1' <(echo [) \ sub работает нормально. Спасибо, Эрик Дж.
78 просмотров
schedule 19.10.2022

айк; сравнение времени загадочное поведение strftime
Используйте GNU-Awk (gawk) в UNXUTILS на ПК с Win-7. Этот вопрос касается strftime (.) и сравнения времени с его использованием. Следил за обсуждением как сравнивать значения strftime , потому что у меня похожая проблема. В данных финансового...
594 просмотров
schedule 02.08.2023

Соедините две таблицы с помощью AWK, одну из стандартного ввода, другую из файла
У меня есть два файла с разделителями табуляции: файл tmp1.tsv: 1 aaa 2 bbb 3 ccc 4 ddd 5 eee файл tmp2.tsv: 3 2 4 Я хочу получить это: 3 ccc 2 bbb 4 ddd Используя следующую процедуру: $ cat...
278 просмотров
schedule 18.09.2022

подсчет уникальных номеров из каждого файла
У меня есть файлы с именами file1, file2, file3......и т.д. Эти файлы находятся в папке f1. Содержимое файлов показано ниже. Я хотел бы подсчитать уникальные пары первого столбца в каждом файле. в некоторых файлах нет данных. Он печатается как...
57 просмотров
schedule 29.03.2022

Используйте несколько строк с Awk
У меня есть CSV с разделителями подчеркивания. У меня есть 8 строк, которые нужно преобразовать в одну таким образом: 101_1_variableName_(value) 101_1_variableName1_(value2) в: 101 1 (value) (value2) (желательно в разных коробках)...
115 просмотров
schedule 04.12.2022