Вопросы по теме 'gawk'
GNU awk: доступ к захваченным группам в замещающем тексте
Кажется, это должно быть очень просто, но поведение awk gensub / gsub / sub всегда было для меня непонятным, и теперь я просто не могу заставить его делать то, что говорится в документации (и какой опыт работы с огромным количеством другие подобные...
33078 просмотров
schedule
20.02.2022
формула в гавке
У меня есть проблема, которую я пытаюсь решить в gawk. Это должно быть так просто, но мои попытки закончились ошибкой деления на ноль.
То, что я пытаюсь сделать, выглядит следующим образом:
maxlines = 22 (fixed value)
maxnumber = > max...
123 просмотров
schedule
21.07.2022
Как сделать что-то для каждого входного текстового файла
Скажем, я прочитал следующую информацию, хранящуюся в трех разных текстовых файлах (может быть намного больше)
Файл 1
1 2 rt 45
2 3 er 44
Файл 2
rf r 4 5
3 er 4 t
er t yu 4
Файл 3
er tyu 3er 3r
der 4r 5e
edr rty tyu 4r
edr 5t...
3408 просмотров
schedule
26.05.2024
Скрипт Perl или Gawk, который возвращает ключевое слово, слово до и слово после?
Мне нужен простой скрипт для запуска в Windows, который ищет в больших XML-файлах ключевое слово, а затем возвращает слово до него, ключевое слово и слово после него.
Например: "Как я могу извлечь ключевые слова в контексте?" Я хочу: "извлечь...
210 просмотров
schedule
27.04.2023
удалить строки из нескольких файлов с помощью gawk/awk/sed
У меня есть два набора текстовых файлов. Первый набор находится в папке AA. Второй комплект находится в папке BB. Содержимое файла ff.txt из первого набора (папка AA) показано ниже.
Name number marks
john 1 60...
936 просмотров
schedule
07.08.2022
Возможно ли иметь различное поведение для первого и второго входных файлов для awk?
Например, предположим, что я запускаю следующую команду:
gawk -f AppendMapping.awk Reference.tsv TrueInput.tsv
Предположим, что имена файлов БУДУТ изменены. Перебирая первый файл, я хочу создать сопоставление.
map[$16]=$18
При...
150 просмотров
schedule
05.02.2023
gawk не хватает памяти при просмотре больших файлов: могу ли я оптимизировать свой код?
Я использую gawk для просмотра большого текстового корпуса (около 3-4 ГБ, сборник электронных книг), чтобы распечатать каждую ассоциацию из 3 слов, которые встречаются не менее 3 раз, для получения лингвистической статистики. Вот код:
содержимое...
634 просмотров
schedule
14.06.2023
awk : если ›=4 строки подряд начинаются с + или - не печатать запись
Я пытаюсь использовать awk для чтения файла и отображать только строки, которые не начинаются с + или - 4 или более раз подряд. gawk тоже подойдет. Каждая группа отделяется пустой строкой.
Вот образец из файла, это строки, которые я не хочу...
654 просмотров
schedule
07.01.2024
RegExp для соответствия дате и времени из пользовательского файла журнала
Я пишу сценарий, который для достижения величия должен преобразовать формат даты и времени из файла журнала в метку времени. Я хочу это для легкого сравнения позже.
Мой файл журнала имеет формат:
2012-11-06 10:32:45
<log message follows...
4998 просмотров
schedule
22.08.2022
Регулярное выражение с awk или gawk
Я начинающий пользователь awk/gawk. Если я бегу ниже, оболочка мне ничего не дает. Пожалуйста помоги!
echo "A=1,B=2,3,C=,D=5,6,E=7,8,9"|awk 'BEGIN{
n = split($0, arr, /,(?=\\w+=)/)
for (x=1; x<n; x++) printf "arr[%d]=%s\n", x, arr[x]
}'...
1146 просмотров
schedule
29.07.2022
Строка печати после сопоставления с шаблоном регулярного выражения
Я новичок в awk и застрял в этой проблеме. В основном я ищу шаблон, и я хочу разделить каждое совпадение с помощью "--", чтобы я мог легко использовать библиотеку yaml в рубине для анализа файла
awk '/(start)/,/(end)/' #awk command I am doing...
1497 просмотров
schedule
09.04.2023
awk: использовать имена полей в качестве спецификаторов столбцов
awk обычно использует $1, $2 для указания столбцов. Предположим, что есть строка заголовка с именами полей для столбцов, есть ли способ указать столбец, используя имена полей, а не количество столбцов?
например, для этого файла
ID, Name,...
176 просмотров
schedule
31.10.2022
awk sort многомерный массив
GNU awk поддерживает многомерные массивы :
q[1][1] = "dog"
q[1][2] = 999
q[2][1] = "mouse"
q[2][2] = 777
q[3][1] = "bird"
q[3][2] = 888
Я хотел бы отсортировать «второй столбец» q так, чтобы у меня осталось:
q[1][1] = "mouse"
q[1][2] =...
3619 просмотров
schedule
07.08.2022
Awk или Gawk для сопоставления и слияния данных
Связанный вопрос: https://stackoverflow.com/posts/18164848
Входной файл input.txt представляет собой Unicode txt, разделенный табуляцией, с
a A e f m
b B g h
c C i j
b B k l
Я хочу сопоставить первый и второй столбец и...
229 просмотров
schedule
19.03.2023
Отметка времени до эпохи в файле CSV с помощью GAWK
Требуется преобразовать удобочитаемые временные метки в эпоху/время Unix в файле CSV с помощью GAWK при подготовке к загрузке в базу данных MySQL.
Пример данных:
{null};2013-11-26;Text & Device;Location;/file/path/to/;Tuesday, November 26...
7349 просмотров
schedule
18.07.2023
В gawk gensub печатает только одну обратную косую черту
Здесь внизу я ожидал две косые черты, но получил одну,
$ awk '{$0=gensub(/\[/,"\\\\","g")}1' <(echo [)
\
sub работает нормально.
Спасибо,
Эрик Дж.
78 просмотров
schedule
19.10.2022
айк; сравнение времени загадочное поведение strftime
Используйте GNU-Awk (gawk) в UNXUTILS на ПК с Win-7. Этот вопрос касается strftime (.) и сравнения времени с его использованием.
Следил за обсуждением как сравнивать значения strftime , потому что у меня похожая проблема. В данных финансового...
594 просмотров
schedule
02.08.2023
Соедините две таблицы с помощью AWK, одну из стандартного ввода, другую из файла
У меня есть два файла с разделителями табуляции:
файл tmp1.tsv:
1 aaa
2 bbb
3 ccc
4 ddd
5 eee
файл tmp2.tsv:
3
2
4
Я хочу получить это:
3 ccc
2 bbb
4 ddd
Используя следующую процедуру:
$ cat...
278 просмотров
schedule
18.09.2022
подсчет уникальных номеров из каждого файла
У меня есть файлы с именами file1, file2, file3......и т.д. Эти файлы находятся в папке f1. Содержимое файлов показано ниже. Я хотел бы подсчитать уникальные пары первого столбца в каждом файле. в некоторых файлах нет данных. Он печатается как...
57 просмотров
schedule
29.03.2022
Используйте несколько строк с Awk
У меня есть CSV с разделителями подчеркивания. У меня есть 8 строк, которые нужно преобразовать в одну таким образом:
101_1_variableName_(value)
101_1_variableName1_(value2)
в:
101 1 (value) (value2)
(желательно в разных коробках)...
115 просмотров
schedule
04.12.2022