Преобразование окончаний строк для всего дерева каталогов (Git)

Следующая ситуация:

Я работаю над Mac под управлением OS X и недавно присоединился к проекту, все участники которого пока используют Windows. Одной из моих первых задач было настроить базу кода в репозитории Git, поэтому я вытащил дерево каталогов с FTP и попытался проверить его в репозитории Git, который я подготовил локально. Когда я пытался это сделать, все, что у меня было, было это

fatal: CRLF would be replaced by LF in blog/license.txt.

Поскольку это влияет на все файлы, расположенные ниже папки «blog», я ищу способ удобно преобразовать ВСЕ файлы в дереве в концы строк Unix. Есть ли инструмент, который делает это из коробки, или я могу написать что-нибудь сам?

Для справки, моя конфигурация Git, касающаяся окончания строк:

core.safecrlf=true
core.autocrlf=input

person Lunikon    schedule 15.08.2011    source источник


Ответы (6)


dos2unix сделает это за вас. Довольно простой процесс.
dos2unix filename

Благодаря toolbear, вот однострочник, который рекурсивно заменяет окончания строк и правильно обрабатывает пробелы, кавычки и метасимволы оболочки.

find . -type f -exec dos2unix {} \;

Если вы используете dos2unix 6.0, двоичные файлы будут проигнорированы.

person Andy    schedule 15.08.2011
comment
find blog -type f | xargs dos2unix должно быть быстрее. Вам также не нужен -name *.*, если только вы специально не хотите только файлы с точкой где-нибудь в имени. Это глобус для Windows, а не для * nix. - person Useless; 15.08.2011
comment
Соединение find с xargs завершится ошибкой, если find сопоставляет любые файлы с пробелами, кавычками или другими метасимволами оболочки в их пути. По крайней мере, используйте find blog -type f -print0 | xargs -0 dos2unix для обработки случая пробелов. Вы должны использовать -exec -exec вместо конвейера, чтобы избежать кавычек и т. Д. На странице dos2unix man не указано, каково его поведение, если вы вызываете его для двоичных файлов. Если он преобразует CRLF в двоичные файлы, он их испортит. См. Мой ответ для более безопасной, хотя и более длинной альтернативы. - person toolbear; 23.09.2011
comment
@lukmdo, который не является версией, установленной на centos 6.4 ..... который их затирает .... вместо этого мне пришлось делать d / l отсюда rpmfind.net/linux/rpm2html/search.php?query=dos2unix - person Kerridge0; 20.08.2013
comment
Приложение: CLI dos2unix проще всего установить через Homebrew (а не через npm). - person 2540625; 07.08.2015
comment
Как при таком подходе игнорировать каталоги, если это возможно? - person datatype_void; 29.03.2016
comment
В конце концов, мне нужно было использовать тупые кавычки, потому что мои имена файлов содержали (по крайней мере) запятые: find . -type f -exec dos2unix "{}" \;. - person Denis Drescher; 10.01.2017
comment
KDiff3 сообщает мне, что эта команда изменила для меня кодировку с UTF-8-BOM на System (?), Что было не очень хорошо. Хотя похоже, что кодировка по умолчанию для dos2unix - ascii, которая должна быть UTF- 8? Есть идеи, что там произошло? - person ruffin; 08.07.2018
comment
Стоит отметить, что не запускайте этот инструмент непосредственно в своем репо, иначе он уничтожит ваш .git, и вам придется клонировать из источника :) - person Qwerty; 05.03.2020
comment
@DenisDrescher Не могли бы вы объяснить, что означает {} и \? - person kajibu; 25.06.2021
comment
@kajibu Справочная страница может объяснить это лучше: «Выражение должно заканчиваться точкой с запятой (;). Если вы вызываете find из оболочки, вам может потребоваться заключить точку с запятой в кавычки, если оболочка в противном случае будет рассматривать ее как управляющий оператор. Если строка {} появляется где-нибудь в имени утилиты или аргументах, она заменяется на путь к текущему файлу ». - person Denis Drescher; 26.06.2021

Предполагая, что у вас есть GNU grep и perl, это рекурсивно преобразует CRLF в LF в небинарных файлах в текущем каталоге:

find . -type f -exec grep -qIP '\r\n' {} ';' -exec perl -pi -e 's/\r\n/\n/g' {} '+'

Как это работает

Рекурсивно искать в текущем каталоге; измените подкаталоги . на blog или whatev, чтобы ограничить замену:

find .

Соответствовать только обычным файлам:

  -type f

Проверьте, содержит ли файл CRLF. Исключить двоичные файлы. Запускает команду grep для каждого обычного файла. Это цена исключения двоичных файлов. Если у вас старый grep, вы можете попробовать создать тест с помощью команды file:

  -exec grep -qIP '\r\n' {} ';'

Замените CRLF на LF. '+' со вторым -exec указывает find накапливать совпадающие файлы и передавать их одному (или как можно меньшему количеству) вызовов команды - например, конвейер к xargs, но без проблем, если путь к файлу содержит пробелы, кавычки или другие метаданные оболочки. символы. i в -pi сообщает Perl, что нужно изменить файл на месте. Вы можете использовать sed или awk здесь с некоторой работой, и вы, вероятно, измените '+' на ';' и вызывать отдельный процесс для каждого совпадения:

  -exec perl -pi -e 's/\r\n/\n/g' {} '+'
person toolbear    schedule 23.09.2011
comment
В случае, если это кому-то поможет: grep -qIP '\r\n' никогда ничего не соответствует в моей системе CentOS. Изменение на grep -qIP '\r$' сработало. - person Steve Onorato; 20.01.2016
comment
Ненавижу спрашивать в комментариях, но есть ли способ исключить такую ​​папку, как node_modules? - person datatype_void; 28.03.2016
comment
@datatype_void взгляните на stackoverflow.com / questions / 4210042 /, чтобы узнать, как изменить find часть команды, чтобы исключить каталоги. Они предлагают использовать -path, но вы также можете использовать -regex или -iregex, т.е. -not -regex '.*/node_modules/.*', что исключает node_modules на любой глубине. - person toolbear; 05.04.2016
comment
Извините, если я выгляжу regex или bash нубом, но как насчет нескольких исключений, например, node_module и dist? - person datatype_void; 05.04.2016
comment
GNU grep требуется для флага -P. OS X перешла с GNU grep на BSD grep. Некоторые альтернативы для OS X: stackoverflow.com/questions/16658333/ - person toolbear; 23.05.2016
comment
Мне также нужно было использовать \ r $ в Linux Mint, как предложил @SteveOnorato. Странный - person Xerus; 26.04.2018
comment
Спасибо за подробное объяснение того, как это работает. Это помогает нам понимать и учиться лучше, чем просто копирование и вставка! - person TetraDev; 02.08.2020
comment
Итак, в linux mint команда становится find . -type f -exec grep -qIP '\r$' {} ';' -exec perl -pi -e 's/\r$/\n/g' {} '+' - person blueray; 18.12.2020

Вот лучший вариант: Швейцарский файловый нож. Он рекурсивно работает в подкаталогах и правильно обрабатывает пробелы и специальные символы.

Все, что вам нужно сделать, это:

sfk remcr -dir your_project_directory

Бонус: sfk также выполняет множество других преобразований. См. Полный список ниже:

SFK - The Swiss File Knife File Tree Processor.
Release 1.6.7 Base Revision 2 of May  3 2013.
StahlWorks Technologies, http://stahlworks.com/
Distributed for free under the BSD License, without any warranty.

type "sfk commandname" for help on any of the following.
some commands require to add "-help" for the help text.

   file system
      sfk list       - list directory tree contents.
                       list latest, oldest or biggest files.
                       list directory differences.
                       list zip jar tar gz bz2 contents.
      sfk filefind   - find files by filename
      sfk treesize   - show directory size statistics
      sfk copy       - copy directory trees additively
      sfk sync       - mirror tree content with deletion
      sfk partcopy   - copy part from a file into another one
      sfk mkdir      - create directory tree
      sfk delete     - delete files and folders
      sfk deltree    - delete whole directory tree
      sfk deblank    - remove blanks in filenames
      sfk space [-h] - tell total and free size of volume
      sfk filetime   - tell times of a file
      sfk touch      - change times of a file

   conversion
      sfk lf-to-crlf - convert from LF to CRLF line endings
      sfk crlf-to-lf - convert from CRLF to LF line endings
      sfk detab      - convert TAB characters to spaces
      sfk entab      - convert groups of spaces to TAB chars
      sfk scantab    - list files containing TAB characters
      sfk split      - split large files into smaller ones
      sfk join       - join small files into a large one
      sfk hexdump    - create hexdump from a binary file
      sfk hextobin   - convert hex data to binary
      sfk hex        - convert decimal number(s) to hex
      sfk dec        - convert hex number(s) to decimal
      sfk chars      - print chars for a list of codes
      sfk bin-to-src - convert binary to source code

   text processing
      sfk filter     - search, filter and replace text data
      sfk addhead    - insert string at start of text lines
      sfk addtail    - append string at end of text lines
      sfk patch      - change text files through a script
      sfk snapto     - join many text files into one file
      sfk joinlines  - join text lines split by email reformatting
      sfk inst       - instrument c++ sourcecode with tracing calls
      sfk replace    - replace words in binary and text files
      sfk hexfind    - find words in binary files, showing hexdump
      sfk run        - run command on all files of a folder
      sfk runloop    - run a command n times in a loop
      sfk printloop  - print some text many times
      sfk strings    - extract strings from a binary file
      sfk sort       - sort text lines produced by another command
      sfk count      - count text lines, filter identical lines
      sfk head       - print first lines of a file
      sfk tail       - print last lines of a file
      sfk linelen    - tell length of string(s)

   search and compare
      sfk find       - find words in binary files, showing text
      sfk md5gento   - create list of md5 checksums over files
      sfk md5check   - verify list of md5 checksums over files
      sfk md5        - calc md5 over a file, compare two files
      sfk pathfind   - search PATH for location of a command
      sfk reflist    - list fuzzy references between files
      sfk deplist    - list fuzzy dependencies between files
      sfk dupfind    - find duplicate files by content

   networking
      sfk httpserv   - run an instant HTTP server.
                       type "sfk httpserv -help" for help.
      sfk ftpserv    - run an instant FTP server
                       type "sfk ftpserv -help" for help.
      sfk ftp        - instant anonymous FTP client
      sfk wget       - download HTTP file from the web
      sfk webrequest - send HTTP request to a server
      sfk tcpdump    - print TCP conversation between programs
      sfk udpdump    - print incoming UDP requests
      sfk udpsend    - send UDP requests
      sfk ip         - tell own machine's IP address(es).
                       type "sfk ip -help" for help.
      sfk netlog     - send text outputs to network,
                       and/or file, and/or terminal

   scripting
      sfk script     - run many sfk commands in a script file
      sfk echo       - print (coloured) text to terminal
      sfk color      - change text color of terminal
      sfk alias      - create command from other commands
      sfk mkcd       - create command to reenter directory
      sfk sleep      - delay execution for milliseconds
      sfk pause      - wait for user input
      sfk label      - define starting point for a script
      sfk tee        - split command output in two streams
      sfk tofile     - save command output to a file
      sfk toterm     - flush command output to terminal
      sfk loop       - repeat execution of a command chain
      sfk cd         - change directory within a script
      sfk getcwd     - print the current working directory
      sfk require    - compare version text

   development
      sfk bin-to-src - convert binary data to source code
      sfk make-random-file - create file with random data
      sfk fuzz       - change file at random, for testing
      sfk sample     - print example code for programming
      sfk inst       - instrument c++ with tracing calls

   diverse
      sfk media      - cut video and binary files
      sfk view       - show results in a GUI tool
      sfk toclip     - copy command output to clipboard
      sfk fromclip   - read text from clipboard
      sfk list       - show directory tree contents
      sfk env        - search environment variables
      sfk version    - show version of a binary file
      sfk ascii      - list ISO 8859-1 ASCII characters
      sfk ascii -dos - list OEM codepage 850 characters
      sfk license    - print the SFK license text

   help by subject
      sfk help select   - how dirs and files are selected in sfk
      sfk help options  - general options reference
      sfk help patterns - wildcards and text patterns within sfk
      sfk help chain    - how to combine (chain) multiple commands
      sfk help shell    - how to optimize the windows command prompt
      sfk help unicode  - about unicode file reading support
      sfk help colors   - how to change result colors
      sfk help xe       - for infos on sfk extended edition.

   All tree walking commands support file selection this way:

   1. short format with ONE directory tree and MANY file name patterns:
      src1dir .cpp .hpp .xml bigbar !footmp
   2. short format with a list of explicite file names:
      letter1.txt revenues9.xls report3\turnover5.ppt
   3. long format with MANY dir trees and file masks PER dir tree:
      -dir src1 src2 !src\save -file foosys .cpp -dir bin5 -file .exe

   For detailed help on file selection, type "sfk help select".

   * and ? wildcards are supported within filenames. "foo" is interpreted
   as "*foo*", so you can leave out * completely to search a part of a name.
   For name start comparison, say "\foo" (finds foo.txt but not anyfoo.txt).

   When you supply a directory name, by default this means "take all files".

      sfk list mydir                lists ALL  files of mydir, no * needed.
      sfk list mydir .cpp .hpp      lists SOME files of mydir, by extension.
      sfk list mydir !.cfg          lists all  files of mydir  EXCEPT .cfg

   general options:
      -tracesel tells in detail which files and/or directories are included
                or excluded, and why (due to which user-supplied mask).
      -nosub    do not process files within subdirectories.
      -nocol    before any command switches off color output.
      -quiet    or -nohead shows less output on some commands.
      -hidden   includes hidden and system files and dirs.
      For detailed help on all options, type "sfk help options".

   beware of Shell Command Characters.
      command parameters containing characters < > | ! & must be sur-
      rounded by quotes "". type "sfk filter" for details and examples.

   type "sfk ask word1 word2 ..."   to search ALL help text for words.
   type "sfk dumphelp"              to print  ALL help text.

РЕДАКТИРОВАТЬ: предостережение: будьте осторожны при запуске этого в папках с двоичными файлами, так как это эффективно уничтожит ваши файлы, особенно каталоги .git. В этом случае не запускайте sfk для всей папки, а выберите вместо этого определенные расширения файлов (* .rb, * .py и т. Д.). Пример: sfk remcr -dir chef -file .rb -file .json -file .erb -file .md

person Gui Ambros    schedule 02.06.2013
comment
Отлично работает на OSX Mavericks. Не нужно ничего устанавливать, просто запустите сценарий из смонтированного dmg, и ваш терминал будет готов к работе. - person Nate Cook; 17.07.2014
comment
@Gui Ambros Вам не нужно беспокоиться о файлах внутри папки .git. По умолчанию sfk не обновляет файлы внутри скрытых папок. - person bittusarkar; 30.08.2015
comment
@bittusarkar: На момент моего ответа sfk эффективно обработал всю мою папку .git и уничтожил кучу двоичных файлов (отсюда и мое edit; не помню, был ли это Linux или Mac). Возможно, они изменили поведение по умолчанию в более поздних версиях, но я все же рекомендую указать расширение, чтобы быть в безопасности. - person Gui Ambros; 30.08.2015
comment
Это сработало для меня после того, как я потратил слишком много времени на попытки нормализовать мои репозитории с помощью рекомендуемых команд git, которые просто не исправляли все соответствующие файлы. - person angularsen; 16.12.2015
comment
Спасибо! Просто использовал это, чтобы быстро и безболезненно преобразовать целую кучу файлов, и теперь я могу добавить их в промежуточную область в Git. В OSX 10.9.5 и не уверен, где были созданы файлы. - person ryanwc; 29.12.2015

find . -not \( -name .svn -prune -o -name .git -prune \) -type f -exec perl -pi -e 's/\r\n|\n|\r/\n/g' {} \;

Это намного безопаснее, поскольку позволяет избежать повреждения вашего репозитория git. Добавьте или замените .git, .svn на .bzr, .hg или любой другой источник, который вы используете, в список не.

person codehugger    schedule 07.11.2017
comment
Это лучший ответ, если вам не нужно было устанавливать что-либо вроде dos2unix. Позволяет исключить типы файлов и избежать повреждения файлов исходного кода. - person Raghavan; 23.03.2018

В OS X это сработало для меня:

find ./ -type f -exec perl -pi -e 's/\r\n|\n|\r/\n/g' {} \;

Предупреждение: пожалуйста, сделайте резервную копию вашего каталога перед выполнением этой команды.

person Raunak    schedule 05.03.2016
comment
Просто хочу отметить, что это повредило мой репозиторий git. Я попробовал еще раз, переместив папку .git перед запуском и вернув ее позже с большим успехом. - person garie; 28.07.2017
comment
Я также отмечу, что это не исключает двоичные файлы, поэтому, например, испортите свои файлы jpgs. - person Niek; 11.11.2019

Вот решение при использовании sed:

find . -type f -exec sed -i 's/\r$//' {} \;

-i означает на месте, если вы хотите создать резервную копию, используйте -i.bak

's/\r$//' заменит все символы возврата каретки (\r) в конце каждой строки

person Mustapha-Belkacim    schedule 28.06.2020