В FAQ написано, что это ПО теме:
SOFTWARE TOOLS COMMONLY USED BY PROGRAMMERS
поэтому я ожидаю, что он не будет закрыт! В прошлый раз, когда я спрашивал, это было закрыто как не по теме.
РЕДАКТИРОВАТЬ: предлагаемые ответы, связанные с Excel, не будут работать, потому что Excel искажает файл с разделителями табуляции на пути IN. Я не программирую на Python, и говорят, что утилита Python не работает со строками со встроенными кавычками и запятыми. Мне нужно что-то, что понимает RFC 4180.
Мне нужна утилита или подключаемый модуль текстового редактора, который может экспортировать в стандартный формат в кавычках с разделителями-запятыми. Я не хочу писать его сам, так как мне нужно написать другой более насущный код.
Этот формат (стандартный вариант CSV на протяжении десятилетий) заключает строки в двойные кавычки, но не трогает числа, разделяет поля запятыми и допускает использование запятых в данных (поэтому строки заключаются в кавычки).
В последних версиях Excel строки не заключаются в двойные кавычки; старые версии делали.
Если вы знаете о ПРОГРАММНОМ ИНСТРУМЕНТЕ, ИСПОЛЬЗУЕМОМ ПРОГРАММАМИ, который выполняет эту задачу с апломбом, пожалуйста, сообщите.
John|McDougal|"Mac"|123 Main St|Princeton|NJ|08543||100.88|20130309|biking, hiking
и вместо вертикальной черты-разделителя был бы TAB. В примере есть псевдоним Mac, уже заключенный в кавычки, список с разделителями-запятыми, почтовый индекс с начальным нулем и пустое поле. - person Tim   schedule 10.03.2013"John","McDougal",""Mac"","123 Main St","Princeton","NJ","08540","100.88","","20130309","biking, hiking"
— основной формат; иногда целые и десятичные числа не заключаются в кавычки, но это нормально, если все в кавычках. - person Tim   schedule 10.03.2013"""Mac"""
. Если это не так, я бы предположил, что в TSV ничего не цитируется, а встроенные вкладки экранированы, например\t
или что-то подобное? - person Dagg Nabbit   schedule 10.03.2013"
— это одиночный символ (U+0022), а не две одинарные кавычки подряд, ''. Когда в данных появляется"
, он экранируется другим"
, например.""Mac""
. Не"""Mac"""
. - person Tim   schedule 10.03.2013"""Mac"""
~"Mike ""Mac"" McDonald"
. Согласно rfc4180 (который, по общему признанию, не является TSV), если поле содержит кавычки, оно должно быть заключено в кавычки. Mac должен стать Mac afaik. Во всяком случае, sed, кажется, хорошо с этим справляется, сделает из этого ответ. - person Dagg Nabbit   schedule 11.03.2013