Я хочу заменить символы ASCII/английский в файле и сохранить символы Юникода в среде Linux.
INSERT INTO text (old_id,old_text,old_flags) VALUES (2815829,'[[चित्र:Youth-soccer-indiana.jpg|thumb|300px|right|बचपन का खेल.एसोसिएशन फुटबॉल, ऊपर दिखाया गया है, एक टीम खेल है जो सामाजिक कार्यों को भी प्रदान करता है।]]\n\n\'\'\'खेल\'\'\', कई [[नियमों]] एवं [[रिवाजों]] द्वारा संचालित होने वाली एक [[प्रतियोगी]] गतिविधि है। \'\'खेल\'\'
я пытался
~$ sed 's/[^\u0900-\u097F]/ /g' hi.text but the range
но я получаю
sed: -e выражение №1, символ 23: неверный конец диапазона
Я также пробовал это, и это, кажется, работает, но не полностью
sed 's/[a-zA-Z 0-9`~!@#$%^&*()_+\[\]\\{}|;'\'':",.\/<>?]//g' enwiki-latest-pages-articles-multistream_3.sql >result.txt
Может ли кто-нибудь сказать мне, как заставить sed работать с регулярным выражением диапазона Unicode
.
и,
, и слов хинди, извлеченных в конечной части запроса (खेल कत्पत्ति खेल स्पोर्ट शब्द की पुराने फ्रेंच शब्द देस्पोर्ट से उत्पत्ति हुई है जिसका अर्थ अवकाश है इतिहास चित्र
) - person Giuseppe Ricupero   schedule 15.11.2015