Предположим, вы используете оболочку Linux/UNIX, набор символов по умолчанию которой — UTF-8:
$ echo $LANG
en_US.UTF-8
У вас есть текстовый файл emoji.txt, закодированный в UTF-8:
$ file -i ./emoji.txt
./emoji.txt: text/plain; charset=utf-8
Этот текстовый файл содержит несколько эмодзи и альтернативную escape-последовательность:
$ cat ./emoji.txt
Standard ☁
Variant form ☁️
$ uni2ascii -a B -q ./emoji.txt
Standard \x2601
Variant form \x2601\xFE0F
Вы хотите удалить оба смайлика, включая этот вариант символа формы (\ xFE0F), поэтому вывод должен быть
Standard
Variant form
Как бы вы это сделали?
Обновить. Этот вопрос не о том, как удалить последнее слово в каждой строке. Представьте себе файл emoji2.txt, который включает в себя большой текст с множеством символов эмодзи; и за некоторыми из них следует последовательность вариантов формы.