Поскольку MySQL utf8 не поддерживает 4-байтовые символы, я ищу способ обнаружить и удалить любые 4-байтовые символы utf8 из строки в Ruby. Я понимаю, что могу обновить свою таблицу, чтобы использовать utf8m4, но по нескольким причинам это невозможно или не является желаемым решением.
Простое кодирование строки в ASCII удалит эти символы, но также удалит все другие символы, отличные от ASCII, что нехорошо.