Мне все еще нужно выполнять полное преобразование latin1 в UTF 8 для текста, который выглядит совершенно нормально?
Я меняю местами программное обеспечение форума, а старая база данных форума использовала кодировку Latin1. В новой базе данных форума для таблиц используется кодировка UTF8.
Похоже, что скрипт импортера сделал прямое копирование из одной таблицы в другую, не пытаясь исправить какие-либо проблемы с кодировкой.
Я вручную исправлял видимые ошибки с помощью функции поиска и замены на основе информации о преобразовании, указанной здесь: http://www.i18nqa.com/debug/utf8-debug.html
Остальной текст выглядит нормально и полностью читаем.
Мое ограниченное понимание заключается в том, что UTF-8 обратно совместим с ASCII, а Latin1 в основном является ASCII, поэтому отличаются только крайние случаи, которые необходимо обновить.
Так что мне все еще нужно выполнить полное преобразование latin1 в UTF 8 для текста, который выглядит совершенно нормально?
Я бы не стал, потому что я изменил некоторые теги BB-кода в нескольких полях после того, как они были сохранены в UTF 8, поэтому был обеспокоен тем, что эти обновления застряли бы символы UTF8 в середине символов Latin1, и пытались полное преобразование смешанных наборов символов еще больше испортит ситуацию.