Возможный дубликат:
Как лучше всего бесплатно очистить Word HTML?
PHP для очистки вставленного ввода Microsoft
Я разрешаю клиентам вводить заметки в редакторе форматированного текста и только недавно обновился до ckEditor 3x, который по умолчанию удаляет классы, стили и комментарии MS Word (когда пользователи вставляют объект редактора). Так что, двигаясь вперед, я готов.
Недавно у меня возникла необходимость очистить 5-летние заметки, в некоторые из которых встроен HTML-код, сгенерированный MS Word. Мне нужно перебрать этот текст и очистить его.
Мне не нужно вырезать все теги span, только те, которые определены как написанные Microsoft.
Я пробовал использовать HTMLCleaner, но он не удаляет созданный MS HTML. http://word2cleanhtml.com делает именно то, что я хочу, однако разработчики в настоящее время не предлагают API для публичного использования ( от 9 июля 2012 г.).
Я искал такой класс время от времени последние несколько недель, и мне не очень везет. Кто-нибудь из вас нашел полезный класс, которым вы хотели бы поделиться?