Я заинтересован в выполнении проекта по классификации документов и искал книги, которые могут быть полезны для теоретических частей анализа текста, связанных с этим, или примеры статей, описывающих процесс перехода от обучающих данных с классифицированными документами (с подкатегориями) к система, которая предсказывает класс документа. Кажется, есть некоторые (довольно дорогие!) названия, но это материалы конференций со статьями по более мелким и очень конкретным темам. Может ли кто-нибудь предложить книги из литературы по интеллектуальному анализу данных, которые обеспечивают хорошую теоретическую основу для проекта по интеллектуальному анализу текста, в частности классификации документов или статей с обзором этого процесса?
Ссылки на книги и статьи, необходимые для начала работы с классификацией документов
Ответы (1)
У Кристофера Д. Мэннинга, Прабхакара Рагхавана и Хинриха Шютце есть бесплатная книга по поиску информации а>. Попробуйте главу 13. Классификация текста. и Наивный Байес.
См. также сопутствующий сайт для nlp книги Мэннинга и Шютце, в частности ссылки на главу о классификации текста.
Фабрицио Себастьяни написал полезное руководство по категоризации текста( PDF) и обзорный документ по машинному обучению для категоризации текста (PDF).
person
Yuval F
schedule
09.03.2011