TextBlob Наивная байесовская классификация текста

Я пытаюсь реализовать наивный байесовский классификатор в твитах, используя TextBlob в python. Мне удалось обучить набор данных и успешно классифицировать отдельные твиты, используя:

print cl.classify("text")

Теперь я хочу открыть файл csv и классифицировать все твиты в этом файле. Любые предложения о том, как я могу этого добиться? Мой код выглядит следующим образом:

import csv
from textblob import TextBlob

with open(test_path, 'rU') as csvfile:
    lineReader = csv.reader(csvfile,delimiter=',',quotechar="\"")
    lineReader = csv.reader(csvfile,delimiter=',')

    test = []
    for row in lineReader:
      blob = (row[0]) 
      blob = TextBlob(blob)
      test.append([blob])

      print (test.classify())

AttributeError: объект 'list' не имеет атрибута 'classify'

python text-classification textblob

Ashwin 11.04.2016 источник

comment

Вы звоните classify() по list. вы должны сделать это с blob - Vaishak Suresh 12.04.2016

comment

Почему есть два назначения для чтения строк? - trans1st0r 12.04.2016

comment

Спасибо за решение! - Ashwin 12.04.2016

Ответы (1)

arrow_upward
0
arrow_downward

Вам также нужно сначала потренироваться (не ясно, сделали ли вы это?),

train = [] 
# then repeat your above lines, appending each tweet to train set
# but for a separate training set (or slice up the rows)

# do your test append loop -----

# 1. Now train a model
my_classifier = NaiveBayesClassifier(train)

# 2. test given to the model to get accuracy
accu = my_classifier.accuracy(test)

Luke Barker 17.07.2016

TextBlob Наивная байесовская классификация текста

Ответы (1)

Похожие вопросы