TextBlob Наивная байесовская классификация текста

Я пытаюсь реализовать наивный байесовский классификатор в твитах, используя TextBlob в python. Мне удалось обучить набор данных и успешно классифицировать отдельные твиты, используя:

print cl.classify("text")

Теперь я хочу открыть файл csv и классифицировать все твиты в этом файле. Любые предложения о том, как я могу этого добиться? Мой код выглядит следующим образом:

import csv
from textblob import TextBlob

with open(test_path, 'rU') as csvfile:
    lineReader = csv.reader(csvfile,delimiter=',',quotechar="\"")
    lineReader = csv.reader(csvfile,delimiter=',')

    test = []
    for row in lineReader:
      blob = (row[0]) 
      blob = TextBlob(blob)
      test.append([blob])

      print (test.classify())

AttributeError: объект 'list' не имеет атрибута 'classify'


person Ashwin    schedule 11.04.2016    source источник
comment
Вы звоните classify() по list. вы должны сделать это с blob   -  person Vaishak Suresh    schedule 12.04.2016
comment
Почему есть два назначения для чтения строк?   -  person trans1st0r    schedule 12.04.2016
comment
Спасибо за решение!   -  person Ashwin    schedule 12.04.2016


Ответы (1)


Вам также нужно сначала потренироваться (не ясно, сделали ли вы это?),

train = [] 
# then repeat your above lines, appending each tweet to train set
# but for a separate training set (or slice up the rows)

# do your test append loop -----

# 1. Now train a model
my_classifier = NaiveBayesClassifier(train)

# 2. test given to the model to get accuracy
accu = my_classifier.accuracy(test)
person Luke Barker    schedule 17.07.2016