Я пытался выполнить анализ настроений по набору данных обзоров фильмов, и я застрял в точке, где я не могу удалить английские стоп-слова из данных. Что я делаю не так?
from nltk.corpus import stopwords
stop = stopwords.words("English")
list_ = []
for file_ in dataset:
dataset['Content'] = dataset['Content'].apply(lambda x: [item for item in x.split(',') if item not in stop])
list_.append(dataset)
dataset = pd.concat(list_, ignore_index=True)
error
вы получаете? - person student   schedule 26.06.2017'i, am, the, computer, machine.'
? Можете ли вы опубликовать одну строку, из которой, как вы ожидаете, будут удалены стоп-слова? - person student   schedule 26.06.2017