Я создал словарь, показывающий частоты слов как значения. Прежде всего мне нужно преобразовать эти частоты в проценты. Общее количество слов - 150482. Во-вторых, мне нужно расположить этот словарь в порядке убывания (на основе значений, которые являются частотами для слов в качестве ключей) и сравнить его с другим словарем, в котором есть часто встречающиеся слова. Любая идея, как сделать это две вещи: а именно изменить значения в процентах и поместить их в порядке убывания в один словарный запас (эта последняя часть, если требуется только для сравнения), а во-вторых, сравнить этот словарь со словарем часто встречающихся слов. Вот первый словарь, который мне нужно изменить на процентные значения.
di=dict()
with open('content.txt',encoding='utf8') as newtext:
for line in newtext:
line=line.rstrip()
words=line.split()
for word in words:
di[word]=di.get(word,0)+1
Цель состоит в том, чтобы выяснить, какой процент часто встречающихся слов в словаре часто встречающихся слов встречается в di (который показывает частоту слов в текстовом файле). Первый словарь похож на {the: TRUE}. Другими словами, никаких ценностей. Просто ключи - это слова, которые необходимо найти с соответствующей процентной частотой в тексте файла.
collections.Counter
может быть для вас хорошим вариантом docs.python.org/3/ library / collections.html # collections.Counter - person Iain Shelvington   schedule 23.03.2020OrderedDict()
вместо обычногоdict
. - person Ala Tarighati   schedule 23.03.2020