Я пытаюсь создать простую программу ранжирования электронной почты (что-то вроде приоритетного почтового ящика) в Python. Основываясь на частоте электронных писем, полученных от отправителей, например, у вас есть тренировочный набор, скажем, 50%, где подсчитывается частота отправителей, а затем тестовый набор 50%, который ранжируется в порядке, основанном на обучении (таким образом, электронное письмо от отправителя, который отправляет много сообщений, имеет высокий рейтинг).
Я написал некоторый код Python, чтобы принимать электронные письма и извлекать адрес «От» из каждого. Я поместил эту информацию в список, который показывает наиболее распространенных отправителей электронной почты (пример фрагмента из этого списка ниже).
//(Email address, frequency of emails received from this sender)//Not Code
('[email protected]', 244)
('[email protected]', 162)
('[email protected]', 154)
('[email protected]', 75)
('[email protected]', 50)
Я знаю, что ряд алгоритмов машинного обучения можно эффективно использовать для обучения и проверки моих данных, чтобы делать то, что мне нужно. Однако я не уверен, какой из них я могу использовать, чтобы получить наилучшие результаты?