Вопросы по теме 'mallet'

Тематическое моделирование с использованием Mallet Java Api?
Привет, мне нужно заняться моделированием тем с использованием Mallet Java API, но я новичок в кодировании, поэтому мне очень сложно понять библиотеки Java и использовать их. Есть ли у кого-нибудь пример кода, в котором они моделируют темы с...
4249 просмотров
schedule 27.04.2022

Вывод тем с помощью молотка, используя сохраненное состояние темы
Я использовал следующую команду для создания тематической модели из некоторых документов: bin/mallet train-topics --input topic-input.mallet --num-topics 100 --output-state topic-state.gz Однако я не использовал параметр --output-model для...
2236 просмотров
schedule 10.06.2022

Почему при выводе темы MALLET получаются разные результаты для отдельных и пакетных документов?
Я пытаюсь выполнить моделирование темы LDA с помощью Mallet 2.0.7. Я могу обучить модель LDA и получить хорошие результаты, судя по результатам тренировки. Кроме того, я могу использовать механизм вывода, встроенный в этот процесс, и получать...
5022 просмотров

Как понять вывод класса Topic Model в Mallet?
Пробуя код примеров в руководстве разработчика по тематическому моделированию , я действительно хочу понять смысл вывода этого кода. Сначала в процессе работы выдает: Coded LDA: 10 topics, 4 topic bits, 1111 topic mask max tokens: 148 total...
6098 просмотров
schedule 17.03.2024

Изменение целевого алфавита в Mallet: алфавиты не совпадают
У меня возникли трудности с получением помощи от списка разработчиков Mallet, поэтому я пытаюсь здесь. У меня есть InstancesList с целевым алфавитом {A, B, C}, и мне нужно изменить целевой алфавит для другого анализа на {A, NOT_A}. Пока у меня...
1206 просмотров
schedule 13.03.2023

Строительный классификатор статей — NLTK/Scikit-learn/Другие реализации НЛП
Для моего текущего проекта мне нужно создать утилиту моделирования или классификации тем, которая будет обрабатывать тысячи статей, чтобы классифицировать их по различным темам (для начала может быть 40-50 тем). Например, он будет проходить по...
549 просмотров
schedule 07.05.2024

Выбор функции молотка аналогичен установке значений функции на 0
Я просматриваю исходные коды Mallet, и кажется, что большинство реализаций классификатора (например, наивный байесовский подход) на самом деле не учитывали выбор функций, хотя класс InstanceList имеет метод setFeatureSelection . Теперь я хочу...
1184 просмотров

MALLET Ранжирование слов в теме
Я относительно новичок в маллете, и мне нужно знать: - слова в каждой теме, которую молоток производит, упорядочены каким-то образом? - если да, то каков порядок (т.е.) 1-й в списке тем тот, который имеет наибольшее распространение по корпусу?...
827 просмотров
schedule 13.10.2022

Использование предустановленных тем в Mallet
Я хочу использовать Mallet для классификации различных документов по темам, которые я определил. Я знаю, что Маллет сначала определит темы, а затем классифицирует документы, но я хочу пропустить первый шаг, потому что у меня уже есть список тем со...
158 просмотров
schedule 12.04.2022

Что такое оценочная функция в тематическом моделировании с использованием библиотеки mallet
Я новичок в тематическом моделировании и пытаюсь использовать библиотеку Mallet, но у меня есть вопрос. Я использую простую параллельную многопоточную реализацию LDA, чтобы найти темы для некоторых экземпляров. Мой вопрос: что такое функция оценки...
526 просмотров
schedule 08.04.2023

Использование Маллета для наивной байесовской классификации: как и где настраиваются алфавиты?
Я пытаюсь использовать библиотеку машинного обучения MALLET в проекте для устранения неоднозначности смысла слов. Мои векторы признаков состоят из окна токена фиксированного размера, состоящего из x токенов слева и справа от целевого токена. Учебные...
948 просмотров
schedule 29.08.2022

Импорт классов из Mallet в Java
Я пытаюсь использовать API Mallet для Java. Однако я не могу ничего импортировать. Добавление внешних банок в путь к классам в eclipse, похоже, ничего не делает. Копирование mallet.jar и mallet-deps.jar в файл библиотеки и добавление внутренней...
568 просмотров
schedule 22.02.2024

Ввод данных в молоток параллельно
Я пытаюсь создать классификатор текста с помощью молотка. Данные какие-то большие, поэтому я ищу способ, если это возможно, запустить задачу «импорт» в нескольких потоках, потому что загрузка занимает много времени. Несколько вопросов здесь:...
207 просмотров

Классификация документов Mallet — сокращение словарного запаса
Я обучил модель классификации документов maxent с помощью Mallet, и оказалось, что она занимает 130 МБ, что слишком много для экземпляра, на котором я хочу ее запустить. Мне было интересно, есть ли способ потенциально уменьшить размер словаря модели,...
161 просмотров

Функция typeTopicCounts в реализации тематического моделирования API молотка
Я пытаюсь понять, как тематическая модель LDA реализована в API молотка. В классе ParallelTopicModel я вижу 2D-массив целых чисел с именем typeTopicCounts , который инициализируется в методе buildInitialTypeTopicCounts() с помощью некоторых...
45 просмотров
schedule 23.02.2023

Не удалось открыть файл mallet logging.properties.
Я пытаюсь запустить класс ParallelTopicModel из маллета, я использую NetBeans для его компиляции, но когда я запускаю код, я получаю это сообщение об ошибке: Не удалось открыть файл ресурсов/logging.properties cc.mallet.util.MalletLogger....
423 просмотров
schedule 16.11.2022

pyLDAvis с реализацией Mallet LDA: объект LdaMallet не имеет атрибута «вывод»
Можно ли построить pyLDAvis с реализацией LDA Mallet? У меня нет проблем с LDA_Model, но когда я использую Mallet, я получаю: 'LdaMallet' object has no attribute 'inference' Мой код: pyLDAvis.enable_notebook() vis =...
5149 просмотров
schedule 05.01.2024

Как сопоставить продукты из названий из разных источников электронной коммерции? извлекать атрибуты продуктов
Это мой второй вопрос, так что извините, если какие-то ошибки. Моя основная цель — собрать данные с разных сайтов электронной коммерции, а затем сравнить данные между ними. Для этого мне нужно сопоставить один и тот же товар с разных сайтов....
985 просмотров

Ошибка моделирования темы Python в маллете
Привет, я использовал gensim для моделирования тем, использовал Mallet и выполнял этот код. Я распаковал mallet на диск c, как показано, а также установил команду окружения MALLET_HOME . Код, который я выполнял, mallet_path =...
2020 просмотров
schedule 05.05.2023

Исключение Java во время тематического обучения в Mallet
У меня есть следующая команда mallet (для версии 2.0.8 (3 мая 2016 г.)) в Linux 2.6.32-696.18.7.el6.x86_6 и среде выполнения Java SE (сборка 1.7.0_05-b06): bin/mallet train-topics --input html/$1/topic --num-topics $1 \ --output-doc-topics result...
134 просмотров
schedule 17.02.2023