Вопросы по теме 'seq2seq'
Tensorflow: вывод внимания объединяется со следующим вводом декодера, что приводит к несоответствию размеров в модели seq2seq
[TF 1.8] Я пытаюсь построить модель seq2seq для игрушечного чат-бота, чтобы узнать о тензорном потоке и глубоком обучении. Мне удалось обучить и запустить модель с выборкой softmax и поиском лучей, но затем я пытаюсь применить...
396 просмотров
schedule
02.06.2023
Как работает этот автоэнкодер?
Я пытаюсь использовать автоэнкодер, чтобы получить временной ряд и восстановить его. Мои данные имеют 10 временных рядов длиной 365 и одним измерением с окном обзора в 28 дней. Модель Autoencoder основана на этом блоге keras . Таким образом, в...
92 просмотров
schedule
31.05.2024
Какой смысл обучать модель seq2seq, если она не используется в выводе?
В официальном примере Keras seq2seq (я включу это внизу) они обучают модель с помощью функции fit , но они даже не используют эту модель где-либо в процессе декодирования для тестирования модели на новых данных.
Я пытаюсь обучить модель seq2seq...
1032 просмотров
schedule
13.01.2023
Keras LSTM для преобразования предложений в вектор контекста документа
Я прочитал следующее сообщение в блоге и попытался реализовать его через Keras: https://andriymulyar.com/blog/bert-document-classification
Теперь я новичок в Керасе, и я не понимаю, как использовать «нейронные сети seq2seq» для сжатия...
204 просмотров
schedule
28.02.2022
RuntimeError: размер тензора a (1024) должен соответствовать размеру тензора b (512) в не-одноэлементном измерении 3
Я делаю следующую операцию,
energy.masked_fill(mask == 0, float("-1e20"))
мои следы питона ниже,
File "/usr/local/lib/python3.6/dist-packages/torch/nn/modules/module.py", line 722, in _call_impl
result =...
5854 просмотров
schedule
31.07.2022
Обучение модели seq2seq в Google Colab TPU с большим набором данных - Керас
Я пытаюсь обучить последовательность для модели последовательности для машинного перевода с помощью Keras в Google Colab TPU. У меня есть набор данных, который я могу загрузить в память, но мне нужно предварительно обработать его, чтобы передать его...
179 просмотров
schedule
21.04.2022