Создайте модель, которая отвечает на вопрос из набора данных, используя GPT3.

Я пытаюсь создать чат-бота, который с учетом некоторого текстового корпуса будет отвечать на вопросы, когда мы что-то спрашиваем из этого текста. Я слышал, что GPT3 — зверь и требует минимальной подготовки. Есть ли какие-либо ссылки/руководство/репозиторий github, которые помогут мне начать работу с этим?


person Nidutt    schedule 30.09.2020    source источник
comment
GPT3 не является общедоступным, вы не можете этого сделать.   -  person polm23    schedule 30.09.2020
comment
Ничего страшного, если мне придется платить за вызовы API. Я видел проекты онлайн-обучения GPT, чтобы научиться писать операторы SQL.   -  person Nidutt    schedule 01.10.2020
comment
Вам следует поискать RASA, вот пример - github.com/RasaHQ/rasa-demo   -  person datamansahil    schedule 01.10.2020


Ответы (1)


Конечно, если у вас есть бета-доступ к API OpenAI GPT-3, вы легко сможете это сделать. . Если вы этого не сделаете, вы можете подать заявку — вас должны принять довольно быстро (в моем конкретном случае это заняло около 24 часов).

В зависимости от того, ищите ли вы скорость или точность, вам следует выбирать между Davinci, Cushman или Curie (список движков), тогда как Davinci лучший (с точки зрения точности).

Вы можете использовать Playground для ввода текстового корпуса и вопроса — вот пример: Пример изображения Я использовал davinci-instruct-beta с температурой 0.25 и длиной ответа 10. Довольно простая установка.

В демонстрационных целях приведен запрос API, сделанный через Python. response возвращает Анна больше всего ненавидит заниматься исследованиями.

import openai

openai.api_key = 'KEY'

response = openai.Completion.create(
  engine="davinci-instruct-beta",
  prompt="Anna loves programming in Python and C++, though she absolutely despises doing research.\nWhat does Anna hate the most?\n\nAnna hates doing research the most.Example",
  temperature=0.25,
  max_tokens=10,
  top_p=1
)
person J. M. Arnold    schedule 05.02.2021
comment
Спасибо, но для openAI существует верхний предел длины корпуса, например 512 для ответа на вопрос с использованием BERT? - person Nidutt; 07.02.2021
comment
@Nidutt Насколько мне известно, максимальная длина завершения составляет 2048 токенов, что примерно соответствует (в зависимости от различных факторов) 8000 символов - хотя я не совсем уверен. Имейте в виду, что это верхний предел .. ;) - person J. M. Arnold; 07.02.2021
comment
Также обратите внимание, что эти ограничения не распространяются на поиск и классификацию. - person Jelmer; 27.07.2021