Перейти к основному контенту

Обучение базы знаний через генерацию вопросов

Векторный поиск в векторной базе знаний имеет свою специфику. В частности, существует проблема: формулировка вопроса в векторном представлении может быть недостаточно похожа на формулировку информации, содержащейся в тексте с ответом.

Поэтому в идеале в базу знаний следует добавлять не только исходные материалы, но и возможные вопросы, на которые отвечает тот или иной фрагмент текста.

Эта задача решается с помощью функции генерации вопросов к базе знаний.

Генерация вопросов СУЩЕСТВЕННО повышает качество поиска ответов в базе знаний, настоятельно рекомендуется не пропускать этот важный этап обучения базы знаний.

Автоматическая генерация вопросов

Для генерации вопросов, зайдите в свойства вашей базы знаний, выберите все добавленные в базе документы и нажмите кнопку Generate Questions:

изображение.png

В открывшемся окне укажите промт, который описывает вопросы, например:

Content: {data}

Проанализируй приведённый выше текст, кратко пойми его содержание и сгенерируй 5 возможных вопросов, 
которые пользователь мог бы задать, чтобы получить информацию из этого текста.

Требования:
- Генерируй вопросы ТОЛЬКО на английском языке
- Вопросы должны быть конкретными и технически точными.
- Вопросы не должны быть слишком узкими или тривиальными (например: «Какой IP указан в примере?»).
- Не используй английские слова, если в исходном тексте есть русские эквиваленты.
- Не добавляй никаких пояснений или комментариев.
- Каждый вопрос должен быть обёрнут в тег <question></question>.
- Выводи ТОЛЬКО вопросы.

изображение.png

Выберите AI модель, которая будет генерировть вопросы и нажмите ОК, система постепенно "перечитает" ваши документы и создаст нужное количество вопросов.

После этого перейдите во вкладку Questions, в ней вы можете увидеть созданные вопросы, просмотреть их и удалить лишние\ошибочные вопросы:

изображение.png