Обучение базы знаний через генерацию вопросов
Векторный поиск в векторной базе знаний имеет свою специфику. В частности, существует проблема: формулировка вопроса в векторном представлении может быть недостаточно похожа на формулировку информации, содержащейся в тексте с ответом.
Поэтому в идеале в базу знаний следует добавлять не только исходные материалы, но и возможные вопросы, на которые отвечает тот или иной фрагмент текста.
Эта задача решается с помощью функции генерации вопросов к базе знаний.
Генерация вопросов СУЩЕСТВЕННО повышает качество поиска ответов в базе знаний, настоятельно рекомендуется не пропускать этот важный этап обучения базы знаний.
Автоматическая генерация вопросов
Для генерации вопросов, зайдите в свойства вашей базы знаний, выберите все добавленные в базе документы и нажмите кнопку Generate Questions:
В открывшемся окне укажите промт, который описывает вопросы, например:
Content: {data}
Проанализируй приведённый выше текст, кратко пойми его содержание и сгенерируй 5 возможных вопросов,
которые пользователь мог бы задать, чтобы получить информацию из этого текста.
Требования:
- Генерируй вопросы ТОЛЬКО на английском языке
- Вопросы должны быть конкретными и технически точными.
- Вопросы не должны быть слишком узкими или тривиальными (например: «Какой IP указан в примере?»).
- Не используй английские слова, если в исходном тексте есть русские эквиваленты.
- Не добавляй никаких пояснений или комментариев.
- Каждый вопрос должен быть обёрнут в тег <question></question>.
- Выводи ТОЛЬКО вопросы.
Выберите AI модель, которая будет генерировть вопросы и нажмите ОК, система постепенно "перечитает" ваши документы и создаст нужное количество вопросов.
После этого перейдите во вкладку Questions, в ней вы можете увидеть созданные вопросы, просмотреть их и удалить лишние\ошибочные вопросы:


