RAGAS RAG 评估系统

📤 上传评估数据

📄

选择 JSON 文件

上传包含 question 和 ground_truth 的 JSON 文件
系统将自动通过 RAG 获取 contexts 和 answer

⚙️ RAG 配置

知识库 ID *

多个 ID 用英文逗号分隔

嵌入模型

选择用于向量检索的嵌入模型

LLM 模型

选择用于生成答案的 LLM 模型

温度 (Temperature)

控制生成随机性 (0.0-1.0)

Top P

核采样参数 (0.0-1.0)

最大 Token 数

生成答案的最大长度

检索切片数

每次检索的文档切片数量

启用思考模式

启用后 LLM 会先思考再回答（适用于 Qwen3-30B）

正在评估中，请稍候...

📊 评估结果

📋 详细结果

#	问题	Faithfulness	Answer Correctness	Answer Relevancy	Context Precision	Context Recall