批量输入与运行设置
0 条只支持 CSV 格式;建议使用模板表头 caseId,ASR识别前原文,ASR识别结果,ASR识别引擎;兼容旧表头 originalText / asrText。
来源:录音评测 可从录音评测页选择某个 ASR识别结果列后自动带入这里。
评测模型自动化
建议使用阿里百炼按量 API 或自定义 OpenAI 兼容接口。Coding Plan 仅限编程工具,不建议用于自动化批量评测。
登录状态
未登录;清空 Base URL 时使用本地离线结构化器。
外部人工评分导入
可先导出智能体结构化输出,外部评分后用 JSON / JSONL / CSV 导入,结果会合并到列表与详情。
批量评测结果列表
| # | 状态 | caseId | ASR识别前原文 | ASR识别结果 | ASR识别引擎 | 1 金标提示词操作 | 金标提示词状态 | 2 标准答案 JSON | 标准答案状态 | 3 智能体输出 | 输出状态 | 4 评分提示词 | 评分提示词状态 | 5 外部评分 | 外评状态 | 动作/意图 | 意图分 | 字段分 | 链路追踪 | 详情 |
|---|