工作台首页
智能体结构化批量评测
输入 ASR 语音识别后的文字和 ASR识别前原文;可先独立生成智能体结构化输出,导出给外部评测,也可一键生成并按现有结构化评分规则评分。

批量输入与运行设置

0 条
只支持 CSV 格式;建议使用模板表头 caseId,ASR识别前原文,ASR识别结果,ASR识别引擎;兼容旧表头 originalText / asrText
来源:录音评测 可从录音评测页选择某个 ASR识别结果列后自动带入这里。

评测模型自动化

建议使用阿里百炼按量 API 或自定义 OpenAI 兼容接口。Coding Plan 仅限编程工具,不建议用于自动化批量评测。

登录状态

未登录;清空 Base URL 时使用本地离线结构化器。

外部人工评分导入

可先导出智能体结构化输出,外部评分后用 JSON / JSONL / CSV 导入,结果会合并到列表与详情。

批量评测结果列表

# 状态 caseId ASR识别前原文 ASR识别结果 ASR识别引擎 1 金标提示词操作 金标提示词状态 2 标准答案 JSON 标准答案状态 3 智能体输出 输出状态 4 评分提示词 评分提示词状态 5 外部评分 外评状态 动作/意图 意图分 字段分 链路追踪 详情