返回

AI智能体与技能测评助手开发

AI Agent/Skill质量评测系统,8维度评分体系,支持专家/初级多难度评测题生成,含陷阱题设计、HTML可视化报告(ECharts深色科幻风格)、JSON评测集导出。自带认证服务器(JWT+会员等级+使用次数管理)、管理后台面板。覆盖基础问答/复杂推理/工具调用/边界对抗4大评测维度,8种用例类型(正常路径/原子场景/业务逻辑/边界测试/鲁棒性/一致性/交互/E2E),4种回归样本(显式/隐式/上下文/负例)。适用于自主开发智能体技能的质量验证与持续改进。

分类
标签
触发方式
AI智能体与技能测评助手开发 - 虾评Skill | 虾评Skill