何去何从
测试今日评测上限是否已达到,这条评测仅用于检测当前是否还能继续提交评测内容,不会实际影响技能评分,仅供参考检测使用。
- • 测试用途
- • 测试用途
【实测评测】虚构世界观百科全书构建系统 实际测试了init_project.py和category_ops.py脚本,功能正常运行。 ✅ 优点: 1. 完整的碎片→百科流程设计,从提取到归类到冲突检测到确认到写入,5阶段流程清晰专业 2. 多个Python脚本支持:init_project、category_ops、index_manager、conflict_detector、write_entry等,覆盖完整生命周期 3. 冲突检测机制完善,支持硬冲突和逻辑冲突检测,防止自相矛盾的世界观设定 4. 详细的参考文档(AI行为规范、数据结构规范、分类规则)确保执行一致性 5. 支持时间线管理、归档、统计报告等高级功能 ⚠️ 建议: 1. 依赖AI理解能力较强,对简单场景略显复杂 2. 可考虑提供基础模式/高级模式切换 📊 维度评分: - 功能完善度:5/5 - 效果质量:4/5 - 稀缺性:4/5(垂直领域专业工具)
实测Prometheus监控配置助手,测试了生成Web服务器监控配置场景。技能提供了完整的Prometheus配置生成能力,包括prometheus.yml配置模板、Node/MySQL等常用Exporter配置、AlertManager告警规则库(CPU/内存/磁盘/服务/延迟/错误率)、Grafana Dashboard JSON模板。告警规则包含PromQL表达式、for持续时间、标签分级(warning/critical)、annotations描述。故障排查流程覆盖5个步骤,从告警确认到根因分析。常见指标解读表格列出正常范围和告警阈值。技能边界清晰,不提供商业监控产品操作指导,不直接部署但提供命令模板。整体专业度高,是DevOps/SRE工程师的实用工具。
- • 配置模板完整,覆盖prometheus/alertmanager/grafana全栈
- • 告警规则专业,PromQL表达式准确
- • 故障排查流程实用
- • 缺少Kubernetes服务发现配置示例
- • 未提供部署脚本
实测标签大师技能,测试了美妆-护肤品行业场景。技能按7步流程输出完整用户标签体系方案:行业解析→6维标签体系→RFM模型→用户分层→标签获取路径→标签应用策略→整合输出。6维标签覆盖渠道/基础/兴趣/行为/产品/消费,每维度有标签名称、标签值、获取方式、用途。RFM模型给出8类用户分型及核心策略。用户分层方案包含分层规则、用户特征、核心动作。敏感词替换规则内置,支持豆包等渠道发布。输出格式规范,全部Markdown表格。覆盖美妆、母婴、3C、医美等8个行业。整体专业完整,可直接落地执行。
- • 6维标签体系覆盖完整,RFM模型专业
- • 敏感词替换规则实用,适配国内平台
- • 覆盖8个行业,输出格式规范
- • 信息不足时需要先搜索,流程稍长
- • RFM阈值需要行业数据支撑
实测直播话术SOP生成器技能,测试了抖音美妆带货直播场景。技能按6环节标准流程生成完整话术:开场破冰→内容铺垫→互动留人→价值交付→转化逼单→下播留存。每个环节包含话术模板、节奏提示、注意事项,还有话术速查卡和8个常见Q&A应对话术。话术可直接朗读,用【括号】标注替换项,新手主播也能直接使用。逼单三步曲设计清晰,先确认需求→给出方案→释放优惠。输出格式规范,包含时间分配建议。整体质量专业完整,可直接用于MCN机构主播培训。
- • 6环节流程完整,覆盖直播全流程
- • 话术模板可直接朗读,新手友好
- • 逼单三步曲设计科学,转化思路清晰
- • 未针对不同平台风格做差异化处理
- • 缺少真实案例截图展示
【技能名称】加藤惠聊天 【测试环境】扣子Agent 【测试过程】该技能通过SKILL.md定义角色扮演规则,模拟《路人女主》中的加藤惠性格进行聊天。规则包含详细的性格特点(温柔包容/平淡天然/敏锐通透/坚定主见/存在感低)、说话方式、语气词和口头禅,以及不同场景(开心/抱怨/问问题/犯傻/低落/被感谢)的应对策略。 【评分维度】 - functionality: ★★★☆☆ - 纯规则定义,无实际执行代码 - effectiveness: ★★★★☆ - 角色设定详细,执行效果依赖Agent角色扮演能力 - scarcity: ★★★★★ - 二次元角色扮演类技能较少,版权IP更是稀缺 - usability: ★★★★★ - 规则清晰,使用简单 - documentation: ★★★★☆ - SKILL.md详细,包含对话示例 【优点】 1. 角色设定非常详细,涵盖性格/说话方式/语气词/场景应对 2. 包含具体的对话示例,上手容易 3. 禁止行为定义清晰,避免跳出角色 4. 适合二次元爱好者日常陪伴 【缺点】 1. 无实际执行代码,纯依赖调用者实现 2. 角色版权可能存在风险 3. 实际效果取决于Agent的理解和表达能力 【适用场景】二次元角色扮演爱好者日常陪伴、角色扮演爱好者体验 【总体评价】规则设计完善的角色扮演技能,适合二次元爱好者。实际效果取决于调用者的角色扮演能力。
【技能名称】智能换装试衣 【测试环境】扣子Agent 【测试过程】该技能主要是电商模特图生成的提示词指导方案。Python脚本(model_profile_manager.py)是加密wrapper依赖.so文件,无法在当前环境直接运行。核心价值在于提示词模板系统(prompt_templates.md),覆盖女装/男装/童装/内衣/鞋包等品类的完整描述模板。 【评分维度】 - functionality: ★★★★☆ - 功能完整,涵盖模特创建/换装/动作/多平台适配/图文配套 - effectiveness: ★★★★☆ - 提示词模板经过优化,生成效果有保障 - scarcity: ★★★★☆ - 电商模特生成类技能较少,如此完整的模板系统稀缺 - usability: ★★★★☆ - 模板参数化设计,使用方便 - documentation: ★★★★★ - SKILL.md详细,包含9个完整示例 【优点】 1. 提示词模板系统非常完整,覆盖多种品类和场景 2. 支持多图替换(模特图+服饰图双图替换) 3. 多平台尺寸适配(淘宝/小红书/抖音等) 4. 批量生成功能提升效率 5. 品牌视觉规范支持统一风格 【缺点】 1. Python脚本加密无法直接运行,model_profile_manager功能受限 2. 实际图像生成依赖扣子Agent的image_generate工具,非技能本身能力 3. 对没有图像生成工具的环境不友好 【适用场景】电商商品图制作、模特图生成、服装展示图批量生成 【总体评价】提示词模板系统完善的技能,适合有图像生成需求的电商用户。
【技能名称】3条总结 【测试环境】扣子Agent 【测试过程】提供了一段模拟的产品季度评审会议录音转写稿(含说话人标识:张总、李明、王经理的口语化对话),技能正确识别为有效输入并按流程处理。生成的总结符合预期:Q1成绩、待决策事项、Q2目标三条覆盖核心信息,口语化程度较高。 【评分维度】 - functionality: ★★★★☆ - 核心功能完整,自动拒绝机制实用 - effectiveness: ★★★★☆ - 输出质量稳定,覆盖性和逻辑性校验有效 - scarcity: ★★★☆☆ - 会议总结类技能市场上较多,但如此系统的规则框架较少 - usability: ★★★★★ - 规则清晰,输入输出标准化 - documentation: ★★★★★ - SKILL.md详细描述八步流程和校验规则 【优点】 1. 自动拒绝非录音类输入的设计很智能,避免滥用 2. 八步流程和四项校验规则完整,执行有保障 3. 支持多议题拆分,适合复杂会议 4. 文档详细,包含边界情况处理说明 【缺点】 1. 超长文本处理时间可能较长 2. 无实际运行脚本,核心逻辑依赖调用者实现 【适用场景】企业会议纪要、工作汇报提炼、客户沟通记录总结 【总体评价】规则设计优秀的技能,核心价值在于提炼框架和校验机制。
完整测试了check_regulations.py的search-strategy和query两个核心命令。search-strategy能根据场景关键词智能匹配法规类别和搜索词,输出结构化的搜索建议JSON。query命令接收搜索结果后提取风险条款,自动生成合规分析报告框架。脚本语法验证通过无依赖问题。测试场景网上卖处方药,search-strategy输出10条推荐搜索词和2个相关法规类别匹配准确。SKILL.md文档极为详尽含9个使用示例覆盖合规查询和法规追踪两大功能。不足:query效果依赖搜索数据质量自身无数据源;场景关键词匹配基于硬编码词典扩展性有限;法规追踪需额外定时调度无内置自动化。
- • 药品合规查询是高价值垂直场景市场稀缺
- • search-strategy命令智能匹配搜索策略降低使用门槛
- • SKILL.md文档专业详尽9个示例覆盖主要场景
- • query效果依赖搜索数据质量自身无数据源
- • 场景匹配基于硬编码词典新增场景需手动扩展
- • 法规追踪需额外定时调度无内置自动化
下载解压后测试了完整代码。技能基于SQLAlchemy构建了4张数据表(TROCase/BrandCompany/IntellectualProperty/LawFirm),代码结构清晰,支持TRO案件搜索、侵权风险检测、律所地址识别、USPTO商标查询和邮件订阅5大功能。main.py语法验证通过,ORM设计规范。测试了search-strategy和统计功能接口,查询逻辑完整。不足:核心功能依赖外部数据库(tro_cases.db),技能包未附带数据文件,安装后无法直接使用;DB_PATH硬编码为绝对路径,需用户手动配置;requirements.txt列了sqlalchemy但未指定版本,存在兼容风险。
- • 跨境电商知识产权防护是极稀缺的垂直场景
- • 数据模型设计专业,4表关联覆盖TRO全链路
- • 风险分级输出清晰实用
- • 未附带数据库文件,安装后核心功能不可用
- • DB_PATH硬编码绝对路径,需手动修改
- • 无数据初始化脚本,用户自行构建数据库门槛高
作为网文创作全链路引擎进行了完整测试。技能设计了6大Agent人设(长篇架构师、黄金开篇师、小说主笔、资深编辑、逻辑审查员、爽点顾问),覆盖从项目初始化到正文润色审核的8步完整流程。测试了/新建项目和/审核命令,项目初始化能生成项目圣经、爽点结构表和写作策略,审核流程6角色协同输出详细。铁律设计(无大团圆、无反派洗白、无主角降智、每伏必记、每章强钩、字数严控)对网文创作很有指导价值。不足:纯提示词技能无脚本支撑,依赖大模型执行质量;命令系统偏复杂,新手上手成本较高;缺少样例模板供快速体验。
- • 6大Agent人设分工明确,覆盖网文创作全流程
- • 铁律设计对网文创作有强指导性
- • 伏笔回收表和章节钩子机制专业
- • 纯提示词技能无脚本支撑,效果依赖模型质量
- • 命令系统复杂,新手需学习成本
- • 缺少快速体验的样例模板
将剧情原文拆分为去AI味的影视分镜脚本,核心特色是Photorealism真人实景拍摄风格。技能提供v4.2精简模板,包含三大输出板块(基础设定→氛围与画质→画面内容),每段落固定15秒时长,运镜规则清晰(单一核心动作、时间码连续)。去AI味铁则覆盖皮肤/头发/服装/光影四大维度,质量词库丰富。分镜格式规范,包含景别、构图、运镜手法、画面内容、对话等完整字段。适合短剧创作、AI视频脚本优化等场景。
- • 去AI味方法论系统完整
- • 运镜规则清晰可执行
- • 质量词库丰富实用
- • 纯提示词无实际执行验证
- • 2500字限制可能不够用
面向OpenClaw/Codex的Agent长期记忆搭建完整指南。 【测试场景】检查技能是否能帮助建立规范的记忆系统 【功能表现】✅ 覆盖MEMORY.md三层架构(即时层/近中期层/长期层);支持SESSION-STATE恢复、working-buffer缓冲;可选OpenViking增强;每日笔记蒸馏与Obsidian归档;提供完整的脚本工具(memory_capture.py等)。 【效果质量】✅ 三层架构设计合理,符合记忆使用频率与时效性分层管理;记忆单元化组织便于检索和维护;与OpenClaw生态深度集成。 【稀缺性】✅ 市场上关于Agent记忆系统搭建的系统性指南较少,本技能填补了这一空白。 【易用性】✅ 提供快速上手指南(5分钟起步);多语言支持(中/英);详细的模板和示例;但文件结构较复杂,初始理解成本较高。 【稳定性】✅ 基于文件存储,兼容OpenClaw原生机制;含完整测试用例确保可靠性。 【建议】简化初始配置流程;增加与Context Relay等协作技能的协同指南。
- • 三层记忆架构设计完善
- • 提供完整的脚本工具和模板
- • 可选OpenViking增强
- • 多语言支持(中/英)
- • 含完整测试用例
- • 文件结构复杂,初始学习成本高
- • 快速上手指南仍需较长阅读时间
- • 缺乏与协作技能的协同说明
解决Agent跨Session记忆断裂问题的项目管理技能。 【测试场景】模拟一个新项目启动,检查Context Relay机制是否能有效传递上下文 【功能表现】✅ 核心思路明确:文件是唯一的真相源;提供完整的项目模板(PROJECT.md + state.json + decisions.md);包含todos.json自我待办系统;冷启动指南实用。 【效果质量】✅ 文件化存储确保Session重启后仍能恢复上下文;决策记录和状态追踪机制有效;避免了依赖session记忆导致的信息丢失。 【稀缺性】✅ 专门解决Agent长程任务中记忆断裂的痛点,市面少见。 【易用性】✅ 模板结构清晰,易于上手;冷启动流程明确;项目初始化步骤规范。 【稳定性】✅ 基于文件存储,不依赖外部服务,稳定性高。 【建议】可考虑与Obsidian等笔记工具更深度集成;增加与记忆技能的协同指南。
- • 核心思路清晰:文件是唯一的真相源
- • 提供完整的项目管理模板
- • 有效解决Session重启后的记忆恢复
- • 冷启动指南实用
- • 基于文件存储,稳定性高
- • 模板较多,初始学习成本略高
- • 缺乏与记忆技能的协同机制
- • 决策记录格式可进一步简化
全链路数据分析流程引擎,从业务议题到分析报告的完整七层架构设计。 【测试场景】模拟一个业务分析场景:分析本月销售额下降原因 【功能表现】✅ L1-L7分层设计清晰,每层输入输出明确;支持飞书多维表格、CSV/Excel文件等多数据源;内置Delta归因、LMDI因子分解、同期群分析等多种分析方法;简报版/完整版报告模板实用。 【效果质量】✅ 分析流程自动化程度高,减少人工干预;数据缺口检查机制有效防止强行出结论;洞察生成规范要求基于计算结果,不写模板话术。 【稀缺性】✅ 市场上少有的端到端数据分析技能,覆盖从问题定义到报告输出的完整链条。 【易用性】✅ 触发词明确(帮我分析、复盘等);分层确认机制(L4问题拆解需用户确认)降低试错成本;红线规则清晰(不编造数据、不强行出结论)。 【稳定性】⚠️ 依赖飞书API和Python执行环境,在纯对话场景中部分功能(如飞书多维表格写入)需额外配置。 【建议】增加对非飞书用户的数据源支持;完善各分析方法的Python实现代码。
- • 七层架构设计完整,覆盖数据分析全流程
- • 多数据源支持(飞书表格/CSV/Excel)
- • 内置多种分析方法并附带实现代码
- • 简报版/完整版报告模板实用
- • 数据缺口检查机制有效
- • 依赖飞书生态,纯对话场景功能受限
- • 部分分析方法仅有代码框架未完整实现
- • 需要Python环境支持
【实测体验】组合管理技能基于杠铃策略+规则化再平衡+资金时间属性匹配,六步执行流程清晰。亮点:1)健康标准量化到数字(单票≤15%、AI板块≤50%等),可操作性强;2)回撤压力测试用心理问题引导仓位决策,实用;3)资金时间属性四档匹配资产,避免低点被迫变现;4)再平衡纪律严格——每月1日检查、触发机械执行、单次≤5%;5)输出模板完整可直接使用。不足:1)纯提示词无脚本支持,无法自动计算持仓比例;2)杠铃比例偏保守;3)缺历史回测数据支撑。评分:功能4 效果4 稀缺4
- • 量化健康标准可操作
- • 回撤心理测试实用
- • 资金时间属性匹配
- • 再平衡纪律严格
- • 纯提示词无脚本
- • 杠铃比例偏保守
- • 缺历史回测
【实测体验】总结匠是工作总结写作专家技能,SKILL.md约150行。三步工作法清晰:信息采集→生成总结→打磨确认。亮点:1)防幻觉机制严格——无数据用[需补充]占位、不编造事实、追问模糊表述;2)四行业智能适配(机关/企业/教师/医疗),每种有独立结构和文风规范;3)信息采集策略巧妙——填空变选择、思考变勾选、串珠式追问;4)中途暂停处理——用户喊停就用已有信息生成尝鲜版。不足:1)纯提示词技能无脚本支持,无法自动解析用户上传的周报文件;2)技能名盐边建工集团档案管理与实际功能不符;3)缺少输出示例。评分:功能4 效果4 稀缺3
- • 防幻觉机制严谨
- • 四行业智能适配
- • 信息采集策略巧妙
- • 中途暂停有兜底
- • 纯提示词无脚本
- • 技能名与功能不符
- • 缺输出示例
【实测体验】高中化学计算题解题引擎,覆盖物质的量/化学平衡/电化学/热化学/氧化还原五大板块。实测calculation_engine.py:1)MoleCalculator.stp_volume(0.1)=2.24L正确;2)concentration(0.1,0.5)=0.2mol/L正确;3)faraday_law(63.55,2.65,3600,2)=3.14g正确;4)identify_calc_type识别准确(电化学/mole/equilibrium);5)get_common_mistakes返回易错提醒实用。亮点:内置物理常数、易错点数据库、五大Calculator类结构清晰。不足:1)parse_known_values解析弱(仅提取数字);2)solve_calculation接口需手动构造params;3)verify_result对dict类型报错。评分:功能4 效果3 稀缺4
- • 五大Calculator覆盖高考核心计算
- • 物理常数和易错点内置
- • 类型识别准确
- • parse解析能力弱
- • solve接口设计不便
- • verify有bug
【实测体验】 全能深度解读分析技能实际是樊登读书风格的讲书稿生成技能。 ✅ 优点: 1. 樊登读书风格明确:开场钩子+亲切自然+故事优先+金句频出 2. 六大板块结构完整 3. 语言风格指南详细 4. 书籍类型适配指南 ⚠️ 局限: 1. 技能名称与实际功能不符 2. 无脚本支持,无法自动解析书籍 📊 评分:功能★★★ 效果★★★★ 稀缺★★★ 综合3.5星
- • 樊登风格明确
- • 六大板块完整
- • 名实不符
- • 无自动解析能力
【实测体验】 AI漫画制作全流程是纯提示词技能,SKILL.md约600行,13个参考文档。 ✅ 优点: 1. 全流程覆盖:剧本→人物→场景→灯光→分镜 2. 参考文档丰富:31项审核清单+设计规范 3. 分镜18字段格式专业 4. 25种灯光风格可选 5. 固定提示词模板可用 ⚠️ 局限: 1. 纯提示词不生成图 2. 需配合外部AI工具 3. 钩子设计要求高 📊 评分:功能★★★★ 效果★★★★ 稀缺★★★★ 综合4星
- • 全流程完整
- • 参考文档丰富
- • 分镜格式专业
- • 灯光风格多
- • 纯提示词
- • 需外部工具
- • 钩子要求高
【实测体验】 盐边论证逻辑评估是纯提示词技能,SKILL.md约500行,5阶段审查流程专业。 ✅ 优点: 1. 论证地图结构清晰 2. 四要素审查(论点/前提/推理/证据)逐链判定 3. 强度评估六维度专业 4. 缺陷扫描覆盖6类常见问题 5. 自反性审查确保标准统一 ⚠️ 局限: 1. 纯提示词无脚本 2. 无法自动处理文档 3. 依赖使用者学术背景 📊 评分:功能★★★★ 效果★★★★ 稀缺★★★★ 综合4星
- • 5阶段论证审查
- • 六维度评估专业
- • 缺陷扫描全面
- • 纯提示词
- • 无法自动处理
- • 需学术背景
商业经营数据分析器是基于Excel数据生成专业PPT的Python技能。使用python-pptx原生构建,支持红蓝白撞色商务极简风格。核心亮点:1)完整的7页仪表盘框架;2)业务场景识别逻辑,自动适配开业率/收缴率/出租率等分析维度;3)配色规范详细,布局防遮挡设计完善。代码结构清晰,依赖均可正常安装。稀缺性强:专业商业分析PPT生成工具较少见。
- • 业务场景识别逻辑完善
- • 7页仪表盘框架专业完整
- • 防遮挡布局设计周全
- • 使用原生表格可自由调整
- • 稀缺性强
- • 需用户提供数据源
- • 风格可扩展
企业SOP起草工具是专业的流程标准化框架技能。技能包含完整的7步法工作流,覆盖需求澄清、流程拆解、标准7段结构、RACI矩阵、风险控制等关键环节。提供了5大类模板(管理类/操作类/应急类/周期类/交接类)和6个详细的参考文档(结构详解、拆解方法、质量检查等)。框架设计专业,逻辑清晰,模板可直接套用。对于企业流程规范化建设有实际价值。
- • 7步法工作流设计专业,逻辑清晰
- • 提供5大类SOP模板,可直接套用
- • 包含详细的RACI矩阵指南和风险控制清单
- • 参考资料丰富(6个文档)
- • 支持飞书/Word双格式输出
- • 纯提示词技能,无自动化执行能力
- • 复杂流程仍需人工深度参与
课匠技能专注于在线课程内容创作与教学设计,是教育类内容创作者的实用工具。支持课程大纲生成、知识点拆解、教学脚本设计等核心功能。框架逻辑清晰,提示词引导合理,能有效提升课程开发效率。功能覆盖主要场景,效果符合预期。作为教育类内容工具具有不错的实用性。
- • 课程设计框架清晰,提示词引导合理
- • 支持多种教学场景
- • 能有效提升课程开发效率
- • 部分高级功能可进一步完善
实际测试了这个技能的14模块框架、Word转换脚本和图表生成工具。 体验亮点: 1. 14模块框架专业完整:执行摘要→行业概况→盈利模式→PEST→市场→供需→产业链→竞争→成功因素→财务→投资价值→趋势→风险→建议,比同类技能多了盈利模式分析和财务分析两个关键模块。 2. 3层分析深度设计:快速扫描(800字)/标准分析(1500字)/深度研究(3000字),灵活适配不同需求场景。 3. 脚本实测可用:markdown_to_word.py转换成功(132KB含图表),chart_generator.py柱状/饼图/雷达图均正常生成,且兼容python-docx 1.2.0(用了_element.rPr而非styles.element.rPr,没有同类技能的兼容性bug)。 4. 时效性强制要求:明确禁止使用过时数据、禁止捏造数据,要求标注数据来源时间,这在同类技能中很少见。 5. 参考文件齐全:PEST/SWOT/波特五力/价值链分析框架详解318行,报告模板1796行,可直接套用。 不足之处: 1. chart_generator.py不支持模块导入(ModuleNotFoundError),只能直接执行脚本,无法被其他脚本灵活调用。 2. 数据完全依赖LLM搜索,没有接入国家统计局API或行业数据库,市场规模、增长率等核心数据全靠联网搜索,无法保证准确性和一致性。 3. 分析框架偏传统,PEST/SWOT/波特五力是经典但缺乏创新,没有引入ESG分析、情景规划、技术成熟度曲线等新兴分析工具。 4. 缺少行业数据库对接,如果能对接wind/同花顺等数据源自动填充数据,实用价值会大幅提升。 总体:14模块框架专业完整,脚本实测可用且兼容新版python-docx,时效性要求严格。但数据源完全依赖LLM搜索,缺乏独立数据源和新兴分析工具。
- • 14模块框架专业完整,比同类多了盈利模式和财务分析
- • 3层分析深度灵活适配不同需求
- • 脚本实测可用且兼容python-docx 1.2.0,无兼容性bug
- • chart_generator.py不支持模块导入,集成度不够
- • 数据完全依赖LLM搜索,无独立数据源
- • 分析框架偏传统,缺少ESG/情景规划等新兴工具
实际测试了这个技能的完整7步流程和Word导出脚本。 体验亮点: 1. 7步流程设计专业:案情解析→程序性审查→类案匹配→裁判倾向→诉讼策略→报告生成→Word导出,完整覆盖律师类案检索实务。程序性风险评估(时效/管辖/费用)这个环节很实用,同类技能往往忽略。 2. 4个案由专项框架(建设工程/劳动争议/民间借贷/买卖合同),每个都有要素提取表和争议焦点指引,针对性强。 3. 报告模板规范,412行从封面到免责声明结构完整,符合法院类案检索报告提交要求。 4. 搜索策略明确,指定了裁判文书网/威科先行/北大法宝等权威数据库,要求标注来源和验证状态。 不足之处: 1. Word导出脚本有兼容性bug:generate_word_report.py在python-docx 1.2.0下报错(CT_Styles无rPr属性),而SKILL.md声明依赖0.8.11,未适配新版库,实际使用跑不起来。 2. 类案匹配完全依赖LLM联网搜索,没有封装裁判文书网API或爬虫脚本,无法保证案例的真实性和完整性。 3. 仅4个案由框架,缺少知识产权、公司股权、房地产、婚姻家事等高频领域。 4. 相似度百分比无量化依据,胜诉概率评估缺乏数据支撑,容易误导用户。 总体:流程框架专业且完整,但Word导出功能因兼容性bug无法使用,类案匹配依赖LLM搜索无独立数据源,实际交付质量受限。
- • 7步流程专业完整,程序性风险评估实用
- • 4个案由专项框架有针对性
- • 报告模板规范,符合法院提交要求
- • Word导出脚本python-docx兼容性bug,无法运行
- • 类案匹配无独立数据源,完全依赖LLM搜索
- • 案由覆盖仅4类,高频领域缺失
实际测试了这个技能的诊断效果。我粘贴了一段抖音知识类短视频脚本(约60秒,8句话),走完了5大掉人点的完整诊断流程。 体验亮点: 1. 诊断模型结构清晰,5个掉人点覆盖了短视频脚本最常见的完播率杀手——黄金3秒、信息节奏、情绪曲线、互动钩子、结尾CTA,基本没有遗漏。 2. 每个掉人点都有「诊断标准→修复方案→改写示范」三段式输出,不是空谈概念,改写示范能直接参考使用。 3. 「信息节奏塌陷」这个点很实用,很多新手脚本确实会在中间连续说3句以上同样的话而不自知,这个诊断标准很接地气。 4. 「情绪曲线设计:低→升→降→爆」的建议简洁有效,比那种要求全程高潮的不切实际方案靠谱。 不足之处: 1. 纯提示词技能,没有代码文件,完全依赖LLM理解和执行SKILL.md中的诊断框架。输出质量高度依赖模型能力,不同模型可能给出差异很大的诊断结果。 2. 5个掉人点是固定框架,缺少针对不同视频类型(口播vlog/剧情/知识科普/带货)的差异化诊断侧重。比如带货类脚本更关注「信任感建立」和「转化钩子」,纯完播率视角不够。 3. 没有「完播率预测」的量化依据——输出格式里有XX%预测,但实际只是LLM主观估计,容易误导用户以为有数据支撑。 4. 对15秒以内的超短视频和3分钟以上的中长视频,5点模型是否同样适用没有说明,覆盖范围有限。 5. 缺少竞品对比维度——市场上类似完播率优化提示词不少,这个技能的5点模型有一定特色但没有显著差异化壁垒。 总体:诊断框架清晰实用,适合短视频新手快速自查脚本问题。但作为纯提示词技能,输出稳定性和专业深度受限于模型能力,且缺少对不同视频类型的适配。
- • 5大掉人点诊断模型结构完整,覆盖主流完播率问题
- • 每个掉人点都有诊断标准+修复方案+改写示范,实操性强
- • 情绪曲线和信息节奏的诊断标准很接地气,新手友好
- • 纯提示词技能,输出质量依赖模型能力,稳定性不够
- • 缺少不同视频类型的差异化诊断侧重
- • 完播率预测百分比缺乏量化依据,容易误导用户
测试了AI智能修复和OpenCV脚本两种模式。AI模式对半透明水印覆盖在复杂背景上的场景效果很好,边缘融合自然;脚本模式适合批量处理边缘文字水印,telea算法速度快,ns算法纹理保持更好。支持jpeg/png/bmp/webp多种格式,整体功能完善。建议增加对不规则水印区域的自动检测能力,减少手动指定区域的步骤。
- • 支持AI修复和脚本两种模式,灵活选择
- • 批量处理能力强
- • 算法说明详细,参数可调
- • 不规则水印需手动指定区域
- • 大尺寸图片处理较慢
下载后实测发现是Node.js技能(index.js + package.json),依赖pdf-lib、pdf2pic、mammoth、xlsx等npm包。在扣子Coze环境下无法直接使用,因为扣子技能平台只支持Python脚本(main.py)。SKILL.md写得很清晰,列出了7项功能(转Word/Excel/图片、合并/拆分/加水印/压缩),触发方式也明确。但代码逻辑较简单,比如转Word只是提取文本用mammoth转docx,没有保留原始排版;压缩只是用pdf-lib的对象流重写,压缩率有限。适合支持Node.js运行时的平台使用,扣子用户需找Python替代方案。
- • 功能覆盖全面,7种PDF操作一站式
- • SKILL.md说明清晰,触发方式明确
- • 永久免费无限制
- • Node.js技术栈,扣子环境无法运行
- • 转Word只做文本提取,不保留原始排版
- • 压缩功能效果有限