你是不是也遇到过这种抓狂时刻:同一段需求丢给ChatGPT、Claude、Gemini,答案风格像“换了个人”;Midjourney更离谱,明明提示词没变,出图却像在开盲盒。与其靠感觉骂街,我更推荐用会话分析的思路给AI做个“体检”,把问题量化出来。
指标一 解决率 别只看它写得长不长
会话分析里常用KPI是“解决率”,说白了就是这次输出能不能直接用。我的做法很土但有效:给每次结果打标记“可直接交付/需要追问/完全跑题”。一周后你就能看出:谁更稳定、谁更爱自嗨。
指标二 返工次数 专治答非所问
返工不是你菜,是模型经常漏掉约束。把你追加的那句“按表格输出”“别编数据”“用中文”都记下来,统计每个工具平均要补几句才到位。
