我觉得现在核心挑战在于,许多产品连需求文档本身都模糊不清。在一个完整的开发周期中,理想流程应是 AI 首先进行深度需求分析,将模糊需求拆解为明确、可衡量、可验证的任务项,再基于这些任务项生成测试用例。然而,测试用例往往篇幅冗长,大模型的上下文承载能力有限,导致最终生成的结果要么存在缺失,要么可测性不足。目前来看,针对完整系统生成测试用例的效果仍远未达到实用标准,仅在处理单一功能点时,才能实现一定的效率提
说了那么多,所以要怎么来测试 AI 应用,用另一个模型来衡量?
看整体大趋势的话,应该是游戏行业
下面的变量能打印是因为你获取的是第一层,打印出来是'data'对应的'value'
表达式错了把,json 是要按照层级获取值的,提示的很清楚了,没有找到对应的 key
