请问各位大佬,ai 的输出怎么使用,自动化校验. 各位大佬有什么方案
除了断言相似度
为什么不问 AI
哈哈哈 好回答 谜底就在谜面上
问了 AI,公司要我干啥,哈哈
最近在玩大模型评测。方向:1.有准确结果的返回脚本解析 :比如 1+1 的结果。 2 .近似度问题:一段文本,请总结主题思想,使用语义近似度断言 3. 主观评测的问题,使用高级模型来断言:关公战秦琼那个更加厉害。