当前背景: 1、大模型全国各地(或者全球)遍地开花,各个厂区不论大厂还是小区,都蜂拥而上,号称落地了满血 deepseek R1 2、自媒体依靠大模型热度,比模型厂商更早挣到了第一桶金 3、测试行业也不甘落地,出现了很多基于大模型的精准测试、智能平台
问题疑惑: 1、落地基于现有业务落地大模型,测试除了关注产品文档上那一点黑盒的东西,还应该做些什么?
与其说落地了大模型,不如说,对于企业本身,使用 deepseek,具有合规和当前战略性意义。就落地后的效果来说,一言难尽。就如 manus 一样(很多做的离 manus 甚远)
准确来说,应该是大模型应用的测试