rennee_mao (Rennee) · 回帖 · 测试之家

会员

rennee_mao (Rennee)

第 8344 位会员 / 2016-04-05

3 篇帖子 • 4 条回帖

0 关注者

0 正在关注

0 收藏

未设置 GitHub 信息.

我们是如何测试人工智能的（一）基础效果篇（内含大模型的测试内容） at 2023年12月22日

大佬您好~~~ 非常赞的分享，有两个疑问点想请教一下：
1、在很多公司，基础的模型效果由算法研发自己保障（或者他们也是用底层团队提供的模型），测试一般是站在业务的角度来保证整体端到端的效果，您后续是否有这关于业务部分的一个分享?

2、利用相似度算法来自动化评测大模型生成的算法，尝试过语义相似度，编辑距离等，但是打分置信度不高，彼此之间的差异貌似没有拉开，需要人工介入的成本还是很大，想了解下您这边有做过不同相似度算法的一个对比么？有比较推荐的方式么？
所有你经历过的，必然只留下最好的 —— 我的 2018 at 2019年01月15日

2019 祝平安顺遂~
[思寒] 2016 个人总结_未来仍可期待 at 2017年02月25日

纵然历经人生风雨几重也能保存一份单纯的心难能可贵 ~
心向百度 at 2016年05月10日

不忘初心，不负梦想