大佬您好~~~ 非常赞的分享,有两个疑问点想请教一下:
1、在很多公司,基础的模型效果由算法研发自己保障(或者他们也是用底层团队提供的模型),测试一般是站在业务的角度来保证整体端到端的效果,您后续是否有这关于业务部分的一个分享?
2、利用相似度算法来自动化评测大模型生成的算法,尝试过语义相似度,编辑距离等,但是打分置信度不高,彼此之间的差异貌似没有拉开,需要人工介入的成本还是很大,想了解下您这边有做过不同相似度算法的一个对比么?有比较推荐的方式么?
2019 祝平安顺遂~
纵然历经人生风雨几重也能保存一份单纯的心 难能可贵 ~
不忘初心,不负梦想