• 额。。我认为公司是想产出实际业务收益,也就是赚钱的,如果 token 大量花费在自动化测试上,要不然就是财大气粗瞎搞都没事,不然就是纯视觉公司,不然只有一个点了,为了 ai 而 ai,别说产出收益了,是疯狂倒贴钱还永远不会收回的

  • 2026 年求职记(一) at May 25, 2026

    可能现在 base 承接不住那么多的了,可能跟个人还无关

  • 在极窄领域(比如只处理 REST API 的测试用例生成,且每一步都能访问完整 API 规范),加上人工检查点,还是能产生生产力的,但是如果妄想什么都搞的很精准,那就没辙了

  • 感觉一切问题都是上下文压缩问题,压缩了必定丢内容,也说不好到底有哪些次要被丢弃的刚好又是很关键的信息。说起来,除开特定工作流,类似这种什么生成自动化用例啊,读取代码生成巴拉巴拉啥的,得首先理解你得大模型在一个 session 里面,在百分比多少的时候会开始离散信息,什么时候你需要开始压缩信息持久化了。但是持久化压缩之后的信息必定不会等价于原生完整的信息。类似 subagent 这种,读取大量信息,然后 summary 汇总算是一种方式,但是这种方式也只是暂缓,所以这也是为什么在目前 AI 没有阶段性突破动态权重这环节的时候,任何你要 AI 自主驱动的东西,都是不切实际的,除非你跟人家那位授权 100 个 cc 工作,一个月花费几百万成本去搞所谓的用例...

  • 跟你想的如出一辙,但是我目前没有像你这样做的很精细,因为我是大数据场景,因为是数据流转,所以必须精通业务才知道数据后面的业务背景,那么对于大模型来说,我给了一个总结,叫做 最小认知单元。这个东西不是什么字典,也不是什么指标定义,而是就跟我们大脑一样,我为什么会知道要这么做?这个就跟里说的一样了。目前我是让它根据一份 ETL 生成一份最小认知清单。让它有一个像人一样的工作认知。确实我是认为这个思路是正确的

  • 可惜了,这个前端工程并不重要,model 才是核心,我甚至认为这是 Anthropic 刻意有意发布出去的,为了让市场无形的手来打造属于 CC 的生态圈

  • 我感觉 ai 要做到非常完善的压缩前文,上下文,要参考大脑的存储了,比如我们记忆东西,很多东西就是长久灌输,有了外部环境的灌输才知道的,虽然现在参数还没我们大脑神经元突触的数量级那么大,但是我感觉把,真要到这个指数级了。开放云端的 ai 个体互相互补,真就是一个群居社会 ai 的雏形了,真就云上大脑了,想想都贼恐怖,毕竟不知道某个特性的涌现效应的条件是什么,可能突然某一天就触发了这个客观存在的涌现条件了

  • 现在搞时间序列算法...我是感觉我写的没 ai 给我得好,已经两周不写一行代码了,只做结果 check。。。

  • 我还是比较认可你说的,至少我目前看到的,你这个实践是最符合我体感的,生成用例这块我觉得就是属于死党 - 上下文少不行,上下文多也不行,受限于模型本身能力。加上人工迭代等等。除开少数业务是那种定向分析的,能开拓一下分析视角。我个人觉得 ai 还是用于编码方面是更适配的,强行拉到测试这个版子有点过于强求了

  • 😅 我在刚接触测试的时候就有一个疑问,xx 自动化,xx 自动化,如果需要维护,大部分人还觉得是个负担,那个这个东西他就是没意义的,什么叫自动化?像流水线一样,像智驾一样,自动开车,自动收付款,自动农耕一样的自动播种,浇水,即使需要维护也是中长期跨度的维护。到了测试这边,所谓的 ui 自动化测试投入的东西毫无意义,或者有人说你觉得没意义是因为你 xxx 还不够深入,我对这种是很嗤之以鼻的,除开少数公司非常特殊特定的业务以及独立的环境之外,其他的百分之 99 都是没意义的,如果有人觉得有意义,那你就是对的