一片自留地 2025.5--记录一下

magicyang · May 09, 2025 · Last by magicyang replied at May 09, 2025 · 983 hits

这两天有点不太爽。
起因是因为一个年轻的小朋友知乎问我,是去华为做算子开发好,还是去国企好。
我把他怼了一顿,我个人觉得当你家庭没有托底,其实你看上的可以有的选择,又能有多大的区别呢?
来问对你不熟悉,不熟悉你个性,心性,背景的人,就几句话决定你一个重要节点的重要选择,也太过儿戏。
这么一想,想想年轻时候的自己又何尝不是。

昨天和老婆聊到一个问题,我说看新闻联播的人很幸福。为什么幸福,因为你发现周围的人和事都是正面阳光的,充满了希望。
但是你再让我们去看新闻联播,难。

裸辞两个月了,陆陆续续还在聊,总不太得劲。
我完全擅长的领域,现在还没有起来,包括头部大厂在内,还没有明确的技术路线和投入,导致基本没有 hc。
我这个年纪,今天再去做云端、服务端的推理加速,在目前已经做完 80% 的前提下,还有多少值得去做的内容,我现在一说服不了高层级的面试官,二说服不了我自己。
因此只能拖着随缘。

这两个月聊下来,可以清晰的感受到技术是技术,实践是实践,目前有这么几个点:

  1. 原先认为国产卡可能会有适配的场景,实际上傻子才用国产卡,自己重新搭一套不开源的适配框架,疯了么。这意味着国产卡的适配经验对厂商来说属于鸡肋。
  2. 复杂的调度操作,以前天天看 pp 并行是网络带宽低的最优解,实际上就算是 4090,单纯推理,在非超大模型下,pcie 对你带宽的影响和 hbm 对你的影响相比,那是 9 牛一毛。而大厂又都是标品,标品下的优化,怕是需要更多的实战经验,而这是我蹲在南京,就不可能有的机会。未来也不会再有。
  3. nvidia 框架层面诸协作组,graph 自定义内存,这些偏底层的,连 pytorch 里都没有,那是 nvidia 自己玩的东西,去不了 nvidia 的,看看就好,落地还是算了吧。
  4. transformer 算子越固定,算子层面,包括 compiler 层面可操作的东西越来越卷,越来越少。

还得看点新玩意,找点新点子,要不这故事肯定是没法闭环了。

共收到 7 条回复 时间 点赞

老哥屈才了

magicyang #2 · May 09, 2025 Author
赵又廷 回复

才有啥用。--又没高到远超别人,还不是普通人。
老老实实提供情绪价值比现在老想着提供技术价值活得轻松多了。

老哥 裸辞没有车贷房贷养孩子的压力吗

纯外行的问下,现在国产的算力卡是啥水平

我们的国产工程软件也一样,都是为了不被卡脖子,政治因素大于实际使用,国产的东西刚出来跟市面上成熟的产品没法比,能力就像 3 岁小孩一样,能沟通但很幼稚

回复内容未通过审核,暂不显示
回复内容未通过审核,暂不显示
需要 Sign In 后方可回复, 如果你还没有账号请点击这里 Sign Up