3 月 10 号裸辞,休息休息。
现在休息的不想上班。
主要时间在玩异度之刃,业余时间在图书馆看 torch 源码。😓
不想上班,不想面试,觉得没劲。
这个月聊了三家:
- 云天励飞,一面挂。mismatch.
- 小米 cpu 优化,一面挂。mismatch
- 字节豆包,一面挂。mismatch
我技术背景偏上层,什么都能做一点,小厂做优化么,算法、算子、框架、工程啥都懂一点,可以做很深,但是肯定是不成体系,哪里需要打哪里。
这在技术栈相对明确的大模型当下,试错的机会越来越少,找机会遇到 mismatch 也算是合情合理。
除了云天励飞,另外两家算是预料之中。
挺有意思的,各有各的 mismatch。
- 云天励飞,要找的是能解决底层工具库的人。南京这边没有做上层整体解决方案的。
- 小米 cpu 优化,我当时就奇怪,为什么 cpu 优化要找我聊,聊完的说法是 gpu 如果就跑跑框架,刚毕业几年的也可以,目前没那么资深的需求。
- 豆包,找能解决核心细节问题的人,比如 conv 有几种参数,几种参数可能有几种不同写法,区别可能在哪。--好像茴字有多少种写法。
还聊了一家,暂时没结果就不透露了,可能还稍微靠谱点。
需要我后面给老板画饼,为啥需要在 npu 上做优化,为什么要提前布局。
还有两家没聊,但估计稍微靠谱的就得回答上面的问题。
暂时还没有一套完整的想法,等下个月收心慢慢想吧,也急不来,哎。