一切因为 deepseek
大年初一的时候我在家里玩 DeepSeek,当时觉得挺有意思的,但没有想到我会因为这个东西开启了连续加班模式。
大概是从初三,初四的时候,领导拉会通知要开始攻坚模式,当天就加班到了半夜。 现在出差来上海搞封闭式,已经连续 3 周没有休息了,周六日都是火力全开模式,每天半夜 3,4 点,感觉已经精神恍惚了。
领导昨天过来说让我们下周回去个 3,4 天的,修整一下。我们说只有 3,4 天的没啥意义,路上就占了一半时间,还是在这呆着吧。 但领导说这个项目不知道什么时候能结束,所以最好还是回去跟家里人聚聚。
不过我还是觉得不回去了, 清明的时候让老婆孩子来上海玩, 就当聚聚了。
对后面的一些想法
因为正在测试模型底层的架构,这几周学了好多大模型底层的知识,昨晚还在研究 EP,DP,TP 和 PP 并行的原理,所以收获还是很多的。 跟一些同行交流过,自从 deepseek 出来以后,搞 ai 的这些公司就更卷了,大家都在抢时间抢市场抢用户。 感觉 AI 这几年是彻底繁荣了起来,就是不知道这股火力能持续多久。现在大环境也是大力发展 AI 和算力建设,希望能因为这波繁荣,让我们的职业生涯更长久一写吧。
嗯~ 就先这样~ 继续干活了。
转载文章时务必注明原作者及原始链接,并注明「发表于 TesterHome 」,并不得对作品进行修改。
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!