专栏文章 2025.6 -- 继续找工作中。

magicyang · June 19, 2025 · Last by 陈小猫 replied at June 19, 2025 · 796 hits

昨天又有点破防,因为还想着万一能有南京的机会,PUSH 了两天华为某新独立 BU 的 HR 去问能不能面试,结果告诉我能力不太够。。。
哎,19 级,做技术到 19 级,哪那么容易。。。

终于看明白了。

  1. 猎头就是扯淡,所谓机会,就那么多,1 个 HC,10 个猎头推,千万别认为是 10 个。实际就那么回事。
  2. 虽然早就明白每 5 年就是一个坎,这次感受坎确实有点大。
  3. 纯技术岗要么大厂蹲着,要么小公司直接做 CTO,年纪越大越难。人太多了,博士也太多了。
  4. 现实中的 HC 远比想象中的 HC 少很多。大部分职位都是缺 3-5 年干活的,不缺资深的。或者说只缺极其资深的,一般的其实别人也瞧不上。--如至少华为 19 级,P9 左右的能力水平。。。😓
  5. 即使是大厂对 HC 投入也比较谨慎,对于还没有发展起来的技术,也不会开中高级别 HC 来做储备。

所以结论是:
能做管理还是去做管理吧。
上升通道大的多。至少你手上还有资源,老板一般不会轻易拿你开刀。

坑位啊,坑位,找起来真不容易,快找了一个坑位了,别管行不行,能给 OFFER 的话,该去上海去上海,该折腾就折腾折腾,别老想有的没的。
还是自己菜,技术菜是一方面,更菜的心理建设,一塌糊涂😓。
至于 45 以后,再说吧,坚持不住,就躲回南京,看看能不能找个躺一点的。😓
随缘吧。。。

共收到 3 条回复 时间 点赞

人挪死,树挪活,确实不能光盯着南京,趁着还能动多出去闯闯~

考虑上海不,我们上海招 GPU 或者 AI 网络方面的

IaaS 产品架构师-AI 方向(深圳/北京/上海)
岗位职责
1.技术支撑:为行业客户提供腾讯云通用计算和异构计算产品相关的技术咨询服务,充分理解客户需求及行业特点,提供公有云基础设施的方案设计和产品支持;
2.项目落地:针对特定行业客户输出需求说明、技术方案、落地推进、最终交付,以及过程中的问题处理,满足客户在 iaas/paas 产品上的需求跟进;
3.需求反馈:通过自身的专业技术能力,洞察行业发展趋势,对客户的需求进行洞察和挖掘,并形成产品的后续能力补充;
4.方案沉淀:对腾讯云本身以及结合云各类产品(容器/网络/存储/机器学习平台等)为客户进行具体解决方案文案的输出和持续更新;
5.产品宣导:对不同行业的其他架构师进行 AI Infra 解决方案和最佳实践宣导,并在过程中进行方案和文案的优化和更新。
岗位要求
1.人工智能、计算机相关专业硕士及以上学历,5 年以上 AI 领域工作经验;
2.熟悉云计算和网络架构整体技术体系(包含服务器、容器、存储、网络、数据库等),掌握其中 1~2 个技术领域;
3.了解深度学习框架 (Pytorch, Tensorflow、DeepSpeed 等),熟悉 AI 训练和推理场景、常见 AI 模型;
4.对 GPU,分布式计算,RDMA,MPI,GPU Direct 等技术有了解和使用经验优先,有分布式训练、模型训练及推理调优加速相关项目实战经验优先;
5.具备优秀的文档能力,使用文字、图示清楚地表达架构意图,能够熟练编写各类技术文档;
6.具有娴熟的沟通技巧,执行力强,具有优秀的团队合作精神、敬业精神;对互联网与云计算行业有清晰的认知和热情。

大模型推理优化研发工程师 - 算子优化 (上海)

岗位职责
1.参与基于 GPU 的高性能计算 (HPC) 项目设计与开发,负责 GPU 芯片 (NVIDIA,AMD 等) 的底层性能优化与调优;
2.针对大模型推理场景,优化和扩展 vLLM、SGLang 等框架的核心模块,提升计算效率与资源利用率;
3.深入分析 GPU 硬件架构特性 (如 Tensor Core、显存带宽、通信机制等),设计并实现高性能算子与算法;
4.探索前沿技术方向 (如混合专家模型 MOE、动态计算图编译优化、JIT 等),推动 AI 工程化落地的效率提升。
岗位要求
1.经验要求:2 年以上 GPU 高性能计算开发经验,有大规模 AI 模型优化经验者优先;
2.精通 CUDA OpenCL 等 GPU 编程语言,熟悉 NVIDIA 或 AMD 的底层优化技巧;
3.精通 Triton,Cutlass,CK 等高性能算子开发工具;
4.熟悉 VLLM、SGLang 等大模型推理框架,有实际性能调优经验 (如 KV Cache 优化、动态批处理、Attention 算子定制等);
5.扎实的高性能计算基础,熟悉并行计算、内存优化、通信优化等技术;
6.熟练使用 C/C++、Python,具备良好的算法设计与代码实现能力;
7.熟悉 Attention 结构 MHA/MQA/GQA/MLA,以及 MOE 结构。

腾讯云 - 虚拟化研发工程师-AI 机型研发方向

岗位职责
1.虚拟化平台异构计算方向功能、性能优化;
2.异构计算方向虚拟化能力适配;
3.异构计算方向虚拟化相关软件生态适配;
4.前瞻性技术预研。
岗位要求
1.3 年以上相关工作经验;
2.深入理解 KVM 虚拟化技术,具备内核开发,性能分析能力,Debug 能力;
3.深入理解 IOMMU,PCIe,硬件辅助虚拟化技术,熟悉 GPU/NPU/DPU 相关的技术解决方案;
4.深入理解主流 GPU/NPU 硬件架构,了解业界发展方向与最新进程;
5.熟悉上层 AI 方向主流框架,具备硬件调优经验。

腾讯云 - 高性能网络后台研发工程师 (上海/深圳)(上海)

岗位职责
1.负责计算集群的高性能 RDMA 网络系统软件开发和建设工作,构建业界领先的集群高性能 RDMA 网络性能和稳定性;
2.负责业界大模型训练的主流加速框架(如 DeepSpeed、Megatron-LM)与云平台底层技术特点和优势结合,通过自研高性能 RDMA 网络技术进行持续优化;
3.跟踪业界最新 AI 基础设施和互联网络通信技术建设情况,包括 scale up&out 网络,持续打造自研产品竞争力。
岗位要求
1.本科及以上学历,人工智能、计算机、数学等相关专业;
2.5 年以上 AI 研发或项目经验,有云计算领域相关经验优先;
3.具备 TensorRT,Triton 等推理框架和服务部署软件的优化和实践能力;
4.熟悉深度学习框架 (Pytorch, Tensorflow,等),熟悉各组件和类库,常见 AI 模型;
5.熟悉行业内人工智能平台、机器学习实现方案,熟悉主流云计算厂商 AI 产品特点,有 AI 研发经验者优先;
6.对 GPU,分布式计算,RDMA,MPI,GPU Direct 等技术有比较深入的理解和实际部署优化经验;
7.精通 C++、Python 等开发语言,熟练掌握 Linux 软件开发技术;
8.有一定的管理能力,具备丰富的产品规划和设计经验,对人工智能技术及行业有前瞻性战略思考;
9.清晰的逻辑分析和表达能力,乐观积极,具有较强的责任心和执行力;
10.通过腾讯云技术认证或同等资格认证的优先录取。

大模型推理集群优化研发工程师 (上海)

岗位职责
1.负责大模型推理集群的长期规划、架构设计与持续迭代,构建高可用、高性能的分布式推理基础设施;
2.参与大模型推理部署平台的建设,包括大模型模型服务管理、模型发布、模型滚动升级、模型回滚等基础能力;
3.构建大模型服务自动化部署工具链,支持一键式模型发布与集群扩缩容;
4.负责大语言模型 PD 分离架构下的集群优化,包括 PD 分离集群管理、PD 分离高可用、PD 分离集群资源优化等;
5.负责大语言服务层流量调度,包括流量分发系统、负载均衡策略(如动态权重分配、请求优先级调度、KV Cache 感知);
6.设计面向外部的高性能大模型调用 API(REST/gRPC),实现请求鉴权、流量控制、请求计费、熔断降级等核心功能;
7.搭建端到端监控体系(QPS/延迟/错误率/GPU 利用率),建立 SLA 保障机制与故障自愈能力;
8.解决多租户场景下的资源隔离和资源复用问题,保证用户需求的基础上,实现最大化集群利用率。
岗位要求
1.熟悉容器化技术,熟悉 Kubernetes 技术栈,有 Kubernetes 生产级集群管理经验;
2.熟悉 LLM 推理特性(显存管理、动态批处理、KV Cache 优化),熟悉开源大模型推理框架(如 vLLM、SGLang);
3.熟悉 LLM 推理 PD 分离式架构,对 PD 分离架构下的调度、网络通信、并行策略等有一定了解;
4.有大规模分布式系统开发和优化经验优先;
5.有大模型推理框架经验优先;
6.有大模型推理 PD 分离架构优先;
7.有 Maas 平台落地经验优先。

需要 Sign In 后方可回复, 如果你还没有账号请点击这里 Sign Up