问答 后端发布后,有部分服务器未发布成功,这个是什么原因导致的?

TJxxx · 2023年05月30日 · 最后由 魏来 回复于 2023年06月05日 · 8457 次阅读

大佬们,可以帮忙分析一下吗?

共收到 7 条回复 时间 点赞

这个问题有点大。可能的原因很多,比如发布程序被意外中断了、资源不够了、服务器断联了、服务器配置有差异导致启动失败等,这么猜测没法接近真相。

直接去查发布日志,不是应该可以直接看出来未发布成功的原因么?

看了日志才能确定问题

抛开软件不谈,咱就说有没有一种可能是因为它们没插电源?没插网线?
又或者,它们不是你家的服务器?

这问题比中东局势的问题还要大

陈恒捷 回复

面试被问,我也一脸懵,除了看日志,还能怎么办呢

TJxxx 回复

估计是他们公司刚刚出了这种比较严重的线上问题

1.确认发布方式,手动部署还是自动化部署,定位是部署过程出现问题还是服务启动失败
2.自动化部署过程出现问题导致服务包没有分发成功,检查自动化部署日志,检查 ftp 机器与部署机器是否互信失败
3.手动启动服务启动失败的话检查服务启动日志确认是否因 Nacos 或 eureka 等注册中心指向错误
4.定位服务报错,是否因 sql 执行报错,如果使用 flyway 的话确认 flyway 版本是否冲突版本冲突就去库里修改 checksum 和 success 执行记录
5.检查启动脚本分配的服务启动内存和主机 free 内存
6.如果服务启动成功运行但是中途挂了,建议添加 GClog 启动参数排查内存问题

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册