内网中的组织服务器里藏有许多故事。我们单位拥有两台PVE服务器,其中1号机近一年来使用频繁,而2号机则鲜少启用。在2号机上,原本的心理测评服务遇到了不少问题。
1号机和2号机的基本情况
这两台服务器的情况得先说明一下,1号机在过去一年里是有被使用的。由此可见,1号机在这段时间内承担了部分组织的工作需求。相对的,2号机则鲜少派上用场。之前的心理测评服务被转移到了2号机上,这或许是从前就有的计划。然而,这样的分配就像是在土壤中埋下了种子,未来可能会引发各种问题。记得当时在确认端口已经开放之后,1号机的管理界面可以正常访问,但2号机却不行,这确实让人感到奇怪,毕竟它们都是服务器,为何会有这样的差异?
回想起刚接管服务器时,我注意到二号机无法连接。起初,我猜测可能是文档问题或权限限制。一号线却能正常访问,而二号机并未投入使用,我便没有深入调查。这为后续的问题埋下了隐患。
管理界面访问故障
网络管理界面是操控虚拟机的关键途径。通常,只要端口开启,就能顺利访问。然而,尽管8006端口已经开放,2号机的管理界面却依然无法访问,这让人感到困惑。确认端口确实已开启,但2号机却无法正常工作,而1号机却一切正常。这或许是因为2号机本身存在某些潜在问题,导致这种情况。回想起来,当我刚开始负责时,2号机就曾出现无法连接的情况,这或许并非巧合。
部分服务中断
组织的部分服务依托于1号机的虚拟平台。2号机出了故障,令人意外的是,1号机也跟着出了问题。2号机一出现问题,1号机上的服务便无法正常运行。这可能会对组织的工作造成重大影响。那些依赖这些服务的人员可能无法正常进行工作,他们或许在等待服务恢复以便继续未完成的任务,然而服务器却未能提供支持。
备份数据的忽视
在抢救服务器前,老师们已经备份了21年的网站资料。我对此毫无记忆,更不清楚那是哪个网站的备份。即便询问了前任总监,他也表示不清楚,因此我并未放在心上。当时心里只想着先救服务器,因为服务器故障才是最紧迫的问题。不过,如果当时能仔细研究这些备份资料,可能之后就能避免很多麻烦。
在本地的尝试恢复
服务器抢救未果,心理测评服务未能恢复。于是,我开始对备份文件进行探究。在wwwroot目录下找到了安装说明文件,这才了解到该项目是在Windows Server上运行的ASP项目。在本地VMware环境中成功部署并恢复后,我以为一切都会顺利。然而,心理测评服务又出现了数据库问题,若数据库处理不当,直接访问便会出错。同时,我还担心数据库并未一同备份,若真是如此,即便服务重新启动,也无法正常工作。
换服务器闯关
要在二号机重新安装,便又提交了开放端口的申请。然而,在更换服务器的过程中又遇到了麻烦,线上注册时系统检测未能通过,提示系统运行环境与上次注册时存在差异,导致无法完成注册。紧接着,又遇到了二号机无法连接的问题,一号机的管理界面也无法登录。联系信息办检查线下物理机,得知二号机损坏了两个硬盘。强制重启二号机后,更糟糕的是,一号机也失去了联系。这时,我们陷入了更加棘手的困境,后续的工作不知该如何进行。
在工作中,你是否遇到过服务器故障,导致手忙脚乱,还引发了一系列额外问题?若有类似经历,欢迎分享。期待文章对你有所助益,请点赞并转发。
发表回复