上海某生物制药ftServer维修篇

公司背景:    上海某生物制药公司成立于1992年,是医疗业务领域影像及临床设备方面重要的全球研发、制造中心之一,致力于计算机断层扫描(CT)、X光、超声等诊断设备和相关医疗零部件的研发生产,以及相关客户服务。公司研发生产的产品销往全球70多个国家和地区。目前公司拥有1000多名员工,其中研发人员超过三分之一。公司于2007年迁入上海国际医学园区,占地面积10万平方米,目前各类研发及生产区域超过70, 000平方米。新建的X光产品大楼于2013年8月落成并投入使用,进一步提升了公司的产品研发和生产能力,以更好地满足日益增长的市场需求。

项目背景:    冻干机组是长周期运行设备,作为整个生物制药产线的关键系统,必须具备操作方便、可靠性高的特点。该生物制药公司为冻干系统的高可靠性,在建设初期就采用了ftServer高可用容错服务器作为冻干系统的高可用运行平台。通过ftServer高可用解决方案不仅保证了数据“零丢失”,还保证了冻干系统在发生任何故障时,业务系统的无缝切换(自动),在业务不断的同时,最大限度的保障业务系统的持续稳定运行。挑战:    客户所使用的ftServer因前期现场施工的原因,两年时间未能通电使用,由于长时间的搁置,导致了ftServer出现故障,风险性极大。客户要求我们在确保整体项目进度不延后的情况下,对故障原因进行排查以迅速解决此次故障。

 
 
 
 

    相比较传统的双机热备及虚拟化高可用解决方案,需要停机更换损毁部件,同时还要再备机上重新安装软件以及配置搭建双机环境,既费时又费力并且还有风险,往往修理好再恢复到双机状态,需要短则半天,多则2-3天时间,这对客户是巨大损失和风险;而我们工程师利用专业熟练技能以及ftServer自身同步镜像技术,在业务系统不停顿情况下,在极短时间内(60分钟内)完成损坏部件在线更换和系统数据同步,让系统马上恢复到之前冗余状态。

    讲到这里,我们不得不首先介绍一下 ftServer 的特性。

 
 

ftServer 是一个旨在提供持续可用性应用程序和数据服务的全面集成硬件和软件解决方案,可帮助公司最大程度地提高收入、生产质量和生产率。五个主要特性有助于使 ftServer 易于部署、易于管理和易于维护 — 无论在数据中心还是在边缘:

 
 

Automated Uptime Layer:具有独特的冗余现场可编程门阵列、数据路径和同步固件,即使硬件组件出现故障,也能够提供确保持续可用性所需的处理器同步、数据复制和逻辑。

主动服务架构:ftServer 自动化的自监控、告警、自诊断和补救功能是通过主动服务架构实现的。通过简化ftServer 监控和管理,以及筛选需要采取行动的问题,Stratus 可节省公司时间以及减少工作量。

具有冗余硬件的单一系统:每一个 ftServer 系统都由两个相同的客户可更换单元 (CRU) 组成 – 其中每一个客户可更换单元均有自己的处理器、内存和存储。所有冗余组件和子系统打包为单一系统,从而降低了许可成本并简化了管理。

支持热插拔的客户可更换单元:ftServer 旨在实现服务性,它的可热插拔 CRU无需关闭系统即可拔下,并且无需使用特殊工具即可更换。这一点以及自动数据重新同步使ftServer 适于在远程制造位置或 IT 资源有限的位置部署。

行业标准组件:ftServer 使用在其他行业标准 x86 系统中也使用的芯片组、DIMM 和驱动器。它还使用标准分发包装的操作系统和虚拟化软件,从而简化了管理并缩短了价值实现时间。

 
 
 
 

在经过洋米工程师的上门现场排查后,发现该服务器的VLT故障灯亮起。

    通过故障指示灯加上与客户现场工程师的交流,迅速确定故障原因是因长时间的搁置导致的直流电压故障,从而分析出故障可能出现在电源模块与主板方面。

    确认方向后,我们首先对刀片服务器进行了电源模块更换与粉尘清除的工作,尝试通过更换电源模块解决故障。

    更换电源模块后未能解决故障,这时基本可以判定为主板原因,在与上海Stratus配件中心说明现场情况与故障原因后,配件中心方面迅速调度两台全新刀片服务器发送至客户现场提供更换。

下面让我们来简单介绍一下本次更换服务器损坏具体7步操作步骤(60分钟)1将故障部分的CRU断电后从服务器组中拔出。2 将内存和硬盘按照原CRU对应位置插入到新的CRU中。3 将新的CRU插入到服务器组中。4接通电源,等系统自检。5登录到操作系统,进入VMware ESXi界面查看各个虚拟机设备运行状态6等待数据自动同步--同步时长视数据大小而定(50分钟)。7更换维护操作完成, ftServer恢复双工冗余状态,持续为业务提供高可用平台。

    洋米所提供的高品质服务和快速响应速度促使了客户后期工作的顺利推进,收到了来自客户方的高度认可。    客户特意发来感谢信息,内容如下:    “感谢洋米公司技术团队最近两周给予该项目服务器问题上非常有力的技术支持和售后保障,也感谢你们提供的高品质的服务和快速的响应速度,促使了我们对后期工作的顺利推进,尤其是洋米工程师三次占用周末时间到现场排查问题,你们的专业技术值得同为售后服务的我们学习,目前服务器已经可以正常运行;再次感谢洋米技术团队的支持!”

收益结果:    该生物制药公司的冻干系统自上线以来,受ftserver容错方案的保护,一直持续稳定对外提供业务操作。

    ftserver架构脱离单个软件映像(可以是 Windows、Hyper V、Linux 或 VMware)运行,在组件出现故障时不存在转换时间,因为它已经在与同时执行完全相同任务的双工搭档组件同步运行。因此,没有任何转换时间!在一个 CPU 组件无法工作时仍继续处理业务,正在进行的交易不会出现任何中断,其余 CPU 将驱动剩余的所有组件。在一个内存组件无法工作时也不会丢失该内存中的数据,因为剩余的同步内存搭档保存了所有这些数据;一个磁盘驱动器无法工作也没有关系,因为其镜像搭档仍会使这些数据保持完整 。ftserver可为客户提供持续在线处理环境!

目前洋米是以下供应商在中国认证的代理商以及项目实施商:

 

   ● Stratus(高可用解决方案)

 

   ● 庚顿(实时数据库和组态解决方案)

 

   ● KAYE(EMS环境监测系统)

 

   ● UiPath(业务流程自动化)

 

   ● 云扩科技(RPA机器人解决方案)

 

   ● 达梦(达梦数据库)

通过感知数据,为客户创造价值,使洋米信息成为业界领先的数据解决方案与服务供应商。

如何购买:如果您对ftServer及高可用容错解决方案感兴趣,可以随时联系我们: 400服务热线:400-886-3606洋米官网:https://www.data-aware.com 我们可以为您提供基于ftServer及其他高可用容错软硬件一体化解决方案(包括售前咨询以及销售和售后支持技术服务)。

 

END

实施案例

创建时间:2022-09-09 15:38