欢迎来到池州三陆五信息科技有限公司- 未来科技

微信
手机版
网站地图

浪潮存储:基于系统级可靠性设计,为数据存储保驾护航

2024-04-22 09:02:09 栏目 : 手机数码 围观 : 0次

存储系统是由控制器、底板、结构部件、硬盘、内存等部件组成的多个子系统,其中任何单个部件故障都可能导致存储系统出现问题。因此,系统可靠运行的基础,离不开零件、零件和整个控制系统的可靠性设计。浪潮存储从系统级开发、电路板级开发、部件引进、生产加工等多个环节保障系统的可靠性和稳定性。系统级可靠性设计在存储系统中,许多部件的故障都是由于系统设计不合理或部件使用不当造成的,而不是部件本身的缺陷。浪潮内存系统级可靠性包括:可靠性模型及评价、容错(故障分析)、热、/EMI(Electro Magnetic Compbility/agnetic Interference)、安全等。第一,控制器单元冗余设计。关键部件增加功能完全相同的备用通道,保证该部分发生故障时不影响系统正常运行。例如,双BIOS设计可避免当BIOS由于闪存芯片故障或升级失败而损坏时,备用BIOS可以接管,从而无法开机。虽然控制器冗余设计是以成本为代价的,但存储系统设计的首要考虑因素是可靠性。第二,控制单元的断电保护。存储系统添加了BBU电池备份,以抵抗电网瞬时停电或突然电压下降等突发因素,软件系统将电信号定义为最高级别的中断,控制单元及时响应断电,防止数据丢失,确保业务连续性。第三,结构设计。结构可靠性设计是硬件可靠性设计的重要阶段。在结构设计时,首先要注意零件及其安装方式,其次要控制系统工作环境的条件通风、除湿、防尘等。第四,噪声抑制。存储系统主要通过以下方式抑制噪声,首先选择高效的双电机风扇,优化系统散热所需的风扇转速;其次,优化节点导风罩的设计,降低单节点流电阻;再次,系统风扇控制引入PID控制,降低低负载时的系统风扇转速;最后,通过散热器优化、风路布局优化及系统流阻优化改善散热效果,从而降低正常工作负荷下的设备噪声。第五,散热设计。存储系统通过对系统布局进行风路区分,一般分为Memory风路、CPU风路、节点风路,在各风路之间利用底盘布局的结构部件实现风路的串联或并联。风扇的散热风量由系统风扇加速后,进入并联的节点风路,从节点尾部的开孔结构排出,从而保障系统的稳定运行。

热模拟模型第6部分,系统日志采集。存储系统会在一段时间内收集系统信息,并自动创建可查看的文件。如果存储出现故障,您可以使用日志快速确定有问题的部件。电路板开发可靠性研究开发小组是不能正确使用模具部件或集成电路,提高硬件可靠性的重要因素。一是电路设计。据统计,影响存储系统可靠性的因素约有45%来自系统设计。为了确保系统的可靠性,在电路设计中必须考虑最极端的情况。单板设计必须考虑到所有元件的公差,并考虑到其最不利的数值计算电路的每一个规定特性。如果该参数值的组合保证电路的正常动作,则公差范围内的其他所有要素值可以使电路可靠地动作。在进行电路时,开发人员还对单板部件进行分析,对重要部件给予热应力、电应力,并根据以往的部件故障分析FEMA的经验,对易于集成电路、重要部件进行最佳分析。其次是组件的选择。确定元件参数后,元件的模型也被确定,这主要取决于电路允许的公差范围。由于制造工艺的限制,某些元件参数的公差范围可能较大,例如电容器容量。而且,组件的额定工作条件包括电流、电压、频率、机械参数以及环境温度等多个侧面,考虑参数余量而设计,保证在工作条件的范围内工作。第三是电气性能。元件的电气性能是指元件所能承受的电压、电流、电容、功率等能力,在使用时应注意元件的电气性能,不得超限使用。第4个是SI(signal?rity)模拟设计。随着信号频率的增加,在存储系统中分析、发现和有效解决信号完整性问题是非常复杂的。存储系统采用EDA电子设计自动化工具,对电路参数进行仿真分析,提前发现问题,缩短研发周期,降低研发成本。

通道损耗分析

5、信号图质量分析是生产过程。由于工艺引起的故障通常很难定位,一个焊点的虚拟焊接可能会导致整个系统在运行过程中不稳定。因此,在设计印制电路板的时候,必须考虑元件的布局、导线的方向、导线的分类顺序等因素。六是硬件测试。浪潮存储研发团队引进了价值数百万的高端测试设备,其中包括50G高端示波器、50G高带宽硬件链路误差仪及相关夹具。存储硬件研发团队制定了全覆盖、无泄漏信号测试规范,进一步加强了验证测试。其中包括板间热插拔、固件反复升级验证、单/双控制故障、板间信号动态测试、低温启动、高温压力测试、强化验证SI链路可靠性测试。

PCIE5.0试验部件导入确保可靠性的设计硬盘作为存储媒体的中枢,确保机械硬盘的安全性和可靠性已成为存储研发部件小组最重要的课题。浪潮存储研发团队将与硬盘厂商的技术共享与专有专利技术相结合,形成了包括磁盘加密、协议层定制及写缓存关闭等技术在内的定制方案。与Raid技术合作,更好地保证客户对数据安全的要求,开发了自己的屏幕方案和屏幕设备,满足金融等行业用户的需求。对于存储设备,浪潮存储研发团队开发了多控制器系统,结合了锁盘技术、硬盘定制化及Raid技术,实现了硬盘高速读写需求与安全性、可靠性的完美结合。硬盘通过部署测试、兼容性测试、屏幕测试、老化测试等层面,为存储设备奠定了坚实的基础。

硬盘测试时延分布曲线生产制造保证可靠性生产制造制造是产品生命周期的重要组成部分,通过批量生产和用户反馈,发现更多前期设计中的漏洞和缺陷,及时检查缺陷。浪潮存储在生产线上引入了温度循环室,用于测试存储产品在不同温度条件下能否正常稳定运行。环境温度可根据需要随时调整,加快缺陷部件故障再现,降低产品到货即损DOA的情况。极限场景测试和

温循房高端存储产品必须保证极端稳定,设备生产结束后先7?进行14天的长稳定测试,测试用例模拟客户实际业务场景,采用客户常见的数据类型进行压力测试,在测试过程中观察存储设备是否有报警和异常,将所有不稳定因素监听到生产阶段,保证设备交货后的稳定、可靠运行。

基本应用拓扑近年来,浪潮存储不断增加研发投资和创新,致力于构建安全、可靠、经济、高效的数据存储库,不断追求“终极稳定”,为数据存储保驾护航,服务各行各业。

展开剩余内容

分享到:

猜你喜欢

热门标签