由于硬盘故障造成重大损失的案例屡见不鲜,2023年,科技新闻网站Hacker News因硬盘故障导致服务中断,用户发起集体诉讼索赔超500万美元,某汽车工厂因硬盘坏道,导致生产线停工58小时,延迟交付12,000台汽车,某企业16块SAS硬盘组成的RAID5中2块硬盘坏道,导致虚拟机文件系统崩溃……
作为承载数据的核心物理载体,硬盘的重要价值不言而喻,浪潮信息为了确保服务器中每一块硬盘都具备过硬品质,在器部件选型导入阶段,就制定了严于行业通用标准的加严测试,测试项包括5大维度36细项,覆盖固件安全、数据完整性、可靠性、性能以及环境适应性等维度,通过严苛测试,验证了硬盘在极端温湿度、频繁断电、高负载写入及复杂物理环境下的可靠性,从部件层面为元脑服务器提供了高品质保障。元脑服务器开箱合格率达到99.7%,超过97%-98.5%的业界平均水平,高负载下,元脑服务器硬盘年化故障率为0.3%,低于企业级硬盘0.5%-1.5%的业界标准,服务器整机实际寿命比平均水平长1-2年。
当行业标准遇到极限需求,如何重新定义测试?
作为服务器“三大件”之一,硬盘是服务器的关键存储部件,决定了数据的可靠性、访问速度和扩展能力。传统硬盘测试包括性能、稳定性、兼容性及功耗几个方面,由于相关标准制定较早,存在以下一些不完善地方。
首先,标准测试项目不够全面,没有覆盖影响硬盘表现的固件、数据完整性等维度;其次,测试与实际应用场景联系不够紧密,偏重于产品基本性能指标,例如实际业务负载并非持续高峰,而是呈现高低交替状态,现有标准无针对此类场景的针对性测试;第三,行标测试基于正向逻辑,缺乏主动制造故障,验证容错能力。
在服务器实际运行过程中,无论是遇到电压波动还是风扇振动与高频噪声,亦或是信号干扰、异常断电等故障,会遇到各种意外场景,这些场景对于硬盘的可靠性、性能、稳定性可能造成重要影响,直接带来数据安全隐患。
为了更加贴近用户实际应用场景,业界需要一套更加完善的硬盘测试规范,作为整机系统厂商,浪潮信息是连接客户和供应商的纽带,了解客户需求与产品特性,具备制定规范的核心能力。
36项加严测试远高于行标,以实际场景需求定义选型标准
在充分客户调研基础上,浪潮信息综合结构设计、散热、固件、硬件等各领域工程师丰富经验,制定严格的选型标准,共包含5大类36个项目,覆盖固件安全、数据完整性、可靠性、性能及环境适应性等影响硬盘表现的各个方面。
其中,固件安全从底层杜绝隐患;数据完整性从写入、自检、校验全流程提供保障;可靠性测试则模拟真实业务,挑战极限负载;性能测试实现了全场景覆盖,确保极致稳定;环境适应性包括了振动影响、电压波动与系统兼容性等影响硬盘运行的环境因素。
在加严测试项设计过程中,主要考虑两个核心原则:
■ 场景化(测试项目来自于真实场景需求):例如,面对电商流量波动场景,加严测试模拟业务负载波动,测试硬盘在负载由低到高切换时的稳定性,确保无性能骤降或数据错误;面对不同业务需求,测试硬盘从512Byte小文件到1MB大文件不同数据块下的IOPS和吞吐量,确保性能波动<10%,满足多样化业务需求;服务器意外断电是常见故障场景,面对这一场景在100%写入负载时强制断电并重启,累计测试超1000次,确保数据零丢失,系统可快速恢复。
■ 极限化(测试标准远超行标):硬盘加严测试中,超越行标的测试标准达到20+项,体现出了以高标准追求产品的极致品质。以超长压力测试,数据中心硬盘年均写入量通常在100-300TB,而加严测试标准高达550TB/年(相当于每日写入1.5TB,持续5年),超行标300TB/年的要求;在电压拉偏测试中,正常产品设计为系统供电波动幅度5%,加严测试确保在电压±10%波动(如偏远地区、老旧机房)下,硬盘仍可稳定运行。
此外,加严测试中针对固态硬盘产品制定了高于行业的测试标准,以多盘均衡性测试为例,由于SSD硬盘之间性能差异会影响整体表现,加严测试要求各硬盘的性能与所有硬盘的性能平均值比较,上下波动不超过5%。
为确保服务器整体质量最佳,加严测试以多台满配服务器为测试单位,采用一次性测试原则,如果不能通过,浪潮信息会和供应商一起分析原因,探讨解决方案,改进产品性能,从而实现算力产业整体能力的提升。
以某品牌硬盘为例,其30TB大容量产品通过激光辅助提升磁密度,进而提升硬盘整体容量,而磁密度提升对系统震动、噪声更敏感,对磁头精准定位要求更高,风扇的叠加振动与高频噪音会对硬盘的可靠性产生严重影响。在产品量产前,浪潮信息和供应商进行了早期联合测试,通过对硬盘伺服系统设计进行优化,让硬盘性能从最低50%到提升90%+。
除硬盘外,浪潮信息对于内存、网卡等其它部件,都制定了高于行标的部件准入标准。从内存与主板之间的兼容性,到CPU和内存之间信号完整性,从不同网卡的差异化功能表现,到超时延敏感测试,每一款部件在交付客户之前,都经过了严苛筛选,确保元脑服务器在可靠性、性能及兼容性方面,能够满足各类应用场景需求,也让元脑服务器成为用户在智能化时代转型的坚实数字底座。
服务专线:028-85047200 18380340451
公司地址:成都市武侯区一环路南二段2号新世纪商业中心东楼17B
近日,北京恒赢智航科技有限公司在成都成功举办了以“拥抱大模型,提质民航生产力”为主题的2024年度用户大会。作为创新技术领军企业,浪潮计算机受邀参会。会上,浪潮计算机服务器产品部总经理闫家乐与恒赢智航副总裁万鹏签署战略合作协议,双方还联合发布了“大模型一体机”。
中新社重庆11月9日电 (梁钦卿)“量子计算是运用量子力学原理设计的,人工智能(AI)则是靠学习大量数据资源,量子计算作为一种新范式可解决AI资源消耗量大的难题。”欧洲科学院院士、欧洲人文和自然科学院外籍院士金石9日在重庆介绍,面向未来的计算领域,AI与量子计算相结合是重要分支,现在已有国家进行布局。
第三方调研机构赛迪顾问发布《2023中国数据要素流通市场研究报告》。结果显示,浪潮云跻身市场领导者象限,并在市场地位和发展能力方面位居TOP3。
浪潮信息服务器开机3秒智能控温技术,为数据中心运维人员解决了“服务器部署时启动时间过长,且风扇启动瞬间噪音过高,实现上电即开机,开机速度较业界平均速度最大提升1.2倍,助力业务快速上线,减少因为运维和维护造成的业务搁浅时间。
一个季度赚了123亿美元的英伟达,现在成了许多半导体企业艳羡的对象,大家头一回发现,原来GPU利润这么高,甚至能撑起2万亿美元的市值,但英伟达真的会满足于此吗?
NP3020G7是浪潮信息新一代入门级单路塔式服务器,专为远程办公环境、邮件以及打印服务等整体解决方案提供可靠的硬件基础。可根据客户实际应用环境,灵活扩展,满足客户不断变更的应用需求,应对不断变更的运行环境。
NP5570M5,浪潮信息全新一代中高端双路塔式服务器产品,具备出色性能、灵活扩展、稳定可靠等特性。
1U空间实现性能、密度、扩展性最大化设计,适用于虚拟化等多种计算密集型业务场景,提供丰富的存储矩阵,最大程度满足扩展性及网络均衡性需求,同时在1U机型首次导入风冷、冷板液冷、浸没液冷多维散热方案,满足更多高密数据中心低PUE诉求。
2U双路存储优化服务器,采用创新三层存储架构,在高存储密度、超强算力、高网络带宽、智能管理等方面得到大幅提高,适用于大数据、CDN、超融合、分布式存储等业务场景。
支持英特尔至强第四代/第五代可扩展处理器,在计算性能、存储性能及可扩展性方面均实现极致设计。支持前、后IO维护等多元部署方式,打破传统数据中心运维瓶颈。融合诸多业界先进技术,导入液冷、EVAC等高效散热模式。
兼顾高存储容量、强大计算性能和极致IO扩展能力,非常适用于温/冷数据存储、视频存储、大数据 存储、云存储池搭建等应用场景。
以强劲的计算性能,模块化的灵活设计,卓越的扩展性,更优的可靠性和安全特性,为客户数据密集型关键业务而优化
满足多核心、高主频、灵活扩展等要求,在1U空间内提供单处理器的峰值性能,是浪潮信息针对互联网、云计算、企业市场应用等需求推出的一款密集型、高性价比服务器
是浪潮信息为针对互联网、云计算、虚拟化、大数据等需求推出的一款机架式服务器
该产品以强劲的计算性能,完善的生态兼容,灵活百变的配置变换满足各行业应用配置需求,尤其适用于虚拟化、高性能计算、虚拟桌面等多种应用场景。
1U空间实现性能、密度、扩展性最大化设计,适用于高性能计算,虚拟化等多种计算密集型应用场景,满足高密数据中心部署。
浪潮信息NF5260M6是搭载第三代英特尔®至强®可扩展处理器的一款2U双路机架式服务器。采用创新前I/O架构,优化网络灵活模块化设计,模块深度拆解,PCIe资源高度灵活,满足不同客户的定制化需求。创新架构,适配各类互联网应用,是数据中心的理想之选。
高密度机架式存储服务器。
NF5270M6是浪潮信息一款中端2U服务器,以精简设计理念为小型虚拟化、数据库、办公OA系统等应用场景量身定做的服务器。
该产品以强劲的计算性能,完善的生态兼容,灵活百变的配置变换满足各行业应用配置需求,适用于数据分析处理、云、高性能计算等多种应用场景。