笔记转载自:“H3C ICT知识百科

什么是Scale-up和Scale-out?

Scale-Up和Scale-Out是用于扩展服务器系统资源,解决系统性能瓶颈的两种主要策略。这两种扩展策略在智慧计算场景中得到广泛应用,本文主要讲解它们在服务器中的应用方法和特点。

为什么需要Scale-Up和Scale-Out扩展策略?

随着信息技术的迅猛发展,企业面临的数据量和处理需求不断增加。目前主流的AI大模型的参数量高达数千亿个,训练这些大模型至少需要几百甚至几千GB显存。而当下最高性能的GPU卡,单卡支持的最高显存只有80GB,此时需要数十张高端GPU卡才能训练AI大模型,一般服务器无法安装这么多GPU卡。传统的服务器架构已无法满足现代业务的高算力需求。服务器扩展策略的产生正是为了应对这些挑战。

服务器扩展策略包括Scale-Up和Scale-Out两种:Scale-Up是纵向扩展策略,即通过增加单个节点的资源(如CPU、GPU、内存)来提升性能;而Scale-Out则是横向扩展策略,即通过增加更多的节点来分散负载和提升处理能力。Scale-Up和Scale-Out通过不同的方式解决了这些问题,这两种策略的灵活性和适应性,使得企业能够根据实际需求进行资源配置,从而优化成本和性能。
Scale-Up和Scale-Out示意图

Scale-Up(纵向扩展)和Scale-Out(横向扩展)

关于scale-up、scale-out的技术介绍、应用案例、应用限制、特性对比和混合架构请参见:“H3C ICT知识百科

Logo

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐