如何对比测试云服务器的性能?
深度云服务器性能对比:阿里云、腾讯云、华为云、Ucloud、天翼云全方位较量
在寻找最佳云服务器时,我们进行了详细的性能测试,涵盖与CPU、内存和硬盘速度相关的关键参数。
我们使用了lemonbench、Geekbench5、CPU-Z等权威工具。
所有测试均在统一设置下进行。
操作系统选择2核4G内存、5MB带宽(也测试了Windowsserver2019)。
他们在乌兰察布(天翼云选择了西安2,腾讯云选择了北京)。
需要注意的是,天翼云在内蒙古和贵州的业绩略低。
本文将指导您比较各个服务提供商的表现并分享具有成本效益的建议。
在CPU性能测试中,阿里云以319.1的高分拔得头筹。
其次是Ucloud,其得分高达904.4。
腾讯云以511.9分排名第三,华为云以726.5分稳居前列。
天翼云的CPU性能为711.1,相比其他厂商略显保守。
更详细的数据可以在这里获得。
在Unixbench测试中,腾讯云2530.8的成绩显示了其在多任务处理方面的优势,而华为云2229.7的成绩显示了其稳定的表现。
Ucloud和阿里云表现出色,得分分别为3094.7和1814.4。
天翼云的得分为2506.9,表明并发处理方面还有提升空间。
请参阅此处了解详细信息。
在内存速度方面,腾讯云以44.25GB/s的读写速度遥遥领先,而华为云则以521.97GB/s展现了高速性能。
Ucloud和阿里云的读写速度也相当可观,天翼云则稍显落后。
详情请参阅此处。
在硬盘速度测试中,华为云16.0MB/s的读写速度表现出色,Ucloud也表现出色。
阿里云和腾讯云的读写速度虽然稍慢,但仍在正常范围内。
天翼云的硬盘速度相对较慢,但选择适合自己业务需求的配置很重要。
请参阅此处了解更多数据。
从各项测试结果来看,Ucloud以其高性价比和优异的性能脱颖而出,而华为云和天翼云的性能略低。
阿里云虽然价格较贵,但由于其稳定性和长期的技术积累,值得信赖。
腾讯云因其实惠的价格和活动折扣而受到关注。
深入了解,可以参考以下链接:
便捷的VPS/云服务器:</了解更多内网渗透服务器:搭建个人博客深入解析:</实用指南Minecraft服务器:<//游戏服务器推荐UCloud评测:</专业评测Linux服务器测试:</技术分析
选择云服务器时,一定要根据自己的业务需求和预算来评估性能、价格和稳定性找到最适合您的云服务。
希望本文的对比分析能为您的决策提供有价值的参考。
阿里自研处理器商用-倚天
根据ARM自研处理器,不仅苹果M1系列取得了突破,中国厂商在这方面也取得了重大成就。
多达128个核心,现已商用。
阿里云近期发布了ECSg8m,这是阿里云第一个采用自研710CPU的实例。
主要针对通用计算、原生云、AndroidinCloud场景家族对阿里云算力的规范。
此外,阿里巴巴还提供了第三代Intel处理器的使用,网络和存储性能指标相比上一代ARM实例提升100%。
2021年10月,阿里巴巴旗下半导体公司平头哥发布了自主研发的亿天710云芯片。
该芯片是业界最强大的ARM服务器芯片,性能超过行业基准20%,能效提升50%以上。
亿天710是阿里云推进“一云多核”战略的一大步。
这也将是阿里巴巴首款诞生于云端、部署在阿里云数据中心的CPU芯片。
研天710采用最先进的5nm工艺,单芯片包含多达600亿个晶体管。
该芯片架构基于最新的ARMv9架构,包含128个CPU核心,最高主频高达3.2GHz,可以兼顾性能和功耗。
在内存和接口方面,融合业界领先的DDR5、PCIe5.0等技术,可以有效提升芯片的传输速率,适应不同的云应用。
处理器与AI芯片-阿里平头哥-NPU&RISC-V
在高性能处理器和AI芯片方面,阿里巴巴平头哥拥有玄铁处理器、含光人工智能芯片、御真RFIC系列、倚天处理器芯片、无剑SoC等产品。
本文根据阿里平头哥近年来在HotChips和ISCA上发表的报告和论文,总结了含光800NPU加速器和玄铁810处理器RISC-V硬件架构,用于学习和开发高性能处理器和AI芯片。
由于本人能力有限,如有错误或遗漏,敬请指正。
含光800芯片:含光芯片被称为古三剑之一,寓意着它的神秘和高性能。
其设计系统框图包括4核环形总线、命令处理器(CP)和PCIE4.0X16接口。
每个核心都有一个张量引擎(TE)、一个池化引擎(PE)和一个内存引擎(ME)。
该芯片采用192MB本地内存(LM),采用分布式共享模式,无需DDR内存。
张量引擎:固定权重+激活,通过W-buffer、A-buffer和组播进行数据复用,避免img2col()操作,集成CONV-BN-ResidualADD-ReLU操作,将CONV2D映射到张量引擎。
池化引擎:包括POOL、ROI、ROI_align2等池化单元以及用于插值、ROI_align1等操作的INTP单元,还具有用于缩放/偏移操作和数据格式化的缩放/偏差单元。
内存引擎:采用环形总线,支持嵌入式内存、重塑内存、PCIE和x-core、张量复制、矩阵转置、矩阵转权重和图像平滑等功能。
192MB片上SRAM:1个R/WSRAM模块,高密度,低功耗,2个W&A,每块16个模块,4个集群,分布式共享,4个核心各48MB,通过ME和环形总线执行跨核心的内存复制。
压缩和量化存储/处理:SparsityEngine可以使用位掩码解压缩,裁剪是可选的,量化计算和存储支持向量单元w/FP-24,INT-8/16中的矩阵计算,FP-24向量计算。
命令级工作流程:DNN模型通过SW:FE/编译器、模型网络、consts(scale、bias、qnt)和权重参数进行转换,SW:RT/driver、Cmd队列、NPUCore(Task0、Task1、Task2)执行命令工作流程在水平上。
特定领域指令集:类似CISC、运算融合、张量级粗粒度数据(HW分解和ctr)、通过指令中嵌入位实现3个引擎之间的同步、硬件依赖性检查。
可扩展任务映射:适用于中小型模型的数据并行、多个模型、层流流水线、模型并行、大型模型的混合并行、多芯片流水线到超大模型。
软件堆栈:Caafe、MXNet、TensorFlow、ONNX、编译器、网络转换、量化、优化、训练后编译、优化推理网络、应用推理运行、CPU:CPU运算符、MLK、CPU、NPU:NPU引擎运算符、运行状态、用户态驱动程序、内核态驱动程序、NPU。
玄铁910芯片:玄铁910芯片基于RISC-VRV64GCV架构,采用基于集群的多核架构。
每个集群有1/2/4个核心,32KB/64KBL1D$和32KB/64KBL,$64KBL。
12级乱序、3个解码器、8个释放、两期乱序内存访问、高性能混合分支处理、多模式动态数据预取。
向量引擎用于人工智能加速,兼容RISC-V规范增强,具有深度超标量无漂移,前端取8条指令/周期,解码3条指令/周期,第8条指令/周期,后端有无顺序内存访问、专用分支处理、乱序向量计算。
具有混合预测、混合多模式分支预测、分支方向预测的取指令单元,分支目标预测、返回地址预测、间接分支预测、高带宽并行读取、128位读取、最多8条指令的并行打包、指令缓存模式预测、循环加速。
未使用的加载存储设备的双发、未使用的双发、加载/存储地址管道、独立的存储数据管道、预测错误、快速完成加载/存储、使用3个周期、1个周期执行存储、强大的预取能力、多模式和多流、虚拟地址和物理地址预取、可配置的预取能力。
高效的多核连接、断开的处理器接口单元(PIUx)、MOESI一致性协议、基于目录的架构、支持探测过滤器、可配置的L2缓存,高达8MB,支持ECC。
AI优化矢量计算机,兼容RISC-V0.7.1矢量扩展,支持FP16/32/64、INT8/16/32/64、256位运算宽度、VL=128和2条流水线,每条2个128位矢量ALU周期操作,一个128位向量加载和一个每周期1个28位向量存储,直接访问L1$在向量加载和向量存储上,两个问题的乱序向量执行管道,每个集群超过300GFLOPSFP16计算能力(32FLOPS/核心/周期x2.5GHzx4核心),扩展到FP32使FP16的计算能力减半。
AISC实现,工艺技术为TSMC12nmFinFET,工作频率为2.0GHza~2.5GHzb,a.LVT6TTurboSTD电池,0.8VVDD,TT85oC,b.30%ULVT标准电池,1.0VVDD,TT85oC,每个核心区域(不包括L2))$):0.6mm2(无VEC)、0.8mm2(有VEC)。
总结:与谷歌、百度一样,阿里巴巴也研发了自己的云服务器芯片,并已广泛应用于阿里云和数据中心。
参考文献:HC32-2022:含光800:hc32.hotchips.org/asset...HC32-2020:玄铁910:hc32.hotchips.org/asset...ISCA-2020:玄铁910:ieeexplore.org.iee…