定制化服务器、定制化GPU服务、云桌面等;分享3D数字化技术应用经验:3D设计,3D有限元分析模拟仿真,3D工艺,3D产品数据和生命周期管理PLM,3D数控编程CAM,3D质检,3D数字化生产工艺仿真和数字孪生,3D营销动画和售后维护,3D图形工作站和3D云工作站等

GPU巨头,拼什么?

 2023-07-14 12:39:54   205

在 GPU 领域,2022 年无论好坏都是一个重要的里程碑。英特尔兑现了重新进入独立显卡市场的承诺,Nvidia将显卡尺寸和价格推向了顶峰,AMD将 CPU 技术带入了显卡领域。

GPU 虚拟化 [二]

 2023-07-13 11:27:55   171

上文介绍的基于 SR-IOV 硬件虚拟化技术的 GPU,VF 的数量比较固定,且每个 VF 获得的资源是均分的、定额的。将这些 VF 透传给虚拟机后,由于各个虚机的 workload 不同,就可能出现某些 VF 的资源不够用,而另一些 VF 的资源用不完的情况。

GPU 虚拟化 [一]

 2023-07-12 16:54:20   290

对于 GPU 这样的高速 PCIe 设备,虽然也可以借助 virtio 的方式来实现 guest VM 对 GPU 资源的共享,但因为需要 hypervisor 参与 emulation,效率不高。性能更佳的方案是将物理 GPU 以整体或部分的形式,“透传”给 VM。

实用干货:各种存储性能瓶颈场景下的分析和优化

 2023-07-11 11:22:10   159

本文结合实践剖析存储系统的架构及运行原理,深入分析各种存储性能瓶颈场景,并提出相应的性能优化手段,希望对同行有借鉴和参考价值。

GPU微架构及生态研究框架(2023)

 2023-07-10 13:05:14   229

​GPU的核心竞争力在于架构等因素决定的性能先进性和计算生态壁垒。国内GPU厂商纷纷大力投入研发快速迭代架构,推动产业开放构建自主生态,加速追赶全球头部企业。国产替代需求持续释放叠加国际局势不确定性加剧,AI&数据中心、智能汽车、游戏等GPU需求有望高增,国产GPU迎来发展黄金期,我们看好国产GPU公司的发展与投资机遇。 GPU的核心竞争力在于架构等因素决定的性能先进性和计算生态壁垒。国内GPU厂商纷纷大力投入研发快速迭代架构,推动产业开放构建自主生态,加速追赶全球头部企业。国产替代需求持续释放叠加国际局势不确定性加剧,AI&数据中心、智能汽车、游戏等GPU需求有望高增,国产GPU迎来发展黄金期,我们看好国产GPU公司的发展与投资机遇。 第一,我们从性能和生态2个维度构建了GPU完整的研究体系。1)性能:决定GPU是否“高效”,其中微架构/制程是影响GPU性能的核心要素。2)生态:CUDA构筑通用计算坚固壁垒。 第二,提出在评估GPU性能的指标的重要性上:微架构、制程、流处理器数量、核心频率对GPU性能影响较大。我们详细梳理了GPU的微架构、制程、显存容量/位宽/带宽/频率、核心频率等各类性能参数及重要性程度,并利用“核心数*核心频率*2”公式对性能算力进行量化,揭示可用3DMark、MLPerf 等GPU软件跑分进行相关性能测试评估。 第三,详细拆解了NVIDIA Fermi和Hopper两大典型微架构的具体硬件实现,在顶点处理、光栅化计算、纹理贴图、像素处...

GPU 构成和工作原理 - 简介

 2023-07-07 15:59:27   237

GPU 传统上是用于 graphic 的,但由于其适合并行计算的构造,近几年被越来越多地运用到深度学习和人工智能领域,刮起了一阵猪都能飞的风。尤其是最近国外 AIGC 的技术突破,让 GPU 再次成为一个关注的焦点。 所谓“适合并行计算”,应该是相对传统的 CPU 而言的。要论单个计算单元的能力,CPU 的 ALU(算术逻辑)和 FPU(浮点运算)是要强于 GPU 的:

为什么需要专门出现GPU处理图形工作?

 2023-07-07 14:38:17   182

GPU 加速计算可以提供非凡的应用程序性能,能将应用程序计算密集部分的工作负载转移到 GPU,同时仍由 CPU 运行其余程序代码。

以GPU为中心的数据包处理,如何克服DPDK限制?

 2023-07-05 11:23:02   259

本文解释了新的 NVIDIA DOCA GPUNetIO 库如何克服以前 DPDK 解决方案中的一些限制,向以 GPU 为中心的数据包处理应用程序迈进了一步。

Fujitsu、NVIDIA、AMD和Intel 高性能处理器架构分析

 2023-06-30 10:13:35   229

​本文主要分析和探讨国际上面向 E 级计算的先进高性能处理器的核心运算架构,包括 Fujitsu A64FX、NVIDIA H100、AMD MI250X 和 Intel PonteVecchio 4款高性能处理器,着重关注运算资源组织结构、数据和指令级并行方式、领域专用加速结构 DSA、支持数据类型和算力等方面,并总结和展望主流高性能处理器的运算架构研究发展现状和趋势,以期为国内自主研发面向后 E 级计算的高性能处理器提供技术参考和借鉴。 商用高性能计算处理器市场主要被NVIDIA、AMD和Intel3家公司长期占据,在面向E级计算 的 高 性 能 处 理 器 中,AMD 最 新 的Instinct MI250X处理器双精度浮点运算能力已经高达95.7TFlops,NVIDIA和Intel最新发布的高性能处理器峰值性能也均达到了数十 TFlops。 本文主要分析和探讨国际上面向 E 级计算的先进高性能处理器的核心运算架构,包括 Fujitsu A64FX、NVIDIA H100、AMD MI250X 和 Intel PonteVecchio 4款高性能处理器,着重关注运算资源组织结构、数据和指令级并行方式、领域专用加速结构 DSA、支持数据类型和算力等方面,并总结和展望主流高性能处理器的运算架构研究发展现状和趋势,以期为国内自主研发面向后 E 级计算的高性能处理器提供技术参考和借鉴。 本文选自“面向E级计算的高性能处理器核心运算架构研究进展”。 自治故障管理系统推理规则的智能学习技术 基于监督学习的稀疏矩阵自动任务分配 基于某国产...

Linux软RAID和LVM卷管理

 2023-06-29 12:09:19   204

目前Linux系统中主流的是Ext(2/3/4)类型的文件系统,Ext文件系统主要由Super Block(超级块)、Inode表、Data block(数据块)组成。 而目前文件系统都比较大,如果将所有的Inode和Block放置在一起很不明智,这样数量都太庞大,而且不易管理。故Ext文件系统在格式化的时候都是区分为多个块组(Block Group),每个块组有独立的Inode/ Block/ Superblock。就像当兵一样,一个师里面有很多旅组成。

  网站地图
沪ICP备19040636号-1
Catfish(鲶鱼) Blog V 4.7.3