定制化服务器、定制化GPU服务、云桌面等;分享3D数字化技术应用经验:3D设计,3D有限元分析模拟仿真,3D工艺,3D产品数据和生命周期管理PLM,3D数控编程CAM,3D质检,3D数字化生产工艺仿真和数字孪生,3D营销动画和售后维护,3D图形工作站和3D云工作站等

实用干货:各种存储性能瓶颈场景下的分析和优化

 2023-07-11 11:22:10   74

本文结合实践剖析存储系统的架构及运行原理,深入分析各种存储性能瓶颈场景,并提出相应的性能优化手段,希望对同行有借鉴和参考价值。

GPU微架构及生态研究框架(2023)

 2023-07-10 13:05:14   95

​GPU的核心竞争力在于架构等因素决定的性能先进性和计算生态壁垒。国内GPU厂商纷纷大力投入研发快速迭代架构,推动产业开放构建自主生态,加速追赶全球头部企业。国产替代需求持续释放叠加国际局势不确定性加剧,AI&数据中心、智能汽车、游戏等GPU需求有望高增,国产GPU迎来发展黄金期,我们看好国产GPU公司的发展与投资机遇。 GPU的核心竞争力在于架构等因素决定的性能先进性和计算生态壁垒。国内GPU厂商纷纷大力投入研发快速迭代架构,推动产业开放构建自主生态,加速追赶全球头部企业。国产替代需求持续释放叠加国际局势不确定性加剧,AI&数据中心、智能汽车、游戏等GPU需求有望高增,国产GPU迎来发展黄金期,我们看好国产GPU公司的发展与投资机遇。 第一,我们从性能和生态2个维度构建了GPU完整的研究体系。1)性能:决定GPU是否“高效”,其中微架构/制程是影响GPU性能的核心要素。2)生态:CUDA构筑通用计算坚固壁垒。 第二,提出在评估GPU性能的指标的重要性上:微架构、制程、流处理器数量、核心频率对GPU性能影响较大。我们详细梳理了GPU的微架构、制程、显存容量/位宽/带宽/频率、核心频率等各类性能参数及重要性程度,并利用“核心数*核心频率*2”公式对性能算力进行量化,揭示可用3DMark、MLPerf 等GPU软件跑分进行相关性能测试评估。 第三,详细拆解了NVIDIA Fermi和Hopper两大典型微架构的具体硬件实现,在顶点处理、光栅化计算、纹理贴图、像素处...

GPU 构成和工作原理 - 简介

 2023-07-07 15:59:27   82

GPU 传统上是用于 graphic 的,但由于其适合并行计算的构造,近几年被越来越多地运用到深度学习和人工智能领域,刮起了一阵猪都能飞的风。尤其是最近国外 AIGC 的技术突破,让 GPU 再次成为一个关注的焦点。 所谓“适合并行计算”,应该是相对传统的 CPU 而言的。要论单个计算单元的能力,CPU 的 ALU(算术逻辑)和 FPU(浮点运算)是要强于 GPU 的:

为什么需要专门出现GPU处理图形工作?

 2023-07-07 14:38:17   94

GPU 加速计算可以提供非凡的应用程序性能,能将应用程序计算密集部分的工作负载转移到 GPU,同时仍由 CPU 运行其余程序代码。

以GPU为中心的数据包处理,如何克服DPDK限制?

 2023-07-05 11:23:02   107

本文解释了新的 NVIDIA DOCA GPUNetIO 库如何克服以前 DPDK 解决方案中的一些限制,向以 GPU 为中心的数据包处理应用程序迈进了一步。

Fujitsu、NVIDIA、AMD和Intel 高性能处理器架构分析

 2023-06-30 10:13:35   111

​本文主要分析和探讨国际上面向 E 级计算的先进高性能处理器的核心运算架构,包括 Fujitsu A64FX、NVIDIA H100、AMD MI250X 和 Intel PonteVecchio 4款高性能处理器,着重关注运算资源组织结构、数据和指令级并行方式、领域专用加速结构 DSA、支持数据类型和算力等方面,并总结和展望主流高性能处理器的运算架构研究发展现状和趋势,以期为国内自主研发面向后 E 级计算的高性能处理器提供技术参考和借鉴。 商用高性能计算处理器市场主要被NVIDIA、AMD和Intel3家公司长期占据,在面向E级计算 的 高 性 能 处 理 器 中,AMD 最 新 的Instinct MI250X处理器双精度浮点运算能力已经高达95.7TFlops,NVIDIA和Intel最新发布的高性能处理器峰值性能也均达到了数十 TFlops。 本文主要分析和探讨国际上面向 E 级计算的先进高性能处理器的核心运算架构,包括 Fujitsu A64FX、NVIDIA H100、AMD MI250X 和 Intel PonteVecchio 4款高性能处理器,着重关注运算资源组织结构、数据和指令级并行方式、领域专用加速结构 DSA、支持数据类型和算力等方面,并总结和展望主流高性能处理器的运算架构研究发展现状和趋势,以期为国内自主研发面向后 E 级计算的高性能处理器提供技术参考和借鉴。 本文选自“面向E级计算的高性能处理器核心运算架构研究进展”。 自治故障管理系统推理规则的智能学习技术 基于监督学习的稀疏矩阵自动任务分配 基于某国产...

Linux软RAID和LVM卷管理

 2023-06-29 12:09:19   105

目前Linux系统中主流的是Ext(2/3/4)类型的文件系统,Ext文件系统主要由Super Block(超级块)、Inode表、Data block(数据块)组成。 而目前文件系统都比较大,如果将所有的Inode和Block放置在一起很不明智,这样数量都太庞大,而且不易管理。故Ext文件系统在格式化的时候都是区分为多个块组(Block Group),每个块组有独立的Inode/ Block/ Superblock。就像当兵一样,一个师里面有很多旅组成。

揭秘ChatGPT背后的“AI民工”:枯燥重复、按件计酬,时薪低至1美元

 2023-06-28 12:01:37   77

1、人工智能通过在大量数据中寻找模式来学习,但首先这些数据必须由人类进行分类和标记,数据注释员由此应然而生,他们被视为隐藏在机器背后的“幽灵劳工”。 2、注释员们的工作枯燥而乏味,经常需要做重复性的工作,按件计酬,平均时薪在5到10美元(约合人民币36到72元)之间。到今年年初,部分注释员的时薪已经降到了每小时1到3美元(约合人民币7到22元)。 3、注释工作依然是人工智能的基础,它已经形成了完整的供应链。这类工作将在很长时间内继续存在。 4、注释工作与智能手机、汽车制造不同的地方在于,它有易变形和流动性,经常会流向运营成本更低的地方。

给加速器加速:科学家使用 GPU 与 AI 为欧洲核子研究中心高性能计算提速

 2023-06-27 10:07:42   81

Maria Girone 认为 GPU 驱动的机器学习将在未来帮助物理学家开展科学研究。自 2002 年以来,这位粒子物理学博士一直在一个覆盖 40 多个国家、170 个站点的系统网格上工作。该系统支持欧洲核子研究中心 (CERN) 的大型强子对撞机(LHC)并将进行一次重大升级。

十大国产GPU产品及规格概述

 2023-06-26 11:57:20   149

国产GPU 持续发力,对标行业龙头缩小差距。GPU 有两条主要的发展路线:分别为传统的 2D/3D 图形渲染 GPU 和专注高性能计算的 GP GPU。 近年来,国产GPU 厂商在图形渲染 GPU 和高性能计算 GPGPU 领域上均推出了较为成熟的产品,在性能上不断追赶行业主流产品,在特定领域达到业界一流水平。生态方面国产厂商大多兼容英伟达 CUDA,融入大生态进而实现客户端导入。

  网站地图
沪ICP备19040636号-1
Catfish(鲶鱼) Blog V 4.7.3