借助 NVIDIA 技术,用 AI 赋能 3D 内容生成

来源:NVIDIA英伟达企业解决方案 发布时间:2023-04-04 14:08:20 阅读量:276

KIRI Innovations 是一家面向全球市场的 AI 公司,致力于通过前沿技术赋能 3D 内容制作,降低 3D 内容生产的门槛。公司拥有 3D 重建引擎 KIRI Engine,通过手机拍照即可实现对物体的超写实 3D 建模。

KIRI Engine 生成的 3D 模型素材
拥有逼真的纹理材质信息


上线短短几个月的时间内,KIRI Engine 全球用户已突破 30 万人,且还在快速增长中,其中包括 Google、Roblox、EA、Epic Games、Meta 等元宇宙企业用户。用户通过 KIRI Engine App 或 KIRI Engine 网页端将围绕物体拍摄的照片上传至云端进行处理,就可以获得和现实物体一模一样的 3D 模型素材,再将这些逼真的 3D 模型素材应用在各种包括 VR 场景、3D 游戏、影视特效在内的 3D 内容制作中。

用户使用 KIRI Engine 生成的 3D 模型
出现在各种 3D 游戏、VR 场景,甚至影视作品中


KIRI Engine 的背后,是一套部署在云端的神经网络重建算法,能够通过多角度照片集或视频,对现实物体生成具有纹理材质信息和几何信息的超写实 3D 模型。这种重建算法的计算量非常巨大,使用传统解决方案意味着消耗大量的算力资源和成本。KIRI Engine 使用 NVIDIA GPU 在云端进行计算,一片 GPU 负责进行复杂的神经网络训练,另一片 GPU 则负责模型推理,将训练好的模型移至这片 GPU 主机上,通过输入新的数据来获得想要的结果,也会进行相对简单的图像处理和点云匹配计算任务,同时依靠 NVIDIA CUDA 进行加速,使得计算成本得以减少数百倍至每个模型几角钱。

KIRI Engine 的核心价值不仅在于用更低的成本为 3D 开发者提供 3D 重建工具,更在于通过快速增长的用户在云端积累海量 3D 数据集。随着 AI 带来的创作变革,AI 生成 3D 模型将会是下一个生成式 AI 的主战场,而高度标准化的 3D 数据集是 AI 生成 3D 模型的必要条件。在生成式 AI 全面到来的时代,KIRI 正在面对一个更大的市场和全新的挑战。

如何兼顾降低计算成本

与提升 3D 重建水平


传统的照片 3D 建模技术对 CPU 非常依赖,但 CPU 的硬件限制使得这种方法的成本过高,所以其应用领域主要是资金充裕的大型企业和政府项目。人们与信息的交互方式正在因 VR/XR 的技术突破而经历从 2D 向 3D,和从信息互联到空间互联的范式转移。这种范式转移将极大带动市场对 3D 内容的需求,显然过去高成本的 3D 建模技术无法适应市场的变化。因此,需要探索一种新的计算方式,在满足不断增加的 3D 重建需求的同时,还要颠覆性地降低计算成本。

 three.js 脚本在 Github 的周下载量


three.js 脚本作为制作 3D 内容必不可少的工具之一,其下载量趋势能侧面反映出全球 3D 内容的增长趋势;而从表中可以看出 three.js 脚本在 Github 的周下载量在一年的时间内翻了一倍,以此足以看出 3D 化的范式转移在以惊人的速度渗透人们的交互方式。

在算法层面,KIRI 开创性地使用了神经网络和视觉算法混合计算的方法。这样的优势在于神经网络重建能够更好地还原一些无法被视觉算法重建的物体,例如高度反光或透明的物体,但对于特征点足够多的物体,视觉算法能够捕捉到更多的表面细节。

因为神经网络的加入,使用 GPU 是必然的选择,因此使用 CPU+GPU 异构计算,尽管拥有 CPU+GPU 的服务器价格大概会是同级别的 CPU 价格的 2 倍,但计算时间可以大概节约 11 倍。(用机器学习进行 3D 模型的纹理贴图计算,CPU 需耗时 1600 秒,但 GPU 只需 130 秒。)

同时对 3D 重建任务进行 CUDA 加速并加入扩/缩容机制 。在计算任务少的时候只使用单台 GPU 确保运行稳定,计算任务一旦开始变多,云架构能够自动扩容,最多使用数十台服务器并行运算。这样一来,通过 CUDA 加速的神经网络算法能够在大幅度降低单次运行的时间成本,而扩/缩容机制在确保用户体验的同时避免资源浪费。

NVIDIA 为 KIRI 提供高效稳定算力支持


基于以上考量,KIRI 选择 NVIDIA 的产品生态来提供支持。因为 NVIDIA 产品生态的多样性能够满足全部技术需求,且提供高效稳定的算力支持。

NVIDIA CUDA通过 CUDA 进行计算加速是 KIRI Engine 得以高效且低成本运行的重要原因之一。在传统纯 CPU 运行环境里,哪怕是运行最简单的 3D 重建算法也需要花费 20-60 分钟的时间。而通过 CUDA 加速后,KIRI 目前的重建算法只需要 5 分钟。(甚至 KIRI 正在努力尝试达到 25 秒内生成 3D 模型的加速。)

NVIDIA GPU: KIRI 使用 NVIDIA GPU 来进行神经网络模型的训练。神经辐射场重建模型往往需要数个小时才能完成训练,但通过 GPU 与 CUDA 的配合,再加上 KIRI 对算法的优化,目前在 KIRI Engine 上完成神经辐射场模型训练只需要 25 分钟。( KIRI 也在努力对架构和算法进行优化,力争两个月内能够将神经网络模型的训练缩减到 5 分钟以内。)

  网站地图
沪ICP备19040636号-1
Catfish(鲶鱼) Blog V 4.7.3