什么是 NeRF?

神经辐射场(NeRF)是一种神经网络,可以从部分二维图像中重建复杂的三维场景。各种模拟、游戏、媒体和物联网(IoT)应用程序都需要三维图像,以使数字交互更加逼真和准确。NeRF 可学习特定场景的几何形状、物体和角度。然后,它可以从新的视角呈现逼真的三维视图,自动生成合成数据以填补空白。

了解神经网络

了解物联网

神经辐射场有哪些使用案例?

NeRF 可以渲染复杂的场景并为各种应用场景生成图像。

计算机绘图和动画

在计算机绘图过程中,可以使用 NeRF 创建逼真的视觉效果、模拟和场景。NeRF 捕获、渲染和投影逼真的环境、角色和其他图像。NeRF 通常用于改善视频游戏画面和 VX 电影动画。

医学成像

NeRF 有助于通过 2D 扫描(例如 MRI)创建全面的解剖结构。其技术可以重建人体组织和器官的逼真表现,为医生和医疗技术人员提供有用的视觉环境。 

虚拟现实

NeRF 是虚拟现实和增强现实模拟中的一项重要技术。由于它们可以精确地建模 3D 场景,因此有助于创建和探索逼真的虚拟环境。根据您的观看方向,NeRF 可以显示新的视觉信息,甚至可以在真实空间中渲染虚拟物体。

卫星图像和规划

卫星图像提供了一系列图像,NeRF 可以使用这些图像来生成地球表面的总和模型。它对于需要对现实世界环境进行数字化的现实捕获(RC)应用场景非常有用,您可以将空间位置数据转换为非常详细的 3D 模型。例如,将航空影像重建为景观渲染常常用于城市规划,因为它可针对区域真实布局提供有用的参考。 

下图为 3D 建筑模型示例。

 

神经辐射场的工作原理是?

通过各种数字图形技术创建的计算机渲染 3D 图像具有几个不同的属性,这些属性定义了它们的质量和真实感。例如:

  • 几何方面,例如场景中 3D 模型的定位、方向和比例
  • 照明方面,例如阴影、亮度、颜色和反射 
  • 透明和半透明显示光线如何穿过玻璃或雾等材料
  • 体积和密度,例如烟或云的密度
  • 模拟布料、木材或金属等材质的纹理

颜色的选择及其分布在图像的视觉冲击中也起着关键作用。阴影决定了不同表面区域的照明方式,从而营造出一种深度和形式感。

NeRF 将计算机绘图技术与神经网络架构相结合,以实现上述所有要求。 

下图是计算机渲染 3D 图像的示例。

神经辐射场的架构

NeRF 使用多层感知(MLP)(一种完全连接的神经网络架构)来创建 3D 场景的表现形式。MLP 是神经网络和深度学习的基础模型。它经过训练,可以将空间坐标和视野方向映射到颜色和密度值。MLP 使用一系列数学结构来组织输入(例如 3D 空间中的位置或 2D 视图方向)来确定 3D 图像中每个点的颜色和密度值。 

该网络还学习如何改变场景中光线的亮度和颜色。通过加深对这些光线(即辐射建模)的理解,它可以从不同的角度显示不同的颜色和密度。 

了解深度学习

神经辐射场的类型

早期版本的 NeRF 很难优化,速度也很慢,而且它们需要通过照片输入来匹配使用相同相机光线的照明。从那以后,在最初的技术基础上又有了一些改进。

PixelNeRF

NeRF 最早的新形式之一是 PixelNeRF(CPVR 2021)。这种部署引入了一个完全卷积的架构,可以根据单个图像输入进行调整。这种方法消除了对许多经校准和有组织视图的需求,并减少了所需的总计算资源。这种新方法简化了创建和优化 NeRF 的过程。

Mega-NeRD

Mega-NeRD(CVPR 2022)是另一个 NeRF 框架,在处理大型场景时特别有用。它提供了另一种几何聚类算法和稀疏网络结构,使其能够处理不同光照条件下的图像。这种经过优化的 NeRF 使用稀疏神经辐射网格(SNeRG)来有效地捕捉和渲染现实环境。

NSVF

神经稀疏体素场(NSVF)是一种 NeRF,可以在其渲染阶段跳过任何空像素,从而提高渲染速度。该技术可以学习网络单元中的像素结构,使其无需特定的视角即可创建高质量图像。

Plenoptic Voxel

Plenoptic Voxel(2021)的创新没有使用多层感知神经网络,而是使用了稀疏的 3D 网格。使用此网格,您可以提高新模拟的渲染速度,同时通过立体像素插值保持视觉保真度。

神经辐射场如何渲染图像?

神经渲染是指由 NeRF 创建图像的过程。NeRF 使用各种技术将原始数据转换为详细的 3D 表现形式。

图形渲染

计算机绘图领域的渲染技术使得 NeRF 模型能够以几何方式投影和操纵场景。例如:

  • 射线投射模拟用户的视角来计算物体的可见性 
  • 光线追踪通过模拟光的物理行为(包括反射、折射和阴影)对这一概念进行了扩展
  • 光栅化将 3D 矢量信息转换为 2D 屏幕上的像素,采用各种算法来高效模拟照明和质感效果

体绘制

体绘制是另一种必不可少的策略。算法确定 3D 空间或图像中每个像素的红、绿、蓝和 Alpha(体积密度)值。这些数字映射到它们在 2D 图像中的相应位置。

另一种技术是视图合成,其操作方式与体绘制相反。该技术根据一系列 2D 图像构造 3D 视图。视图合成创建一个半球状布局,使用从不同角度拍摄的一系列图像来表示物体。此过程将每张 2D 图像拟合到物体周围的相应位置,并以 3D 形式对其进行重建。

AWS 如何为您的神经辐射场要求提供支持?

Amazon Web Services(AWS)提供两项服务来支持您的 NeRF 要求。

AWS RoboMaker 是基于云的模拟服务,您可在不管理任何基础设施的情况下运行、扩展和自动化模拟。AWS RoboMaker 通过提供模拟世界和各种 3D 资产,使模拟环境的构建变得更快、更经济。您可以使用这些模拟资产来构建模拟环境,以匹配所需的保真度。使用 AWS RoboMaker WorldForge,您可以在几分钟内生成数百个用户定义的、不同的 3D 室内住宅模拟世界。

AWS IoT TwinMaker 是一项服务,可创建建筑、工厂、工业设备和生产线等真实系统的数字孪生。它能够使用来自多个来源的现有数据,能够创建任何物理环境的虚拟表现,并能将现有 3D 模型与真实数据相结合。借助 AWS IoT TwinMaker,您可以利用数字孪生更快、更轻松地创建全局运营。

立即创建账户,开始在 AWS 上使用神经辐射场。

AWS 上的后续步骤

查看其他与产品相关的资源
使用最全面的 AI 和 ML 服务集更快地创新 
注册免费账户

立即享受 AWS 免费套餐。

注册 
开始在控制台中构建

在 AWS 管理控制台中开始构建。

登录