苹果发布惊艳开源模型，秒速将2D照片转为3D视图

这款名为SHARP的模型，可在一秒内从单张图片重建逼真3D场景。以下为示例展示。

你可能喜欢

Molly Anderson揭秘：神奇公式让MacBook Neo用料直接砍半！

iOS 26 信息app搜索功能大升级！自然语言+智能关联结果太强了

MacBook Neo能否完美运行Parallels？官方最新回应：目前还不确定！

SHARP模型表现卓越

苹果发表了研究《一秒内的单目视图合成》，详述了如何训练模型从单张2D图像重建3D场景，并确保距离与比例符合真实世界。

苹果研究人员如此介绍该研究：

我们提出SHARP，一种从单张图像合成逼真视图的方法。给定一张照片，SHARP能回归出场景的3D高斯表示参数，通过神经网络单次前向传播，在标准GPU上不到一秒即可完成。生成的3D高斯表示可实时渲染，为邻近视角提供高分辨率逼真图像。该表示具备度量特性，支持绝对比例和度量相机运动。实验显示，SHARP在跨数据集上实现强大零样本泛化能力。在多个数据集上刷新纪录，较之前最佳模型，LPIPS降低25-34%，DISTS降低21-43%，合成时间缩短三个数量级。

简言之，模型预测场景的3D表示，支持从邻近视角渲染。