麦克豌豆 MacPea.com
没有结果
查看所有结果
  • 登录
  • 首页
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐

    经典射击游戏反恐精英CS 1.6正式登陆Mac平台

    通过这款 Apple Arcade 新游戏,在 Vision Pro 上走进《Jeopardy!》的世界

    苹果Arcade九月阵容:NFL橄榄球、危险边缘与热门游戏更新齐登场

    苹果Arcade新增四款游戏 包括《培乐多彩泥世界》

    苹果新闻+推出全新「表情猜词游戏」 支持iOS 18.4及以上系统

    评测:明基GP520投影仪为Apple TV 4K打造Vision Pro级影院体验,游戏娱乐更出众

    热门标签

    • Mac游戏
    • NBA 2K25 for Mac
    • Easy Red 2 for Mac
  • Mac教程
  • macOS下载
  • Mac产品库
  • 麦壳软件
会员计划
现在订阅
  • 首页
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐

    经典射击游戏反恐精英CS 1.6正式登陆Mac平台

    通过这款 Apple Arcade 新游戏,在 Vision Pro 上走进《Jeopardy!》的世界

    苹果Arcade九月阵容:NFL橄榄球、危险边缘与热门游戏更新齐登场

    苹果Arcade新增四款游戏 包括《培乐多彩泥世界》

    苹果新闻+推出全新「表情猜词游戏」 支持iOS 18.4及以上系统

    评测:明基GP520投影仪为Apple TV 4K打造Vision Pro级影院体验,游戏娱乐更出众

    热门标签

    • Mac游戏
    • NBA 2K25 for Mac
    • Easy Red 2 for Mac
  • Mac教程
  • macOS下载
  • Mac产品库
  • 麦壳软件
没有结果
查看所有结果
麦克豌豆 MacPea.com
没有结果
查看所有结果
Home 苹果新闻

苹果新AI模型:单张图片就能重建带真实光影的3D物体

pony的头像 由 pony
2026年3月17日
在 苹果新闻
阅读时间:1 分钟阅读
A A
0

苹果的研究团队开发了一款AI模型,只需要一张图片,就能重建出3D物体,而且从不同角度看的时候,反射、高光这些光影效果都能保持一致。下面是具体情况。

你可能喜欢

苹果这个月已经连发8款新品了

《人生切割术》第三季开拍时间有新消息,还预告了新角色加入

iOS 26 新版电话应用有个功能,我现在完全离不开它了

先简单聊聊背景

虽然机器学习里的“潜在空间”这个概念不算新鲜,但近几年随着基于Transformer的AI模型爆发,再加上最近的世界模型火起来,它变得比以往任何时候都更受关注。

简单来说(稍微牺牲一点严谨度,好让大家更容易懂),所谓“潜在空间”或者“嵌入空间”,其实就是把信息做两件事:

  1. 把各种信息浓缩成数字表示,代表它们的核心概念;
  2. 把这些数字放到一个多维空间里,这样就能算出它们在各个维度上的距离。

如果还是觉得有点抽象,可以想想那个经典例子:把“king”这个词的数学表示减去“man”的表示,再加上“woman”的表示,结果就会落到“queen”这个词所在的大致区域。

实际用起来,把信息存成潜在空间的数学表示,能让计算距离和预测生成内容的概率变得更快、更省算力。

这里有个短视频用另一种比喻解释潜在空间,大家可以看看:

上面例子主要是讲文本怎么存进潜在空间,但这个思路其实能用在很多其他类型的数据上。这就引到了苹果的这项研究。

LiTo:表面光场分词化

苹果最新这项研究叫《LiTo: Surface Light Field Tokenization》,研究人员提出了一种3D潜在表示方法,“同时建模物体的几何形状和与视角相关的外观”。

换句话说,他们找到了一种方式,在潜在空间里不光记录怎么重建3D物体,还记录光线跟物体交互后,从不同角度看过去应该是什么样子。

他们自己是这么描述的:

之前大多数工作要么专注重建3D几何,要么只预测与视角无关的漫反射外观,因此很难捕捉到真实的视角相关效果。我们这个方法利用了RGB-D图像其实就是表面光场的采样点。通过把表面光场的随机子样本编码成一组紧凑的潜在向量,我们的模型学会在同一个3D潜在空间里同时表示几何和外观。这种表示能很好地重现镜面高光、菲涅尔反射等视角相关的复杂光照效果。

更厉害的是,他们把模型训练到只需要单张图片就能做到这些,而不是像传统方法那样需要多角度照片才能重建3D。

虽然整个技术细节很复杂,论文里写得很细,但核心思路其实挺直白,只要搞懂潜在空间怎么回事就明白了:

  • 先用编码器把物体信息压缩成潜在空间里一个很紧凑的表示。它不会记住每个细节,而是学会用简洁的数学描述物体的形状和表面怎么跟光互动。
  • 然后解码器反过来操作,从这个压缩表示里重建出完整的3D物体,包括不同视角下反射、高光这些光影应该长什么样。

怎么训练LiTo

训练的时候,研究人员选了几千个物体,每个物体渲染了150个不同视角、3种光照条件。

然后系统并没有把所有数据一股脑喂给模型,而是每次随机挑一小部分样本,把它们压缩成潜在表示。

解码器就从这一小部分数据里学着重建完整的物体,以及不同角度和光照下的外观。

训练过程中,模型逐渐学会了既抓住物体的几何结构,又记住外观怎么随着视角变化。

之后他们又单独训练了一个模型,专门负责看单张图片就能预测出对应的潜在表示。接着解码器就能根据这个表示重建出完整的3D物体,包括视角改变时光影的相应变化。

下面是苹果项目页面上放的LiTo跟另一个叫TRELLIS的模型的重建对比:

建议去项目页面看看,那里有LiTo和TRELLIS的并排互动对比,跟这篇文章的首图是一样的。

想看完整论文的话,可以点这个链接。

pony的头像

pony

有钱人终成眷属。

相关文章

苹果新闻

苹果这个月已经连发8款新品了

2026年3月17日
100
苹果新闻

《人生切割术》第三季开拍时间有新消息,还预告了新角色加入

2026年3月17日
100
苹果新闻

iOS 26 新版电话应用有个功能,我现在完全离不开它了

2026年3月17日
100
苹果新闻

WhatsApp 正在测试「访客聊天」功能:没账号也能聊

2026年3月17日
100
苹果新闻

Mimms博物馆将推出沉浸式展览,庆祝苹果公司50周年

2026年3月17日
100
苹果新闻

AirPods Max 2:这四点其实一点都没变

2026年3月17日
100
请登录 加入讨论

推荐文章

重磅!HBO Max与Paramount+即将合并成超级流媒体平台

2026年3月3日
101

扎克伯格亲口爆料:我曾主动找库克商讨“保护青少年和儿童身心健康”

2026年2月20日
100

《F1》拿下奥斯卡最佳音效奖,苹果时隔三年再获小金人

2026年3月16日
100

首款MacBook Neo预订爆单!“腮红粉”基础款已直接延期到发售后

2026年3月6日
100

热门文章

  • 全新 iPhone Air 与 iPhone 17 Pro 壁纸下载 [更新:iPhone 17]

    0 分享
    分享 0 Tweet 0
  • iOS 26 全新图标一览:所有应用在 iPhone 主屏幕上的新面貌

    0 分享
    分享 0 Tweet 0
  • 2026年iPad路线图:各款新机型发布时间预测

    0 分享
    分享 0 Tweet 0
  • CorelDRAW 2025 26.1.0.143 for Mac 深度评测:专业设计的新标杆

    0 分享
    分享 0 Tweet 0
  • 体验田园诗意生活:在 Mac 上开启你的《星露谷物语》之旅

    0 分享
    分享 0 Tweet 0

近期文章

  • 苹果新AI模型:单张图片就能重建带真实光影的3D物体 2026年3月17日
  • 苹果这个月已经连发8款新品了 2026年3月17日
  • 《人生切割术》第三季开拍时间有新消息,还预告了新角色加入 2026年3月17日

分类

  • Mac产品库
  • Mac游戏推荐
  • Mac软件推荐
  • 苹果新闻

订阅网站内容

订阅网站内容以便第一时间阅读你感兴趣的内容

订阅即表示同意我们的服务条款和隐私政策。

© 2025 麦克豌豆 MacPea.com - 湘ICP备18009176号 | 友情链接

欢迎回来!

在下面登录您的帐户

忘记密码?

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录
没有结果
查看所有结果
  • 首页
  • 订阅
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐
  • Mac教程
  • macOS下载
  • Mac产品库

© 2025 麦克豌豆 MacPea.com - 湘ICP备18009176号 | 友情链接