麦克豌豆 MacPea.com
没有结果
查看所有结果
  • 登录
  • 首页
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐

    经典射击游戏反恐精英CS 1.6正式登陆Mac平台

    通过这款 Apple Arcade 新游戏,在 Vision Pro 上走进《Jeopardy!》的世界

    苹果Arcade九月阵容:NFL橄榄球、危险边缘与热门游戏更新齐登场

    苹果Arcade新增四款游戏 包括《培乐多彩泥世界》

    苹果新闻+推出全新「表情猜词游戏」 支持iOS 18.4及以上系统

    评测:明基GP520投影仪为Apple TV 4K打造Vision Pro级影院体验,游戏娱乐更出众

    热门标签

    • Mac游戏
    • NBA 2K25 for Mac
    • Easy Red 2 for Mac
  • Mac教程
  • macOS下载
  • Mac产品库
  • mac软件下载平台
    • Sketch破解版
    • 红警Mac版
    • IDEA 2026 破解版
    • Navicat Mac破解版
    • Final Cut Pro
    • Acrobat Pro Mac破解
    • SketchUp Mac破解
    • AutoCAD Mac破解
    • CorelDRAW Mac破解
    • Lightroom Mac破解
    • EndNote破解
    • Downie破解
    • AnyGo破解
    • iStat Menus破解
    • Tuxera NTFS破解
    • DaVinci Mac破解
    • prism mac破解
    • Rhino破解版
会员计划
现在订阅
  • 首页
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐

    经典射击游戏反恐精英CS 1.6正式登陆Mac平台

    通过这款 Apple Arcade 新游戏,在 Vision Pro 上走进《Jeopardy!》的世界

    苹果Arcade九月阵容:NFL橄榄球、危险边缘与热门游戏更新齐登场

    苹果Arcade新增四款游戏 包括《培乐多彩泥世界》

    苹果新闻+推出全新「表情猜词游戏」 支持iOS 18.4及以上系统

    评测:明基GP520投影仪为Apple TV 4K打造Vision Pro级影院体验,游戏娱乐更出众

    热门标签

    • Mac游戏
    • NBA 2K25 for Mac
    • Easy Red 2 for Mac
  • Mac教程
  • macOS下载
  • Mac产品库
  • mac软件下载平台
    • Sketch破解版
    • 红警Mac版
    • IDEA 2026 破解版
    • Navicat Mac破解版
    • Final Cut Pro
    • Acrobat Pro Mac破解
    • SketchUp Mac破解
    • AutoCAD Mac破解
    • CorelDRAW Mac破解
    • Lightroom Mac破解
    • EndNote破解
    • Downie破解
    • AnyGo破解
    • iStat Menus破解
    • Tuxera NTFS破解
    • DaVinci Mac破解
    • prism mac破解
    • Rhino破解版
没有结果
查看所有结果
麦克豌豆 MacPea.com
没有结果
查看所有结果
Home 苹果新闻

苹果打造出能看、能创造、能编辑图像的单一AI模型

pony的头像 由 pony
2025年12月22日
在 苹果新闻
阅读时间:1 分钟阅读
A A
0

基于先前名为UniGen的模型,苹果的一个研究团队正在展示UniGen 1.5,这是一个能在单一模型中处理图像理解、生成和编辑的系统。以下是详细信息。

你可能喜欢

独立应用推荐:「Cats Lock」这个好玩的 Mac 小工具,完美解决猫咪键盘乱敲问题

Apple Watch Series 12:目前我们知道的这些消息

怎么把个人信息从网上彻底删掉(为什么一刻都不能再等)

基于原版UniGen

去年五月,苹果的一个研究团队发表了一项名为《UniGen:用于统一多模态理解和生成的增强训练与测试时策略》的研究。

在那项工作中,他们引入了一个统一的多模态大语言模型,能够在单一系统中同时进行图像理解和图像生成,而不是为每个任务依赖单独的模型。

现在,苹果发布了这项研究的后续工作,论文标题为《UniGen-1.5:通过强化学习中的奖励统一增强图像生成和编辑》。

UniGen-1.5详解

这项新研究通过向模型添加图像编辑功能来扩展UniGen,仍然在单一统一框架内,而不是将理解、生成和编辑拆分到不同系统中。

在单一系统中统一这些功能具有挑战性,因为理解和生成图像需要不同的方法。然而,研究人员认为,统一模型可以利用其理解能力来提高生成性能。

据他们称,图像编辑的主要挑战之一是模型往往难以完全掌握复杂的编辑指令,尤其是当变化微妙或高度特定时。

为了解决这个问题,UniGen-1.5引入了一个新的训练后步骤,称为编辑指令对齐:

“此外,我们观察到,在监督微调后,模型由于对编辑指令的理解不足,在处理多样编辑场景时仍然不足。因此,我们提出编辑指令对齐作为一个轻量的后SFT阶段,以增强编辑指令与目标图像语义之间的对齐。具体来说,它以条件图像和指令作为输入,并通过文本描述优化预测目标图像的语义内容。实验结果表明,这个阶段对提升编辑性能非常有益。”

换句话说,在通过强化学习(通过奖励更好输出和惩罚更差输出来训练模型)要求模型改进其输出之前,研究人员首先训练模型根据原始图像和编辑指令推断出编辑后图像应包含的详细文本描述。

这个中间步骤帮助模型在生成最终图像之前更好地内化预期的编辑。

然后,研究人员以一种可以说是论文最重要贡献的方式使用强化学习:他们对图像生成和编辑使用相同的奖励系统,这以前是具有挑战性的,因为编辑范围可能从微小调整到完全转换。

因此,当在几个行业标准基准测试中评估模型遵循指令、保持视觉质量和处理复杂编辑的能力时,UniGen-1.5要么匹配要么超越了多个最先进的开源和专有多模态大语言模型:

通过上述努力,UniGen-1.5为推进统一MLLM的研究提供了更强的基线,并在图像理解、生成和编辑基准上建立了竞争性能。实验结果表明,UniGen-1.5在GenEval和DPG-Bench上分别获得0.89和86.83分,显著优于近期方法如BAGEL和BLIP3o。在图像编辑方面,UniGen-1.5在ImgEdit上获得4.31的总分,超越了近期开源模型如OminiGen2,并与专有模型如GPT-Image-1相当。

以下是UniGen-1.5的文本到图像生成和图像编辑功能的一些示例(遗憾的是,研究人员似乎错误地裁剪了第一张图中文本到图像部分的提示):


研究人员指出,UniGen-1.5在文本生成以及某些情况下的身份一致性方面存在困难:

图A展示了UniGen-1.5在文本到图像生成和图像编辑任务中的失败案例。在第一行,我们展示了UniGen-1.5未能准确渲染文本字符的实例,因为轻量级离散解标记器难以控制文本生成所需的细粒度结构细节。在第二行,我们展示了两个身份发生可见变化的示例,用圆圈突出显示,例如猫面部毛发纹理和形状的变化,以及鸟类羽毛颜色的差异。UniGen-1.5需要进一步改进以解决这些限制。

您可以在此处找到完整研究。

pony的头像

pony

有钱人终成眷属。

相关文章

苹果新闻

独立应用推荐:「Cats Lock」这个好玩的 Mac 小工具,完美解决猫咪键盘乱敲问题

2026年5月17日
101
苹果新闻

Apple Watch Series 12:目前我们知道的这些消息

2026年5月17日
103
苹果新闻

怎么把个人信息从网上彻底删掉(为什么一刻都不能再等)

2026年5月17日
102
苹果新闻

传闻中的 MacBook Pro 这次升级让我挺期待的,跟 OLED 一点关系都没有

2026年5月16日
101
苹果新闻

Apple @ Work:AI 正如何彻底改变 Mac 管理员的网络安全培训

2026年5月16日
102
苹果新闻

美国部分iPhone用户遇Apple Cash故障

2026年5月16日
101
下一篇文章

安全快讯:这款应用可监测您离开时Mac摄像头或麦克风是否被激活

苹果商用洞察:ABM保修工具揭示苹果全新商务管理API为何对IT团队至关重要

请登录 加入讨论

推荐文章

WhatsApp Plus 订阅服务开始在 iPhone 上推送,但大多数人可能用不着

2026年5月11日
102

Anthropic 推出 Claude Design for Mac,紧随 Opus 4.7 模型升级之后

2026年4月17日
102

苹果TV新惊悚剧《海角惊魂》曝光,斯科塞斯和斯皮尔伯格联手打造

2026年5月7日
103

iPhone 18 Pro 新配色据说是三种颜色的融合,爆料人这么说

2026年4月22日
103

热门文章

  • macOS 26.5 正式推送,这次更新都有啥新变化

    0 分享
    分享 0 Tweet 0
  • Autodesk AutoCAD 2027 for Mac 评测:AI智能绘图终于在Mac上玩出新高度

    0 分享
    分享 0 Tweet 0
  • 2026年iPad路线图:各款新机型发布时间预测

    0 分享
    分享 0 Tweet 0
  • OpenAI 把 Codex 带进 ChatGPT 手机端:iPhone、iPad 和 Android 都能用了

    0 分享
    分享 0 Tweet 0
  • 全新 iPhone Air 与 iPhone 17 Pro 壁纸下载 [更新:iPhone 17]

    0 分享
    分享 0 Tweet 0

近期文章

  • 独立应用推荐:「Cats Lock」这个好玩的 Mac 小工具,完美解决猫咪键盘乱敲问题 2026年5月17日
  • Apple Watch Series 12:目前我们知道的这些消息 2026年5月17日
  • 怎么把个人信息从网上彻底删掉(为什么一刻都不能再等) 2026年5月17日

分类

  • Mac产品库
  • Mac游戏推荐
  • Mac软件推荐
  • 苹果新闻

订阅网站内容

订阅网站内容以便第一时间阅读你感兴趣的内容

订阅即表示同意我们的服务条款和隐私政策。

© 2025 麦克豌豆 MacPea.com - 湘ICP备18009176号 | 友情链接 | Mac软件之家 | Parallels Desktop 破解 | Photoshop Mac 破解 | office mac 破解 | CleanMyMac 破解

欢迎回来!

在下面登录您的帐户

忘记密码?

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录
没有结果
查看所有结果
  • 首页
  • 订阅
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐
  • Mac教程
  • macOS下载
  • Mac产品库

© 2025 麦克豌豆 MacPea.com - 湘ICP备18009176号 | 友情链接 | Mac软件之家 | Parallels Desktop 破解 | Photoshop Mac 破解 | office mac 破解 | CleanMyMac 破解