选择你喜欢的标签
我们会为你匹配适合你的网址导航

    确认 跳过

    跳过将删除所有初始化信息

    您的位置:0XUCN > 资讯 > 智能
    新闻分类

    SHARP – 苹果开源的3D场景生成AI模型

    智能 PRO 稿源:AI工具集 2025-12-22 14:40

    SHARP是什么

    SHARP 是苹果开源的 AI 模型,能在不到 1 秒内将单张 2D 照片转换为逼真的 3D 场景。模型通过 3D 高斯表示技术,用神经网络单次前馈传递,快速预测出场景的 3D 结构和细节。与传统方法相比,SHARP 将合成速度提升三个数量级,同时在多个基准测试中表现出色,将 LPIPS 降低 25% – 34%,DISTS 降低 21% – 43%,生成的 3D 视图在细节和结构上更接近真实世界。

    SHARP的主要功能

    • 快速视图合成:在不到 1 秒的时间内,通过单次神经网络前馈传递完成 3D 场景的生成。
    • 高分辨率渲染:支持实时渲染高分辨率的 3D 视图,细节丰富且结构逼真。
    • 绝对尺度支持:模型生成的 3D 场景具有绝对尺度,支持真实的相机运动模拟。
    • 零样本泛化:在多个数据集上表现出色,能泛化到未见过的场景,具有良好的鲁棒性。
    • 高效性与高质量:相比传统方法,合成速度提升三个数量级,同时在图像质量上显著优于现有技术。

    SHARP的技术原理

    • 3D 高斯表示:将场景中的物体和结构表示为带有颜色、位置和形状信息的高斯分布(高斯球)。这种表示方式能高效地捕捉场景的几何和外观信息,同时支持高效的渲染。
    • 神经网络回归:使用深度神经网络从单张 2D 照片中回归出场景的 3D 高斯表示的参数。网络通过海量的合成数据和真实世界数据进行训练,学习到通用的深度和几何规律。
    • 快速建模与渲染:在处理新照片时,模型通过单次前馈传递快速预测出数百万个高斯分布的位置、大小和外观。生成的 3D 场景支持实时渲染,能够以超过 100 帧每秒的速度在标准 GPU 上运行。

    SHARP的项目地址

    • 项目官网:https://apple.github.io/ml-sharp/

    • GitHub仓库:https://github.com/apple/ml-sharp

    • arXiv技术论文:https://arxiv.org/pdf/2512.10685

    SHARP的应用场景

    • 虚拟场景构建:通过将单张照片快速转换为 3D 场景,SHARP 能为 VR 和 AR 应用提供逼真的虚拟环境,增强用户体验。

    • 影视制作:快速生成高质量的 3D 场景,用于电影、电视剧和广告的特效制作,节省时间和成本。

    • 环境建模:快速生成周围环境的 3D 地图,帮助自动驾驶车辆和机器人更好地理解场景,进行路径规划和导航。

    • 文物数字化:通过单张照片快速生成文物的 3D 模型,用于文化遗产的数字化保护和展示。

    • 虚拟实验室:为学生提供虚拟的实验环境,通过 3D 场景增强学习体验。

    0XU.CN

    [超站]友情链接:

    四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
    关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/

    图库
    公众号 关注网络尖刀微信公众号
    随时掌握互联网精彩
    赞助链接