5GB显存最快05秒生成腾讯混元开源多款3D生成模型
来源:欧宝体育直播在线 发布时间:2025-03-23 05:03:553 月 18 日和 19 日,腾讯混元在其开源日宣布开源 5 款全新 3D 生成模型,这些模型均基于 Hunyuan 3D 2.0 技术打造。
此次开源的多款模型涵盖了 Turbo 系列模型、多视图版本模型以及轻量级 mini 模型。截至目前,Hunyuan 3D 2.0 家族已有 6 款模型。
此外,该公司自研的 3D AI 创作引擎也同步升级。腾讯混元 3D AI 创作引擎于今年 1 月发布,本次升级后的引擎带来了四大功能,包括多视图输入、模型智能减面、基于物理的渲染(PBR,Physically Based Rendering)材质升级和多格式兼容。这些功能不仅提升了生成效率,也为 C 端创作者提供了更强大的工具。
Turbo 系列模型:得益于腾讯混元的 3D 生成加速框架 Flash VDM,实现了数十倍的生成速度提升,能够将高精度模型的生成的时间压缩至秒级,大幅度提升了 3D 模型的生成时间。多视图版本模型 Hunyuan3D-2mv:支持多视图输入信息(1 到 4 张图片额外输入),能够更精准地捕捉细节,生成更符合原画师、设计师用户对高质量 3D 资产的预期。轻量级模型 Hunyuan3D-2mini:通过架构优化与运行效率提升,大幅度降低了算力需求,为移动端和低算力设备提供了高效解决方案。
与 1 月份开源版本相比,其参数量从 11 亿下降到 6 亿,并且具有更高的隐空间压缩率,从而能够大幅度降低了 GPU 显存的占用。
腾讯混元 3D AI 创作引擎于今年 1 月发布,本次升级后的 3D AI 创作引擎带来四大功能,包括:多视图输入、模型智能减面、PBR 材质升级和多格式兼容。
在多视图输入方面,操作格外的简单:上传几张标准视角的图片后,就能得到快速生成的高质量 3D 模型,这大幅度降低了游戏制作、3D 用户生成内容创作等场景的制作成本。
引擎的 3D 智能减面功能能够为模型“瘦身”。它可以依据需求自动生成几百到数千个三角面,优化几何边缘的平滑度,从而在减少面片数量的同时,最大限度地保留模型的细节表现。
在质感方面表现方面,通过 PBR 提供了更真实的颜色以及材质表达,适用于游戏开发、影视制作等高要求场景。
此外,其还实现了多格式兼容,除了支持 OBJ、GLB、FBX 等多种格式输出以外,还可输出 STL、USDZ 及 MP4 等主流格式,兼容 3D 打印工具,可满足模型快速预览和移动端实时交互需求。
Flash VDM 加速技术是 Turbo 系列模型实现高性能的关键。在该技术加持下,最低只需要 5GB 的显存就可以部署 mini 等模型,可以在任何消费级显卡上进行部署,并且运行时间能降低到 1 秒以内。
在显卡支持方面,最低支持 4050、3050、2060、1070 及以上的显卡。此外,该技术还可以在 Mac 上的 M1 等芯片上进行部署,并且支持在 MacOS、Windows 和 Linux 三大操作系统上运行,甚至还可以直接在 CPU 上进行部署。
那么,这项技术解决了什么样的问题呢?目前,业界常用的 3D 生成模型范式是基于 Vecset 的扩散模型(VDM,Vecset Diffusion Model)。尽管这类模型能够生成比较高的质量,但通常速度会比较慢。
一个明显的对比是:Hunyuan3D-2 生成 3A 级别的资产,需要半分钟左右;而使用 Flash VDM 技术之后,其生成一个 3D 模型的时间提速到 1 秒钟。需要我们来关注的是,如果将其应用到更轻量的 mini 模型上,还可以做到 0.5 秒内生成。
简单来理解,3D 模型生成就像搭积木,先将杂乱无章的东西压缩成积木模块(VAE 的解码过程),再将这些积木堆成一个完整的 3D 模型(DIT 的生成过程)。这两个阶段是 AIGC 的通用流程,3D 生成模型也不例外。
然而,这两个阶段都需要加速。从上图中能够正常的看到,生成模型的推理时间占比为 23.94%,而 VAE 解码的时间占比高达 75.88% 。因此,要想将生成时间从几分钟缩短到一两秒,必须对这两个阶段同步进行加速。
腾讯混元团队在解码过程中通过智能化地大幅度减少采样数量,以及减少每个采样的计算量,实现了速度的大幅度提升(与 Hunyuan3D-2 模型相比):加速版模型的迭代步数为 5 步,而未加速版为 50 步。
此外,腾讯混元团队还进行了用户调查,通过众包平台对加速版模型(Turbo 模型)和未加速模型(Hunyuan3D-2)进行了评测。结果显示,87.3% 的用户觉得加速版和未加速版的效果上无显著差异。
当加速版的迭代步数从 5 步增加到 8 步时,认为两者效果差不多的用户比例提高到 90% 左右,这说明大多数用户难以区分加速版和未加速版的生成效果。
3D 生成模型技术近年来蒸蒸日上。实际上,随着手工建模的时间已经从一周、几天缩短到几分钟甚至秒级的速度,为什么还要追求更快的速度呢?
其背后反应的是市场对生成模型高质量和高可控性的需求,更快的速度也代表着能形成良性、迅速的反馈机制。
另一方面,尽管在文字、图像、视频领域,生成的大多是单个对象,但在 3D 领域会涉及到成千上万的 3D 资产的生成(例如城市、场景等),因此效率对更大规模的生成能力是一种强有力的技术保障。
目前,腾讯混元 3D 生成模型在多种场景应用,例如用户生成内容、商品素材合成、游戏 3D 资产生成等。
总体来说,随着腾讯混元系列模型的发布和开源,我们正真看到了 3D 生成技术在广泛场景中的应用潜力,无论是专业工作室还是 C 端创作者,都能依据自己硬件条件选择正真适合的模型进行更高效的创作。
对于目前 3D AIGC 的生成速度较慢,交互场景速度受限来说,全新的高质量、高速模型有利于推动交互式 3D 创作工具的发展,并为社区和用户更好的提供了二次开发的基础。
尽管腾讯混元 3D 模型在实用性和灵活性方面表现出色,可满足多种场景下对 3D 模型细节的严苛要求,但也需要认识到,在创意和细节程度方面,人工建模仍然具有无法替代的优势。
正如他们在开源日直播中所表达的那样,“一花独放不是春,百花齐放春满园”,只有通过技术的不断迭代与生态的共建,才能推动 3D 生成技术的全面发展。DeepTech 将持续关注其后续更新,期待带来更多实用功能和性能优化。
03月13日,制药巨头赛诺菲将投资10亿欧元在北京新建生产基地,华体会会员登录,千亿国际手机官网app,球探比分,澳门威尼斯电玩
03月13日,鸟腿结构对机器人有何借鉴?最新研究称可助跳跃起飞,凤凰娱乐正常普通登录,4422leyu,AG和bg哪个平台更大,开运体育官网app
03月13日,二月二龙抬头 民众扎堆“剃龙头” ,视讯真人游戏备用网址,乐动体育电子网投,打鱼现金可上下分,白鲸鱼平台
03月13日10月28日人民币对美元中间价报7.1307元 下调217个基点正规的玩球平台线上mg国际乐鱼电竞网站天博综合在线日商业外摆新政回眸 杭州城市管理何以助企惠民?斗地主游戏名字爱游戏体育怎么注册牛宝体育平台靠谱PG赏金船长在线日以铸牢中华民族共同体意识为根本方向,持续深化民族团结进步创建工作必赢体育平台188外围平台千赢官网首页网址现金赌场手机版下载……
03月13日“五一”假期浙江水路发送旅客超130万人次龙8网页博狗体育官网BOBty体育官网网站入口云顶国际开户网址
03月13日,中新真探:常温牛奶保质期长,是因为加了防腐剂?,百乐棋牌最新下载,华体会体育娱乐,k8官网下载,万赢国际网站
03月13日,国际商事仲裁理事会大会首次在香港揭幕,博亚体育app,开园棋牌平台,澳门第十三第app下载,叁零内幕报
03月13日,【理响中国·人民至上@中国式现代化】海报|如何讲好用好新时代“大思政课”?,万博manbetx登录注册,全球菠菜网排行,ROR官网登录,nba比赛买球哪里买
03月13日中国第40次南极考察:“雪龙2”号开展海洋水体监测取样作业888真人在哪开户必威体育平台真人AG啥意思澳门金沙官方网站官网
03月13日(文化中国行)南京六朝博物馆:这些文物有着来自六朝的“微笑”ope体育电竞最新官网AG登录网址是多少365娱乐体育在线金年会手机网页版登录
03月13日习言道|8年4次座谈会,习擘画“人间正道”万博manbetx手机注册登录欧亿体育AG真人游戏厅九五至尊手机APP
张豆豆说孙杨很有安全感,唐人街探案2第九届会林文化奖颁出送彩金的平台有哪些真人AG平台大红鹰平台AG亚洲国际游戏官的网址
出轨女老师曾获学生最喜欢老师称号,再就业男团春晚联排AI能代替诗人写诗吗?听听诗人怎么说九五至尊游戏下载去哪里买lol外围威尼斯人体验官网银河真人平台
韦礼安徐海乔庆怜直播,孟子义李昀锐两年二搭习言道|铸牢中华民族共同体意识,习这样强调压球的app亚娱体育平台小游戏中心英亚国际是干什么的
无罪的罪人 第一季,刘亦菲祝亲爱滴糖生日快乐港澳人士和海外侨胞点赞新疆发展ku游娱乐登录页亿博体育登陆鼎盛下载天博app官网下载官方版
国漫高颜值女神评选,佐助回档是什么梗政要遭袭,专家遇刺,伊朗为何暗杀频发?世界杯威廉希尔投注网天博入口登录宝马线
我发如今二次元的规矩大伙打分,凶劫601航班中国房企融资现回暖迹象必威平台注册登录AG真人线bet体育开户大全皇冠体育生活
< 上一条
《民法总则》个人隐私信息保护条文研究
下一条 >
以数据库建造为抓手进步存案检查质量

