爱奇飞网

网站首页数码科技 >正文

StabilityAI推出TripoSRAI图像到3D模型生成器

开心的月饼 2024-03-10 08:49:31 数码科技

StabilityAI与TripoAI合作推出了TripoSR,这是一款旨在快速将图像转换为高质量3D模型的工具。TripoSR的灵感来自于单图像到3D的大型重建模型,旨在满足各个行业的需求,包括娱乐、游戏、工业设计和建筑。尽管TripoSR令人兴奋,但StabilityAI在其数据收集方法方面面临着一些道德问题,其中包括从Midjourney中抓取训练数据。这导致Stability的工作人员被禁止提供Midjourney服务。

StabilityAI推出TripoSRAI图像到3D模型生成器

合作发布:与TripoAI合作开发,推出TripoSR,可在一秒内从单个图像生成高质量3D模型。

低推理预算:在低计算资源下有效运行,包括没有GPU的环境,使其可供广泛的用户群使用。

开源可用性:模型权重和源代码根据MIT许可证发布,支持商业、个人和研究应用。

灵感和应用:受LRM(单图像到3D的大型重建模型)的启发,TripoSR设计用于娱乐、游戏、工业设计和建筑,提供快速的3D对象可视化。

性能:优于OpenLRM等其他模型,在NvidiaA100GPU上大约0.5秒内提供草图质量的3D纹理网格。

可访问性:用户完全可以访问,无需GPU资源。

技术创新:包括从Objaverse数据集的精选CC-BY子集准备训练数据、通道数优化、掩模监督和高效作物渲染策略,以提高模型泛化和性能。

很快,只需点击几下即可将简单的照片转换为详细的3D模型。这不再是一个遥远的梦想,这要归功于StabilityAI和TripoAI的共同努力,他们推出了TripoSR,这是一款正在重塑我们对3D建模方式的新工具。这项创新技术将简化3D模型的创建过程并使其更具成本效益,从而对娱乐、游戏和建筑等行业产生重大影响。

稳定性AITripoSR3D性能与F-Score

TripoSR基于单图像到3D的大型重建模型(LRM)框架构建,该框架以其技术实力和广泛的用途而闻名。TripoSR的与众不同之处在于它能够在功能较弱的计算机上高效运行,这意味着您不需要昂贵的图形处理单元(GPU)即可使用它。对于小型企业和独立创作者来说,这是个好消息,他们以前可能会发现生成3D模型的成本过高。TripoSR模型的代码现已在TripoAI的GitHub上提供,模型权重可在HuggingFace上获得。

TripoSR最令人兴奋的方面之一是它是在MIT许可证下发布的。这意味着任何人都可以将其用于商业项目、个人努力或研究目的,而无需担心许可费用。这种访问级别可能会激发创造力,并导致不同领域的3D建模质量显着提高。

与原始LRM模型相比,TripoSR进行了多项增强。这些改进包括通道优化和添加掩模监督,它们共同增强了其生成的3D模型的细节和准确性。最终结果是一个工具不仅运行速度快,而且提供的模型比OpenLRM等类似技术创建的模型更精细。

逼真的AI生成3D模型

为了确保3D模型尽可能真实,TripoSR使用多种渲染技术进行训练。这种方法提高了工具解释和重新创建现实世界图像的能力,从而产生逼真且复杂的模型。对于那些有兴趣进一步探索TripoSR或为其开发做出贡献的人,模型权重和源代码可在GitHub和HuggingFace等平台上公开获取。还有一份详细的技术报告,提供有关该工具如何工作的深入信息。

展望未来,将图像转3D技术集成到即将推出的StableDiffusion3模型中预计将增强逼真视频和沉浸式体验的创建。这一进步可以重新定义视觉媒体,为创作者提供新的方式,以前所未有的细节和深度将他们的想法变为现实。

TripoSR代表了图像转3D技术的重大进步。其经济性、开放许可和技术改进将为世界各地的创作者和行业提供支持。尽管面临一些道德障碍,但对其功能和未来应用的重视是坚定不移的,这标志着真实且易于访问的3D模型成为常态的时代已经到来。有关新TripoSR模型的更多信息,请跳转至官方StabilityAI技术报告。


版权说明:本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们


标签:

站长推荐
栏目推荐
阅读排行