网站首页数码科技 >正文
OpenAI首席技术官(CTO)MiraMurati在接受《华尔街日报》采访时,深入了解了OpenAI文本转视频模型Sora的预期发布和开发挑战。Sora文本转视频AI生成器预计将由OpenAI在今年内发布,甚至可能在未来几个月内发布,这是一个非常令人兴奋的消息。请观看下面对Murati的10分钟快速采访,进一步了解我们对Sora和OpenAI在不久的将来的期望。
OpenAISora发布日期
OpenAI首席技术官MiraMurati在接受《华尔街日报》采访时暗示要发布SoraAI。人们的期望不仅在于技术本身,还在于它在各种应用中所具有的潜力。OpenAI正面解决的主要障碍之一是这项复杂技术的成本。目标是让SoraAI尽可能便宜,最好与OpenAI图像创建器DallE3相关的成本相当。虽然这是一个具有挑战性的目标,但它强调了该组织致力于让更广泛的受众能够使用尖端技术。
在YouTube上观看此视频。
Murati解释说,SoraAI的设计考虑了您的需求,确保界面尽可能直观。如果您曾经与ChatGPT进行过互动,您会发现SoraAI的界面非常熟悉,可以进行顺畅而直接的沟通。此外,开发人员将能够通过API将SoraAI集成到他们自己的应用程序中,从而为将这种先进的文本到视频模型合并到各种软件和服务中开辟了可能性。
然而,重要的是要认识到SoraAI仍在进行中。与任何新兴技术一样,也存在需要解决的问题。该模型的当前版本可能并不总是生成与输入提示完美匹配的视频,并且您可能会偶尔遇到故障。这些并不是不可克服的障碍,而是持续改进过程中的步骤。OpenAI正在积极致力于解决这些问题,重点是提高模型的精度和整体功能。
OpenAI解释说,它正在教导人工智能理解和模拟运动中的物理世界,目标是训练模型帮助人们解决需要现实世界交互的问题。Sora,其文本到视频模型可以生成长达一分钟的视频,同时保持视觉质量并遵守用户的提示。
红队成员可以使用Sora来评估关键区域的危害或风险。我们还向许多视觉艺术家、设计师和电影制作人提供访问权限,以获取有关如何改进该模型以对创意专业人士最有帮助的反馈。文本到视频的人工智能能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景。该模型不仅了解用户在提示中提出的要求,还了解这些东西在物理世界中的存在方式。
SoraAI模型对语言有深入的理解,使其能够准确地解释提示并生成引人注目的字符来表达充满活力的情感。Sora还可以在单个生成的视频中创建多个镜头,准确地保留角色和视觉风格。
目前的限制
“当前的模式有弱点。它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系的具体实例。例如,一个人可能咬了一口饼干,但之后饼干可能没有咬痕。该模型还可能会混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的摄像机轨迹。”–解释OpenAI。
因此,请密切关注SoraAI的前景。将文本转换为视频的潜力即将成为现实,它有望为创造力和交流开辟新的途径。无论您是内容创作者、教育家,还是只是喜欢探索最新技术的人,SoraAI都将提供一种令人兴奋的新方式来参与数字世界。预计Sora很快就会出现在OpenAI的所有产品和人工智能服务中。一如既往,我们将让您及时了解可能发布的任何进展和新闻。
版权说明:本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们
相关文章:
- 2024-03-15联想LegionTabAndroid游戏平板电脑抵达亚洲和欧洲中东和非洲
- 2024-03-14苹果可能计划向另外12个国家推出VisionPro
- 2024-03-14VLC应用程序即将登陆AppleVisionPro
- 2024-03-14新款苹果iPhone可能会配备侧边TouchBar
- 2024-03-14PicoZX手持式多功能ZX频谱模拟器
- 2024-03-14RaspberryPi5ArgonTHRML60mmCPU散热器
- 2024-03-14华硕IoTMDS-M700医疗盒电脑现已上市
- 2024-03-13vivoY03Z智能手机发布HelioG85SoC 90HzLCD和IP54防护等级约RM392起
- 2024-03-13PolarWolf铝制超便携外置SSD立省42%
- 站长推荐
- 栏目推荐