3D建模像建造立体房屋模型,可以从各角度观察。 4D建模更进一步,像制作立体电影,有空间深度还有时间流动。 和平时视频不同的是,这些模型包含精确的几何信息和物理规律,AI可以在其中真正"生活"和学习,就像《黑客帝国》中的虚拟世界一样。
在正式展开之前,先说一件让人觉得有点不可思议的事情:一个参数量大约只有10亿的小模型,在世界建模任务上的表现,全面超越了参数量超过它100倍的顶尖商业AI接口。这不是一个靠堆规模、堆数据砸出来的胜利,而是靠一个聪明得多的架构设计实现的。这篇文章要讲的,就是这个故事。
从视频生成、机器人控制,到自动驾驶、GUI 智能体,再到科学发现,世界模型正在成为 AI 迈向「会想、会推演、会规划」的关键路线。它不再只是「看懂当下」,而是试图让模型学会在内部 ...
当业界还在为自回归与扩散这两种主流技术路线孰优孰劣而激辩时,答案可能已经显现。 今天,北京智源人工智能研究院(BAAI)重磅发布了其多模态系列模型的最新力作 —— 悟界・Emu3.5。
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 腾讯混元世界模型 HY-World 1.5 开源 ...
一张图,一个3D世界!今天,李飞飞团队重磅放出实时生成世界模型「RTFM」,通过端到端学习大规模视频数据,直接从输入2D图像生成同一场景下新视角的图像。值得一提的是,它仅需单块H100 GPU ...
Hosted on MSN
智元GE-Sim 2.0发布:构建可交互“模型世界”引领机器人自主进化新篇章
在机器人技术领域,一场具有里程碑意义的变革正在悄然发生。智元机器人公司近日取得重大突破,推出世界模型迭代版本Genie Envisioner World Simulator 2.0(GE-Sim 2.0),为机器人行业带来了全新的 ...
具身智能系统通过整合多模态感知、世界建模和自适应策略生成,解决传统模块化架构的碎片化问题。本文提出动态感知-任务适应(DP-TA)框架,结合特征条件化模态对齐(F-CMA)机制,实现跨 ...
Some results have been hidden because they may be inaccessible to you
Show inaccessible results