中文114

手机浏览器扫描二维码访问

一文搞懂世界模型:ai如何“脑补”真实世界?(第1页)

最近,AI领域里“世界模型”这个词越来越火,各大科技巨头纷纷入局,像是谷歌发布Genie 3,昆仑万维推出Matrix-Game 2.0,腾讯开源HunyuanWorld-Voyager。这世界模型到底是啥?为啥科技大厂们都对它趋之若鹜?它和我们熟悉的ChatGPT又有啥区别?别着急,接下来就用最通俗易懂的大白话,结合大家熟知的例子,带你彻底搞懂世界模型。

一、先搞懂:世界模型是啥?和普通AI模型有啥不一样?

(一)世界模型:让AI“看懂”真实世界

简单来说,世界模型是一种能让AI理解和模拟真实世界的模型。以往的AI模型,像图像识别模型只能分辨图片里有什么,语言模型只能处理文字信息。但世界模型不一样,它能把视觉、语言、动作等多种信息融合在一起,形成对世界的整体认知,还能预测未来可能发生的事。

举个例子,你看到一个小孩在玩皮球,皮球滚到桌子下面。我们人类不用看也知道,皮球还在桌子下面,不会凭空消失。这是因为我们大脑里有一个“世界模型”,能理解物体的运动规律和空间关系。而普通AI如果只看到皮球滚到桌子下这一帧画面,它很难理解皮球去了哪,因为它没有对世界的整体认知。但有了世界模型的AI,就能像人一样“脑补”出皮球在桌子下的画面,还能预测如果小孩去桌子下找皮球,会发生什么。

(二)和ChatGPT这类语言模型的区别

我们熟悉的ChatGPT属于大语言模型,主要处理文本信息。它能根据你输入的文字,生成相关的回答,比如你问它“明天天气怎么样”,它能根据数据和算法给出答案。但ChatGPT没有对真实世界的感知和理解,它不知道天气变化会对现实生活有什么影响,也无法和真实世界进行交互。

而世界模型更像是一个“智能模拟器”,它不仅能理解语言,还能理解图像、声音等信息,能在虚拟环境里模拟真实世界的物理规律和变化。比如你给世界模型输入一张房间的图片,再告诉它“把椅子搬到窗户边”,它能模拟出椅子移动后的房间画面,还能考虑到椅子移动时会不会撞到其他东西,这是ChatGPT这类语言模型做不到的。

(三)世界模型的起源:从心理学猜想开始

世界模型的概念最早源于心理学对“人脑如何表征外部现实”的猜想。1943年,苏格兰心理学家Kenneth Craik提出“脑内小尺度模型”假设,认为生物体若能在大脑里携带外部现实的简化副本,就可先“脑内试错”,再输出行动。这就好比我们在做一件事之前,会先在脑海里想一下可能的结果,再决定怎么做。

后来,经过认知科学、机器人学与强化学习的交叉演化,世界模型逐渐发展起来。2018年,“World Models”论文的发表,标志着世界模型概念正式被深度学习社区采纳。从那以后,世界模型在AI领域不断发展,成为实现通用人工智能(AGI)的重要路径之一。

二、世界模型能干啥?这些应用场景和我们息息相关

(一)游戏领域:打造“无限可能”的开放世界

在游戏里,世界模型能让游戏场景更加真实、动态,玩家的每一个动作都能实时影响游戏世界。比如,你在玩一款开放世界游戏,当你走进一片森林,以往的游戏可能是提前设定好森林里的场景和物品。但有了世界模型,森林里的树木会根据你的靠近产生光影变化,小动物会因为你的脚步声而逃窜,甚至天气也会随着时间和你的行动实时变化。

昆仑万维的Matrix-Game 2.0在这方面就表现出色。它是一款交互式世界模型,参数量仅有1.8B,能跑在单块GPU上。你只需上传一张静态图片,它就能基于该图像加载并生成一个虚拟世界。玩家可以通过方向键或WASD键控制人物在虚拟世界中的移动,且每一次人物的移动都会实时影响环境,并生成新的视频内容。像丢给它一张3A大作《荒野大镖客》的游戏画面,它能模拟出非常细腻的自然景观,河流蜿蜒流淌,还能模拟出流水的动态效果,大大增加了游戏的真实感与沉浸感。

(二)自动驾驶:提前“预判”复杂路况

自动驾驶汽车需要应对各种复杂路况,世界模型能帮助它提前“预判”可能出现的危险,做出更安全的决策。比如,当自动驾驶汽车遇到前方突然变道的车辆时,世界模型可以根据车辆的速度、距离以及周围环境信息,预测出可能的碰撞风险,并及时调整车速和行驶方向。

热门小说推荐
我可不是东京文豪

我可不是东京文豪

穿越到后泡沫时代的东京,林秋树成了无身份,无去处,无钱财的悲催三无人员。好在上天还给他留了一扇窗,那些熟悉的作品都不见了,记忆里的文学名著成了他最宝贵的财富。“夏川一叶是今年最强的新人,不接受反驳,《一碗清汤荞麦面》感动了整个日本!”“胡说,渡边次郎的《失乐园》席卷全国,掀起了乐园风潮,他才是最强新人!”“笑话,川端健三凭着《雪国》已经可以称为文豪了,你们有什么好争的。”“等等,你们觉不觉得哪里有问题?他们的笔名好像有规律……”躲在多个马甲背后的林秋树,对着身边一脸倾慕的少女笑着摇摇头,“我可不是什么文豪,只是起风后努力生存的普通人罢了。”...

无限恋综指南

无限恋综指南

祝弃霜接下一档恋爱综艺,醒来却出现在了另一个世界。 长着奇怪眼睛的玩偶拿着话筒对准了他,针线缝合的嘴翕动发出甜腻又诡异的声音: “欢迎来到LOVEHEAT的录制现场——” 一场随时都会被淘汰的恋爱综艺。 一局走向死亡的逃生游戏。 威胁他在游戏里谈恋爱的主持人、死亡率百分之九十九的约会地点、盼着嘉宾早点儿归西的特邀评委、没有cp感就会被“cut”掉的营业情侣,以及全程直播、盯着他的数千万眼睛。 在死亡的过山车中紧握住双手、在诡异的废弃宾馆里相拥入眠…… 主持人的话筒递到他面前:“呼吸加快、心跳加速、瞳孔放大、血管扩张——祝弃霜,你此时此刻的反应到底是出于爱还是恐惧?” 一场万众瞩目的恋爱综艺,和无数被迫拍摄的嘉宾。 牵手失败会死掉哦—— 请认真营业吧,各位“玩家”。 —————— 祝弃霜本来以为这只是一场普通的恋爱综艺,没想到这场“游戏”差点要了他的命。 好不容易回到现实,却发现了自己身上开始出现微妙的变化。 他再也不能拜神。 无论何处庑殿庙寺。 芸芸信众中,须弥座之上,百丈金尊在他注视下应声而裂,化作扬尘。 自此九天上下,再无神佛敢受他敬香。 他不拜神 ——诸神拜他。 ·排雷:主角中心升级流苏文,中西结合风味神话,背景有参考苏美尔/希腊/印度/华夏神话,全都是乱编的,与现实任何宗教都无关,无关,请不要代入!现实副本互穿,不完全是恋综,非快穿单元文,互相有联系,剧情慢热伏笔多。cp有切片有伪骨慎入。 ·封面画师:超机智小吱不嘎吱 ·更新:平时日更,周末日万。 ·防盗已开70%,72小时 阅读指南: ·欢迎来到LOVEHEAT的世界,为了更好的阅读体验,指南包含了在开始阅读前你可能需要知道的规则。 1.请悉知一切皆为虚构之物,也许一些景物会让你觉得眼熟,但这并不是现实。 2.请谨慎使用针锋相对,以避免带来无法预知的后果。 3.如果阅读过程中感到不适,请及时退出。生命就是离别和重逢的反复,率然放弃比强忍难捱更加漂亮体面,期待与你的下次见面。...

一剑霜寒

一剑霜寒

全国百姓都在传,萧王季燕然武功高强,风流倜傥。 如此天潢贵胄,将来要娶的那个人,定然也是琴棋书画、煮饭烹茶样样精通。 寻常人家羡慕不来,羡慕不来。 萧王府内。 这日,季燕然偶感风寒,卧床不起。 云倚风亲自下厨,淘米摘菜,炖鸡汤。 片刻之后,萧王殿下抱病赶来,头晕眼花关切道:“下人都说你在厨房炼蛊,云儿可是又要杀谁?” ———————— 轻松架空,请多多支持啦。...

盗香(全)

盗香(全)

一个酷爱探险的现代大学生,因为一次探险意外来到了古代武侠世界,阴差阳错之下,竟然成了一名空空高手,由于专门劫富济贫,被世人尊称为盗圣。一次机缘巧合之下,他救了武林中一神秘门派掌门,从而惹祸上身,被迫卷入江湖纷争,但也因此获得了高深武学,名扬天下,他把现代社会的各种想法带到了这个古代,大力发展现代商业,他的武功人品以及智谋引起当朝皇帝的注意,甚至还成了皇帝的代言人。在他行走江湖之时,遇到了各色美女,因为有着幽默风趣的人格魅力和尊重女性的现代思想,而俘获了多位绝色佳人的芳心,魔教圣女、人间仙子、皇朝郡主、歌舞大家、外国金发美女、成熟美妇等等各色美女!相信不会让大家失望!这是一个偏向轻松搞笑的故事,有绝世武功,有绝色美女,也有yy恶搞穿插其中!看一个现代大学生,如何特立独行,笑傲武林,坐拥花丛,书写一代盗圣传奇!...

骑行异事

骑行异事

骑行穷游博主历时三年26000公里,带着女鬼一路穿梭在山川田野,夜宿帐篷无意中触发一桩桩尘封多年的灵异事件,选择对错都是错,解开谜题还有迷。。。。一路惊险,几度无人区荒野求生,命悬一线,光怪陆离魑魅魍魉充满全程。终于历经艰险完成骑行。......

重生星际时代

重生星际时代

本作品来自互联网,本人不做任何负责,版权归作者所有,请于阅览后24小时内删除。《重生星际时代》作者:筱忆文案:带着生命空间和记忆重生,还附送一个妹控的美男哥哥,还不错嘛。必须在二十岁之前成为S级异能者,否则就要挂?我勒个去,看来到了这星际时代,姐不发威不行啦!嗯,这位帅哥,你想以武求亲?可以,关门,众亲友上!敢上门调戏,就要有被群殴的觉...