Meta科學(xué)家Le Cun提出人工超級智能發(fā)展路徑

訊石光通訊網(wǎng) 2025/7/3 9:40:24

  ICC  在巴黎舉行的VivaTech 2025科技大會上,Meta首席AI科學(xué)家Yann Le Cun勾勒出一份實(shí)現(xiàn)高級機(jī)器智能(AMI)的雄心勃勃路線圖,其核心是基于視頻預(yù)測模型V-JEPA V2。該模型旨在解決AI面臨的三大核心挑戰(zhàn):理解物理世界、推理和規(guī)劃。

  "V-JEPA是首個能真正學(xué)習(xí)物理世界運(yùn)行規(guī)律的系統(tǒng)之一,"Le Cun表示。與早期試圖在像素級別預(yù)測視頻幀的方法不同,V-JEPA通過預(yù)測視頻內(nèi)容的抽象表征來學(xué)習(xí),這種自監(jiān)督學(xué)習(xí)方式被Le Cun描述為取得突破的關(guān)鍵。

  與大型語言模型(LLM)不同,視頻預(yù)測在確定性預(yù)測方面一直存在困難。"直到最近,這方面都算是失敗的,"他坦言。

  V-JEPA V2在完成表征層面的視頻內(nèi)容預(yù)測訓(xùn)練后,將進(jìn)入第二階段:世界建模。該模型能預(yù)測世界狀態(tài)如何隨著想象的行為而演變,使系統(tǒng)能夠預(yù)判結(jié)果并做出相應(yīng)規(guī)劃。"系統(tǒng)可以想象一系列動作的后果,"Le Cun解釋道。Meta已將該模型應(yīng)用于規(guī)劃機(jī)械臂動作,如抓取物體或開門,而無需進(jìn)行特定任務(wù)訓(xùn)練。

  Le Cun特別區(qū)分了V-JEPA與生成式AI的不同:"V-JEPA架構(gòu)不是生成式架構(gòu),因?yàn)樗鼈儾辉噲D重建或預(yù)測訓(xùn)練所基于的世界。它們學(xué)習(xí)的是抽象表征,并在該抽象表征空間中進(jìn)行預(yù)測。"他指出,大型語言模型缺乏這類內(nèi)部世界模型,"它們基本上是盲目地基于訓(xùn)練內(nèi)容進(jìn)行規(guī)劃或生成。"

  不過,Le Cun也承認(rèn)大型語言模型在代碼生成等領(lǐng)域的實(shí)用性。"它們很有用。我們也在研究它們,但這屬于短期工作。Meta的基礎(chǔ)AI研究團(tuán)隊(duì)(FAIR)總是比當(dāng)前AI潮流領(lǐng)先三到十年。"

  在人工智能理論方面,Le Cun明確否定了"通用人工智能"(AGI)這一術(shù)語。他認(rèn)為人類智能本質(zhì)上是專業(yè)化的:"很遺憾地說,人類智能一點(diǎn)也不通用。我們比大多數(shù)動物稍微通用一些,但某些動物在某些領(lǐng)域比我們更聰明,當(dāng)然計(jì)算機(jī)在某些任務(wù)上表現(xiàn)也比我們更好,這意味著我們在某種程度上是專業(yè)化的。"

  為此,Le Cun提出了Meta內(nèi)部使用的術(shù)語:人工超級智能(ASI)和高級機(jī)器智能(AMI)。"超級智能并不意味著通用,"他強(qiáng)調(diào),"它只是在某些領(lǐng)域比人類略強(qiáng)。"Meta的長期計(jì)劃是開發(fā)"與人類一樣聰明甚至更勝一籌"的AI助手。AMI藍(lán)圖聚焦于能夠理解物理世界、具備常識、擁有持久記憶、能推理規(guī)劃且安全可控的系統(tǒng)。

  關(guān)于超級智能的本質(zhì),Le Cun以已在國際象棋、撲克和路線規(guī)劃等特定領(lǐng)域超越人類的AI系統(tǒng)為例。他將AI的未來定位為"增強(qiáng)智能",人類將獲得在某些任務(wù)上更聰明的AI助手支持,如同擁有虛擬專家團(tuán)隊(duì)。"與比你聰明的人或機(jī)器共事能帶來賦能,"他說。

  Le Cun設(shè)想未來將出現(xiàn)具有用戶知識和偏好心理模型的智能代理系統(tǒng)。"這些系統(tǒng)將建立關(guān)于我們已知什么、未知什么、能消化什么信息、可能對哪類信息感興趣的心理模型,"他表示。這類系統(tǒng)將能規(guī)劃復(fù)雜行動,如預(yù)訂旅行或管理家庭設(shè)備。

  未來幾個月,Meta計(jì)劃擴(kuò)大訓(xùn)練規(guī)模,將V-JEPA應(yīng)用于更廣泛場景,并改進(jìn)訓(xùn)練方法。"我們可以用這些模型為機(jī)器人規(guī)劃簡單動作,"Le Cun說。團(tuán)隊(duì)還在探索更有效的V-JEPA架構(gòu)訓(xùn)練方法和分層規(guī)劃改進(jìn)方案。

  以紐約到巴黎的旅行為例,Le Cun說明了規(guī)劃面臨的挑戰(zhàn):從預(yù)訂航班到開門走向電梯,需要在不同抽象層面進(jìn)行規(guī)劃。"我們還不能規(guī)劃很長的動作序列,"他坦言,"對于需要多個動作的復(fù)雜任務(wù),我們需要分層規(guī)劃,這完全是個未解難題。我們尚不知道如何用AI系統(tǒng)實(shí)現(xiàn)...我們有些想法,但仍處于研究階段。"

  被問及如何解決這些問題時,Le Cun回答:"我們聘請聰明人才,并努力說服他們這是值得研究的有趣問題。"他強(qiáng)調(diào)跨學(xué)科合作的重要性,特別是對于需要應(yīng)用數(shù)學(xué)見解的分層規(guī)劃等問題。"這是科學(xué)問題,不是技術(shù)開發(fā)問題,"Le Cun說,并強(qiáng)烈呼吁開源合作。"我們需要匯集科學(xué)界、學(xué)術(shù)界、其他公司和公共研究機(jī)構(gòu)中可能對此有所貢獻(xiàn)的所有人才。這就是為什么我們需要實(shí)踐開放研究。我們開源代碼,V-JEPA V2就是開源的。"

  關(guān)于超級智能的發(fā)展進(jìn)度,Le Cun給出了謹(jǐn)慎預(yù)測:"如果一切順利,如果我們設(shè)想的所有技術(shù)都奏效,并且在開發(fā)過程中只遇到常規(guī)困難,我們將在三年內(nèi)較好地掌握這類V-JEPA方法。"他預(yù)計(jì)五年內(nèi)將看到能夠理解物理世界的初步成果或原型系統(tǒng),可能達(dá)到"貓或老鼠的水平"。之后他設(shè)想系統(tǒng)將具備規(guī)劃能力,不僅在基礎(chǔ)物理世界層面,還包括某些抽象領(lǐng)域,可能與語言、數(shù)學(xué)或幾何相關(guān)。"我們終將達(dá)到人類智能水平,但這肯定比我們想象的更難,"他表示。

  "大約五年內(nèi),我們將開始看到這方面更具體的應(yīng)用,"Le Cun補(bǔ)充道。

新聞來源:訊石光通訊網(wǎng)

相關(guān)文章