本月初,微軟在世界上放鬆了其以視頻遊戲為中心的Generative AI模型Muse的新的,可公開的演示。就演示而言,這是一個重要的:一個可玩的,基於瀏覽器的傳奇第一人稱射擊遊戲的“ AI Rendition”。
但是,除了降落時,迪士2“副遊戲體驗”並沒有像微軟在人工智能方面的界限進展令人印象深刻,被遊戲公眾廣泛抨擊,因為其他許多事情,“ shit”。
批評或多或少是普遍的,從公眾形容為“絕對他媽的令人噁心“ 和 ”就像可怕的奈奎爾引起的睡眠癱瘓”,福布斯稱其為“憎惡”的遊戲的“評論”。成員遊戲出版社譴責在邊緣報告,標題“ Microsoft創建了AI生成的Quake版本”,非常輕信,標有與“未付PR Work”相似的覆蓋範圍。
科技博客威爾·史密斯(Will Smith),提供了更衡量的響應但是仍然得出結論,這最終是“一個頭。它是互動視頻,是的,我想這是令人印象深刻的,但它並沒有捕捉到互鎖系統的魔力,這些互鎖系統在2025年仍然使玩具Quake 2變得有趣,儘管它已經有了將近30年的歷史,並且可以追溯到3D圖形的最早日子。”
所有這些都出現在微軟最初揭露繆斯本身的幾週後,那個時候以非交互性但類似的模糊鏡頭為基礎,基於忍者理論- 並且收到了類似加熱的響應。
第一次揭幕也帶來了自己的進一步問題。尤其是用於“遊戲玩法”的繆斯概念的反應,以及Xbox首席在隨附的視頻中,繆斯看似古怪的說法,即繆斯可以“從根本上改變我們將來的維護和體驗經典遊戲的方式”,這使舊遊戲與“任何設備”兼容。
人們對Muse Ai的所作所為,可以做什麼以及它是否對任何事情都有用。
這是一個混亂的揭示。當時,我們澄清了 - 在AI專家Michael Cook博士的幫助下 - 。正如庫克在他的博客中佈置的那樣,Microsoft在自然界中發表的研究論文以及該模型的揭示“並不是真正的'生成遊戲玩法'或'創意'”,而是關於這些研究人員的思考人們如何使用這些工具的含義”。但這並不意味著沒有很多局限性和關注點。例如,關於斯賓塞(Spencer)關於保存的評論,庫克指出:“我可以請我朋友的五歲兒子畫蠟筆圖片看起來像是一定的遊戲保存。 ”
總而言之,這導致了表面上完全奇怪的情況。微軟是世界上最富有的企業之一,他正在為其Muse AI研究團隊的工作付出巨額資金。研究團隊擁有許多專家,例如Sam Devlin博士和研究負責人Katja Hofmann博士,這些專家在其領域中廣為人知。這項研究的早期結果似乎是行業中幾乎每個人都完全鄙視的。人們對Muse Ai的所作所為,可以做什麼以及它是否對任何事情都有用。
但是實際上是怎麼回事?背後的研究團隊可以提供更多可靠的答案嗎?確切地說,我們應該對所有這些做出反應?
什麼是繆斯?
為了幫助您理解,我與自從繆斯透露以來一直處於繆斯對話核心的兩個人:邁克·庫克博士和卡特賈·霍夫曼。
庫克(Cook)是倫敦國王學院(King's College)計算機科學的高級講師,專門研究人工智能,特別是計算創造力,自動化遊戲設計以及生成軟件的設計和分析。多年來,我們已經介紹了他在Eurogamer上的工作,包括他構建的AI計劃早在2013年,他的追求第二年。他以一個快速發展的講師的柔和直接性進行交談,他們不介意您是否真的無法跟上原始材料,只要您至少願意繼續嘗試。
在第一個繆斯揭露之後,我對我說話,但是在第二個以Quake 2為特色之前,我要求庫克解釋我們第一次給出的出血邊緣示例中發生了什麼。他說:“我想您可以將其視為:如果您向Chatgpt展示了視頻遊戲的屏幕截圖,然後您說:“您能告訴我一個視頻,說明這裡有敵人會發生什麼”,並且會產生視頻,向您展示播放屏幕截圖的播放器,但是屏幕上有一個敵人,但他說。”他補充說,這是一個“非常笨拙的”摘要,“但這基本上就是他們要做的。”
正如庫克所說,在這裡強調的關鍵點是“它正在生成圖像。它不是生成代碼或類似的東西。”這是一系列形成視頻的圖像,用AI研究術語來看,該視頻被稱為“條件”。庫克解釋說:“這是基於輸入的條件。”就像Midjourney這樣的圖像生成工具“是由文本調節的”。例如,如果告訴AI映像發生器,則需要貓的圖像,“它會生成圖像,然後看文本,就像,這不是任何圖像;它必須是貓的圖像。”
有了繆斯,這種調理是“不僅在人們玩遊戲的視頻上,而且實際上是他們正在按下的按鈕”。這意味著,當我們談論“可玩”模型(例如最新版本的Muse),以及Google的類似有爭議的精靈“它正在進行視頻生成,但是您也可以說“如果按下跳躍按鈕,則會生成視頻的下一個幀”,並且它將在下一步生成下一個幀時考慮到這一點。”這裡的關鍵點是,這一切從根本上仍然是預測性的,就像大型語言模型(LLM)(例如ChatGpt)最終基於您的文本提示來預測單詞序列。
繆斯是一種模型,生成了經過訓練的視頻遊戲的模擬視頻鏡頭,並模擬了與該鏡頭的互動性
我向高級研究員,微軟遊戲情報研究團隊的負責人霍夫曼(Hofmann)提出了同樣的解釋 - 這與我一樣的人。霍夫曼(Hofmann)輕聲說話,帶有德國的口音,是一個精確的說話者,在經驗豐富的公共發言人熟悉會議踪跡和令人興奮的研究畢業生中,衡量了單詞,他們仍然相信這項工作。她說:“從簡單的角度來看,第一個模型表明我們可以訓練對現有視頻遊戲的AI模擬。因此,這意味著,如果我們在遊戲視覺效果和控制動作上訓練模型,我們將學習一個模型,然後能夠模擬這一點。”
因此,她繼續說:“您創建一個小型,可播放的場景,直到在推理時間由模型進行備份,”推理時間是該模型處理新的,看不見的數據並對其進行預測所花費的持續時間。然後,在此模型的“實時”版本中,這實際上“允許玩家連接控制器並在想像中播放 - 或在模型中播放”。
用更簡單的話來說,想到這樣的話:Muse是一種模型,生成了經過訓練的視頻遊戲的模擬視頻鏡頭,並通過預測您的按鈕按下會導致該視頻片段的內容,然後復制這些視頻,從而模擬與該錄像的互動。因此,例如,如果用作訓練數據的所有出血邊緣鏡頭都表明,當玩家將正確的模擬插在出血邊緣中時,相機向上抬起來,那麼當“播放模型”時,將模擬貼在“播放模型”時,同樣會導致模擬的視頻源向上向上傾斜天空。
繆斯正在生成視頻遊戲嗎?
所有這些“播放”繆斯的概念提出了一個特別重要的問題:繆斯正在產生視頻遊戲嗎?基本上,霍夫曼和庫克的強調答案是:否。
對於庫克來說,有一個問題,即使描述繆斯以及類似的模型(例如Genie或Oasis)是“可玩”的問題。 “在YouTube上,您可以觀看全景視頻並轉過頭,但這不是“可玩”視頻。這只是一個與之互動的視頻。”他說,與此同時,他說:“如果您考慮在家中玩耍的流媒體服務,而鍵盤輸入被發送到服務器,”例如,現在,Xbox Cloud Gaming,Nvidia Geforce,Nvidia Geforce,Nvidia Geforce,Amazon Luna或註定的Google STADIA,“您的計算機只是在您的視頻中顯示。
最好將其視為“ 3D世界的視頻,但3D世界並不存在。”是否這樣做,將其從實際成為遊戲中取消資格是為了辯論。正如庫克本人所說:“在某個時候它有點哲學。” (一個自然的後續問題的一個例子,對您來說是令人著迷的或令人難以置信的無聊的,這取決於您的說服力:是否由固定代碼定義的視頻遊戲世界“存在”?它是否存在於您的硬件上,而不是從服務器中流過的,或者,就像繆斯女神的案例中,一個非常模糊的,不一致的人在沒有任何編碼中相互匯合?
在我們最初的談話中,霍夫曼(Hofmann)伸出了邀請,訪問Microsoft AI研究小組在劍橋的辦事處,以親自嘗試Muse的演示。在那兒,她進一步闡述了這種玩模型的觀念,而不是嘗試重新創建遊戲。
霍夫曼在面對面的演示中告訴我:“我們試圖不將其稱為遊戲,因為它不是遊戲。” “我們正在考慮“播放模型”,所以探索性的互動弄清楚:有什麼局限性?它在哪裡破裂?什麼不起作用,什麼有效?”對於霍夫曼來說,這是她覺得的過程“令人著迷”,儘管開玩笑說,這可能是為了分享自己熱情的非常具體的研究人員的魅力。
實際上,對於霍夫曼(Hofmann),測試模型中斷的邊界在許多方面是發布Quake 2演示的一部分,並且實際上首先創建了它。從這個意義上講,她將其與其他非相互作用的生成性AI進行了比較,因為嘗試複製視頻遊戲,您可以簡單地發現缺陷。她說:“如果您與聊天機器人進行互動,您將永遠無法獲得那種直接的體驗:我可以從本質上看到數據丟失的位置,或者在哪裡犯錯誤。在這裡,因為我們是為3D互動和視覺互動而進行的,我們可以通過在這種環境中進行和播放來從字面上審議模型。” “對我來說,這是我們能夠在這裡展示的關鍵方面。”
通過在線,基於瀏覽器的Quake 2 Copilot演示和親自通過連接到Hofmann的筆記本電腦連接的Xbox Controller的“播放模型”,這一概念確實具有真實性。我播放了基於顫音的仿真的更新版本,以及Quake 2 1-都基於Whamm(請注意第二m),這是使Quake 2演示成為可能的最新版本 - 還可以實時測試添加可相互作用的項目,跳板和敵人的拖放功能。
值得一提的是,由於視頻遊戲的詳盡,而且在其他地方的叮咬都比我所能想到的,它們都非常可怕。通過每種可玩性,它們都是無法播放的。
但是,被視為一種元遊戲,挑戰不在遊戲中,而是試圖成功播放它,這里至少有一些新穎而有趣的東西。例如,在準Quake 2的一瞬間,我發現自己陷入了一個黑暗的水下秘密區域,沒有明顯的出路,這對視覺和控制的模糊性和不一致而言並沒有幫助。然後我意識到我可以“玩模型”以逃脫,從而有效地觀看了一段黑牆,從而有效地遊戲了0.9秒的記憶,然後轉身發現世界已經完全改變了,現在一條路線很清楚。
這些是通過自己的方式,我們需要製作某種遊戲的一致規則,就像我們學習內部遊戲邏輯的任何其他機械師或時刻相同的方式學習:如果我做X,則會發生。從技術上講,這是一個視頻遊戲。可以說,這是一個有趣的東西,即使只有它的新穎性和背景,就與外藝術畫廊安裝的方式幾乎相同,而當您僅與它進行一次或兩次互動時。但仍然不是一個特別好的。
這也與這裡的自然後續問題聯繫在一起,該問題詢問該模型的實際意義是什麼,以及它的用途可能最終可能是或不會是什麼。
“遊戲構想”,保存或其他東西:誰和什麼是繆斯?
如果關於繆斯的合成作品是否是電子遊戲的問題似乎有點暗淡,那麼下一個與泥漿一樣清晰。繆斯人實際上是誰或什麼?同樣,這個問題一開始就開始迅速採用哲學形式,但是在我們到達真正的下巴之前,遍歷到目前為止已經建議的擬議用途是有意義的。
菲爾·斯賓塞(Phil Spencer)吹捧的這種保存概念之一是著名,最容易被駁回的人之一。值得注意的是,霍夫曼(Hofmann)在那件可能的情況下,與斯賓塞(Spencer)提出這一可能性時,與斯賓塞(Spencer)的視頻播放了視頻。我問她,現在還是將來的任何時刻,她是否覺得這是對繆斯的真正可行用途。
她說:“目前,我看到的是,我們就可能的分支機構進行了很多對話,”她說,“並且遊戲保存一直是其中多人提出的其中之一。例如,菲爾(Phil)特別興奮。”
但是,她繼續說:“我認為這是今天不完全可行的東西的功能之一。我喜歡將其紮根:今天可行的是,我可以在遊戲中創建一個級別的模擬,這使您對玩遊戲版本的感覺不完全像真實的遊戲。”
她補充說:“我的感覺是,在接下來的十年中,這項技術將成熟。 “我敢肯定,這不會是唯一的。但是我看到的。我確實認為這是與其他應用領域一起探索的令人興奮的東西。 ”
同時,庫克在這裡是明確的。他說:“考慮一下您最喜歡的遊戲,然後考慮一下YouTube上它的鏡頭。” “如果我們要根據那個錄像來學習遊戲,那麼什麼東西也不經常看到?也許根本看不到什麼東西?也許沒有人發現秘密。蟲子,小故障。
“而且也許是一種愚蠢的水平 - 但要考慮的仍然很重要 - 諸如DatamIners發現剪切的內容之類的東西。或者,如果您在非常舊的遊戲中看,您可以在4:00 AM工作並在代碼中寫消息的開發人員在代碼庫中找到評論。這些東西顯然無法鎖定,無法恢復,因為計算機看不到它。 ”
他在這裡提供的一個類比:“我經過的地球劇院不是真正的地球劇院。我們建造它仍然很有用。但是,如果我們也有原始的,那就太好了。”他補充說,假設該方法“在那裡獲得了99%的方式,最終與實際記錄代碼庫並不相同,這是出於一百萬和一個原因。”
下一個建議感覺就像是一塊高管廣告,而是微軟為Muse的核心音調的核心:“遊戲玩法構想” - 從本質上講,這是一個相當企業的術語,從本質上講,考慮了您可以在遊戲中做的事情。繆斯明確被吹捧為幫助這一幫助的潛在工具,但至關重要,正如我們已經澄清的那樣,它並沒有以任何方式提出想法或發明遊戲玩法。
“周圍有哲學問題:模型可以創造性嗎?”霍夫曼說,當我要求她澄清時。 “而且我不在一邊。我在文獻中看到了很多困惑。但是,通過構架繆斯作為:這是對現有視頻遊戲的模擬,我認為這非常堅定地強調,該模型本身並不創造力。”
“我不能特別地告訴你,另一個創新將是另一個創新,但這基本上打開了這個巨大的巨大空間……我看不到我們將能夠實現多遠。”
在與Microsoft內部與開發人員進行對話之後,研究團隊的目標是實現,“正是逗弄了可以釋放人類創造力的模型功能。”換句話說,該團隊正在嘗試弄清楚這樣的模型,如果它們要變得更快,更高效,更準確,依此類推,對人類開發人員來說可能是有用的。
在這種情況下,它又回到了帶有出血邊緣的繆斯的最初演示中,您可以將某些東西拖入遊戲中 - 跳板,爆炸性槍管,敵人 - 然後迅速看到瞭如何發揮作用。
實際上,這是一種非常原型遊戲創意的方法,即使是這樣,它實際上也會有所幫助嗎?提出了第一個問題,霍夫曼將當前版本的模型的輸出描述為“不努力工作”,而目前只有一個“生命跡象”的例子,但是儘管觀看公眾對公眾的懷疑,但她對改善其能力的信心似乎是Ironclad。
她解釋說,這種信心是基於霍夫曼認為是這些模型如何運作的真實發現,例如了解“我們如何策劃數據來製作 - 或訓練 - 捕獲數據中這些結構關係的模型”。她補充說,通過“結構關係”,她特別的意思是“對該模型如何能夠將圖像轉化為數字,然後了解這些數字如何相互關係的理解”。用最簡單的術語,霍夫曼認為團隊已經了解瞭如何以某些方式對培訓數據進行特定,從而可以為您提供更多可靠的輸出,並且需要更少的數據。
這種新發現的理解“圍繞著如何專門策劃的數據集和多模式模型相互交互的方式,以及他們能夠學習的各種結構,開闢了這一非常大的空間。”對於某種開發人員友好的跳板測試工具,這可能會成為實際的,可用的現實?她說,“有很多跑道”,“我不能給你一個時間表。我不能告訴你哪些創新要追隨另一個創新,但這基本上打開了這個巨大的巨大空間……我看不到我們能夠與之相處得多。”
但是,這實際上可能對開發人員有用是另一個問題。就庫克而言,庫克再次持懷疑態度,建議在快速添加遊戲視覺效果和其他詳細信息中,可能會發現這種工具的更有幫助(和高效)的途徑,或者在標準的白色盒子中添加其他細節,或添加當前不存在的新形式的,Quickfire的自動播放的新形式。他說:“存在人類游戲測試者,但是有些技術要求您擁有自動的Playtester。”
儘管如此,庫克還是熱衷於讚美微軟實際尋求真正的遊戲開發人員的意見,這也反復指出了這一點。庫克說:“關於這篇論文,我最喜歡的一件事是他們實際上與開發人員坐下來並與他們交談,而且他們經常談論已經對這項技術非常積極的開發人員談論 - 但是他們實際上對他們說了:看起來對您有用的工作流程對您有用嗎?我認為這很重要?我們需要更多的東西,我們需要更多的東西。”
當涉及這種假設工具的實際實施時,這裡出現了另一個重要的問題。開發人員如何使用Muse模擬在開發遊戲中添加新的機械師,而當前需要培訓Muse(如Bleeding Edge的情況下),大約是已經完成的遊戲鏡頭的7000小時?
霍夫曼認為該團隊確實對此進行了考慮,這是在研究團隊與開發人員進行的對話中進行的。 “我們查看:假設一個場景,可以說某人已經建立了他們正在從事的新遊戲的第一級 - 他們可能需要培訓這樣的模型的數據很少?”她說,該團隊“遠沒有完整的版本,”她說,“但是我們現在知道,從給定的遊戲水平上我們只能逃脫大約50個小時的遊戲玩法,以創建一個非常良好,一致的代表。”
然而,對於Muse可能使用的可能用途存在太多的不確定性,但是,另一個經常提出的疑問。這不是全部完成嗎?
在問題之前找到解決方案 - 以及在公眾中進行研究的問題
“尋找問題的解決方案”是一種經常在各種AI冒險中徵收的批評,尤其是生成性AI。在許多情況下,這完全是合理的。迄今為止低飲模因,,,,令人反感的宣傳和虛假信息, 或者。
諸如ChatGpt之類的生成文本在獲得每週的用戶方面的表現更好,這些用戶已經佔有數億美元,但在實際上從中賺錢(這些用戶中的絕大多數免費使用它,並且使用它花費了大量的錢)。基於文本的Gen-ai的主要用途似乎仍然可以幫助Instagram影響者和垃圾郵件發送者迅速填寫必不可少的圖像標題,以遊戲算法,或者,或破壞更值得信賴的Google搜索結果,並具有這樣的寶貴建議,例如吃岩石健康。
自然,在穆塞爾(Muse)揭示了Quake 2演示後,同樣的批評再次受到徵詢。獨立開發商Sos Sosowski與Bluesky發行了最廣泛共享的Putdown之一。他寫道:“這與[AI]趨勢非常有軌道。” “一個尋找問題的解決方案。這是一系列“揭示”中的另一個解決方案,“這是錯誤的和破壞的。 ”
在與庫克和霍夫曼(Cook and Hofmann)交談(在基於AI的學術研究的不同領域)工作時,我對此感到特別好奇。研究的實際時間表如何在這裡展開?誰的想法是繆斯?它是如何開始的,還是隨著時間的推移而變化?在學術界,在學術界,首先研究技術並擔心以後會使用它,這是正常的嗎?
庫克說:“曾經在微軟研究劍橋大學研究中發生的事情 - 我曾經認識過一個在那兒工作的人,他們曾經開玩笑說,他們覺得微軟不知道自己的存在,並且以一種很好的方式。因為他們沒有問他們的錢在做什麼,所以那裡的研究人員只會做任何他們感興趣的事情,並且在做得很愉快。”
一個例外? “在那裡的Xbox團隊 - 我認為隨著時間的流逝,人們對AI團隊的所作所為受到了更多審查。”
關於這項最初的研究可能是如何進行的,他有一些建議。有時,他解釋說:“這樣的想法是源於單個研究人員或黑客馬拉松日或喝咖啡的對話。”同樣,“它可能是由更具體的東西誕生的”,例如,如果有一個很大的數據源已經可用。 “所以這就像:聽著,我們有40萬小時的人在玩這款遊戲,一定有我們可以做的事情。”
我向霍夫曼提出了同樣的問題,霍夫曼(Hoffman)提出了詳細的解釋,這似乎與庫克的一些最佳猜測相呼應。她解釋說:“我要說的是,微軟研究非常獨特,因為這是一個非常自下而上的研究組織。”
“我們的職責是推動創新,以推動我們各自地區的藝術開始。”實際上,這意味著將他們的研究與機器學習結合在一起,例如“利用我們可以在視頻遊戲中負責任地獲得的豐富數據,在這些情況下,我們可能能夠達到一個比例或在任何其他應用領域都非常難以收集的量表或多樣性。”那麼,這將是很容易獲得的數據理論,在這種情況下,所有玩家都同意在Xbox上玩遊戲時同意的最終用戶許可協議(EULA)。根據經常簽署的協議,Xbox能夠收集用於訓練其模型的Edge遊戲的視頻數據。
然後,研究領域和可用數據的結合與Microsoft的“豪華”融合在一起,是一家大型的多學科公司。正如霍夫曼所說,這使研究團隊獲得了“與公司其他成員互動並看到人們的想法的機會”,因此,我們與遊戲領域中的人們進行了定期的對話,以了解什麼限制,他們面臨什麼挑戰。他們看到的事情在哪裡? ”然後,研究團隊本身決定“團隊內”,如何指導其研究。在這種情況下,霍夫曼說,有助於“構想”的概念或多或少直接來自與開發人員的對話。
她解釋說:“他們中的許多人認為,由於遊戲開發是如此昂貴,而且原型製作很昂貴,因此每個人都提到他們感覺自己沒有做足夠的念頭和原型製作的奢侈 - 他們感到最終建造的東西的創造力限制了。”
實際上,在項目期間,團隊幾乎停止了工作,而進一步的進一步進展為“平衡”
至於特定的時間表,霍夫曼說,研究團隊在2018年開始與忍者理論進行討論,當時微軟首次購買了開發商,部分原因是兩者都只是基於劍橋。團隊研究了各種選擇,“非常有一個開放式的,探索的觀點 - 因此,從來沒有期望我們所做的任何事情實際上都會投入到奧運會上。”然後,忍者理論提供了工作室在2020年為研究團隊的出血邊緣EULA下收集的遊戲玩法數據,數據是匿名和進口的,並且從那裡進行了研究。
與此同時,團隊實際上選擇使用這些數據的細節還沒有完全解決,直到2022年秋天,霍夫曼從產假返回到一個LLMS(例如Chatgpt)開始使用和公眾意識的世界。她說:“全世界在人工智學發生了變化,從突然之間,廣泛的人口知道什麼是語言模型,他們可以做什麼……所以我們在團隊中退後一步,說,這對我們的工作有何影響?我們可以探索的下一個邊界是什麼?”最終,他們決定:“好吧,我們知道什麼對語言有用,當我們培訓大量實際的人類游戲數據時會發生什麼,這會不會令人驚訝?”
值得注意的是,Muse實際上是團隊並行處理的兩個研究項目之一。霍夫曼說,大約10至15名研究人員的小組通常可以一次容納大約“一到三個”的項目,穆塞爾“在兩年的大部分時間裡,持續的努力持續了努力”,並且在當時的大部分時間裡,一半以上的團隊參與其中。實際上,在項目期間,團隊幾乎停止了工作,在2月下旬對大自然發表的論文的“巨大公共回應”之前,團隊幾乎停止了工作。
要回到這樣的核心問題,即是否是這樣做的標準做法,霍夫曼的回答很清楚:首先,是的,這確實是正常的。其次,她認為她的研究團隊實際上是更多的強調實際使用的實際用途,而不是通常的這種性質研究。
她說:“就研究過程而言,純粹是好奇心的很常見。” “從許多方面來說,我將我們的項目視為不這樣做的一個例子 - 具有諷刺意味的是,因為很多人看不到這一點。我們從技術的好奇心開始,但是一旦我們看到了生活跡象,我們就可以做到這一點 - 我們將互助的團隊組合在一起。我們做了什麼能力。我們做了什麼能力,然後是什麼,然後尤其如此,並確定了尤其是poctime poctiption and posite poctime poctime poctiption,我們尤其如此。
如果該技術仍處於如此早期的階段,為什麼現在向公眾展示它?
霍夫曼(Hofmann)清楚地知道研究的順序以及在此過程中諮詢開發人員的水平,但房間中的大像是Microsoft本身。微軟是世界上最大的公開交易公司之一,並且恰好與其他專注於AI的技術競爭對手一起參加了軍備競賽,因為每種技術都試圖證明並找到一種從投資中獲利的方法。
Openai明顯損失了去年50億美元,預計將在2025年損失兩倍,而在2026年則損失三倍。在2月下旬揭示了微軟已經退出了新的數據中心租賃功率能力等於倫敦的整個運營IT負載,可能表明缺乏滿足其先前計劃的生成-AI供應的需求。
顯然,微軟有一種激勵措施來揭示新的,令人興奮的事情,這些事情儘早使用生成AI來完成。正如庫克所說,雖然穆斯“具有一些非常有趣的品質”,並且“其中有一些對開發人員有用的東西”,但這些事情並不是微軟首先提出研究的重點。 “許多定位似乎確實是:將自己定位為使用AI並投資於AI並在AI進步之上的公司。這似乎是股東的事情。”
做飯,總體上呈現繆斯的方式是一個令人擔憂的問題。對他來說,“研究人員試圖實現的目標和微軟如何提出之間存在區別 - 在這種情況下,我認為這很鮮明。我真的覺得他們有點掛在某種程度上。”
我把這個歸咎於霍夫曼 - 既是為什麼這麼早就向公眾揭示的問題,鑑於霍夫曼本人所說的那樣,它“不努力地”的性質,以及她是否覺得該團隊努力地努力地傳達他們的研究實際上是什麼。
霍夫曼笑著說:“我認為這與我們有很多人的意見和驅動力一樣多,而且可能還有很多。”她解釋說:“其中一部分來自學術研究界。在學術研究中,有一種動力,激勵和意識到,盡可能開放很重要。” “很多研究都沒有掌握在人們可以很快嘗試的人們的手中……我們說,'好吧:這裡有一些可能性;從定義上講,很多研究都不是很容易訪問;因此,這是可以訪問的東西。讓我們脫穎而出。'”
同時,霍夫曼(Hofmann)同意,說正確交流繆斯的全部內容存在一些困難是“很大程度上準確的”。 “我們的學習時間很大:我們如何解釋這裡發生的事情,技術能力是什麼?我們如何表明這一點?借助我們解釋的任何東西,我們將永遠無法接觸到所有人,但我肯定會看社交媒體活動,我正在記下,好的,這是混亂的地方。”
然而,霍夫曼堅持認為,即使“仍然存在很多困惑,其目的是什麼,目的是什麼,以及關於這一目的的辯論,”團隊對團隊有積極的反饋。 “有趣的是,每個對技術成就發表評論的人都稱其為令人印象深刻的,或者[]更加雙曲。因此,在技術層面上,我真的很滿意,因為人們欣賞成就,這真是太棒了。”
“我們非常明確 - 試圖非常明確 - 這是一個技術演示,我們打算在其中展示可能成為可能的事情,以及該領域的發展方式。”
也就是說,霍夫曼承認,早期進行的缺點是對談話的影響。她說:“即使在AI研究確實很快移動並且人們確實推出檔案白皮書或視頻演示的時代,通常也不會發生這種情況。”通常,當研究人員發布可用的內容(例如應用程序)時,公眾會“期望一定水平的產品拋光劑,並且我們之間都沒有準備好。我們非常明確 - 試圖非常明確 - 這是一個技術演示,我們打算在其中顯示出可能成為可能的可能性以及該領域的發展方式。”
她說,目的是至少“給人們那個背景”,以便能夠比較沿線的進步。 “我希望最終,所有這些步驟都將使我們倆都了解如何更清楚地交流,然後與公眾建立了一些理解,這些理解有助於他們解釋那裡發生了什麼。”
從能耗到高級機器人技術的許多道德問題
對於到目前為止我們已經努力的所有大問題和大象,毫無疑問,還有一個集群是最大的:許多道德問題。
正如任何對AI熟悉的人,尤其是生成AI的人,都會知道,每次討論都會出現許多道德問題。其中第一個是竊的問題或知識產權 - 在繆斯女神的情況下略容易得多。 Microsoft擁有出血邊緣開發人員忍者理論,並通過Zenimax顫抖2,因此在EULA之下享有在此處用作培訓數據的遊戲錄像的權利。 (也就是說,當然,關於Microsoft還是任何實體是否有權強加Eulas,這些問題是有道德的問題,這些Eulas會隨意收集用戶數據。
在這裡更適用的是生成AI倫理學的第二個基本問題,這是用於訓練模型的巨大能量,然後在實踐中使用它的環境影響。
霍夫曼談到Quake 2演示時說:“我要說的是,能源成本超出了您的面向球員的實際體驗。”該公共演示使用NVIDIA H100 GPU進行推斷,霍夫曼將其描述為“與LLM或聊天機器人非常相似”,在能源成本方面,也與培訓過程相似。
她補充說:“是什麼讓我對我們可以推動這一點的何處的樂觀是對過去兩個月的見解,圍繞著很少的數據,訓練很少以及我們可以擺脫的模型的小小的洞察力。” “例如,我們並沒有真正為推理成本或更有效的培訓來優化這一點。”
她說:“我無法告訴你什麼時候,但我相信這將在移動電話上使用的消費者GPU或NPU(神經處理單元)運行。”至於培訓成本,“我們越多地了解如何有效地執行這些數據,我們就越能為真正使對此民主化的事物鋪平道路。”我問霍夫曼(Hofmann)是否知道當前能源成本涉及的具體數字,無論是訓練還是“玩”模型,她將我帶到了Microsoft PR。 Microsoft PR告訴我們,除了通過該公司的博客發布的內容之外,他們沒有其他分享的東西。
就更廣泛的道德問題而言,這遠非最後一個。例如,庫克對3D視頻遊戲Gen-ai提出了一個不太引人注目的擔憂:“感覺就像是邁向機器人技術的漫長游戲,”他說。他指出,他說:“顯然,許多研究人員都對這些東西感興趣。”但是,大型科技公司(包括Microsoft以外的公司,例如字母和元數據)至少部分地研究了AI,因為它具體與視頻遊戲相對應,因為他說,“這些項目具有兩個功能:他們需要兩種功能;他們需要進行兩種機器人的機器人,並且非常重要。
他有資格使這一點,並補充說:“我知道繆斯團隊,他們對遊戲感興趣,他們對這些東西感到非常興奮。但是我認為,我們看到大型科技公司在這種遊戲模型中投入更多的投資的原因之一,以及為什麼他們經常將其作為“世界”和類似的事情談論它,是因為遊戲一直是其他研究平台的遊戲。”
據庫克所說,更直接的事實是,“對於由AI提供動力的許多工具的建議,它們的用例似乎是他們會減少就業。似乎沒有辦法解決這一問題。”再加上越來越擔心的是,視頻遊戲老闆可能會在其工作場所實施AI,混合無知和無藝術 - 最近的一份報告基於一些引用匿名開發人員的帳戶,其中一個將其描述為“絕大多數的負面和沮喪的力量” - 這些擔憂有很多理由。
結合在一起,這使得倫理,哲學,科學和財務問題的全能結合 - 鑑於AI的更廣泛的狀態和公眾對此的自然反應,這可能是可以預料的。所有這些問題僅通過這種實質性地在現場受眾面前進行科學研究的實踐而變得更加複雜,這是從純粹的可訪問性的唯心主義中,或者我不禁懷疑這是業務動機。
“因此,有了生成的AI,問題就應該是:我們想要這個嗎?我們不必做任何事情。如果我們不想這樣做,我們甚至不必做遊戲。有時我們忘記了我們確實擁有這種力量。”
對於霍夫曼來說,至少對她來說,這仍然是一個個人值得的項目。她的希望是,無論最終用例如何,這項研究都可以“增加我們可用的互動體驗的財富和廣度”,即通過添加這些夢想(或更準確地適用於可預見的:有點噩夢般的)元素,即AI基礎的遊戲模擬,直接為Artistic neperiant of Artistic nement of Artistic Enderiant Expressive of Artistic Enderess Expersive of Artistic seversive of其他一些東西,或者是其他一些媒介。
她笑著說:“我喜歡視頻遊戲;我最近回到了Quake 2,我什至沒有將自己定義為遊戲玩家,但是沒有足夠的遊戲來滿足我想花時間玩遊戲的時間。”對於她來說,她總結說:“如果人們能夠使用它來創造對他們有意義的東西,並且有些人喜歡它 - 如果我能在其中發揮作用,我會很高興。”
一位研究員,我感覺到庫克仍然對霍夫曼及其團隊表示同情,即使他們的研究的目標和本性截然不同。在談話結束時,我坦率地問他,他是否覺得人們對Microsoft所揭示的內容如此內在地做出反應是正確的,即使所有的交流不幸,善意的意圖以及公眾的學習牢記。
他說:“我認為這是有原因的。” “原因之一就是簡單地說,人們被空間中發生的所有事情所燒毀並傷害了,我認為這只是一種普遍的憤怒和絕望感。而且我認為這是完全可以理解的。”當然,該行業已經經歷了長期的前所未有的裁員和普遍的不確定性。正如庫克所說,畢竟這一切之後,人們都在行業中呆在行業中:“他們之所以這樣做,是因為他們真正喜歡它並且想這樣做,因此,看到他們喜歡以一種不尊重的方式對待的這種創造性實踐,這也傷害了他們。這不僅僅是道德或道德規範或類似的事物。這是他們關心的事情。”他們關心的事情。 ”
當談到這種公開科學的實踐以及如何提出這些發現時,他補充說:“我看到有責任。公眾並不愚蠢,但他們只能處理給出的信息,並且通常會得到非常糟糕的信息。”
“因此,我們必須認為,與這些腸道反應進行合理是有意義的;這是我們必須與之合作的全部。然後希望隨著時間的流逝,將來,我們可以稍微開始建立信任,並找出我們想要保留的AI的位置,並且我們喜歡。”
庫克的最後一個被遺忘的問題也是最重要的。他說:“甚至沒有:它會使遊戲變得更好;但是人們想要它嗎?而且他們不必想要它 - 由於各種原因,技術一直被拒絕。”
“因此,有了生成的AI,問題就應該是:我們不必做任何事情。如果我們不想這樣做,我們甚至不必做遊戲。有時我們忘記了我們確實擁有這種力量;如果我們不想這樣做,我們就可以沒有一些東西。所以玩家應該更多地考慮一下:他們真正想要的遊戲是什麼,因為他們不想做什麼。