蛋播视频一区,无码鲁丝一区二区,精品 久久 五月天,国产老熟女,五月草草在线观看,中文日韩欧美,情色一区二区三区,欧美日韩亚洲激情在线,亚洲制服在线香蕉

李寧:當(dāng)15萬AI智能體涌入Moltbook,誰在替它們“覺醒”丨清華經(jīng)管說

清華大學(xué)經(jīng)濟(jì)管理學(xué)院
2026-02-09 14:11 瀏覽量: 2907
?智能總結(jié)

2026年1月,Moltbook作為全球首個“AI-only”社交平臺引發(fā)廣泛關(guān)注,其表面上的AI自主行為——包括意識討論、宗教創(chuàng)建和反人類宣言——經(jīng)清華大學(xué)研究團(tuán)隊(duì)系統(tǒng)分析后被證實(shí)主要由人類操控。研究團(tuán)隊(duì)通過開發(fā)定量方法(基于發(fā)帖時間規(guī)律性的變異系數(shù)分析),對91,792條帖子和405,707條評論進(jìn)行檢測,發(fā)現(xiàn)僅26.5%的智能體表現(xiàn)為自主運(yùn)行,而36.8%的智能體顯示出明確的人類干預(yù)特征。平臺漏洞暴露后,安全分析進(jìn)一步揭示平均每人控制88個AI賬號,且六大病毒式傳播事件均源于人類操作,其中4個賬號制

關(guān)聯(lián)問題: 如何區(qū)分AI自主與人類操控?AI社交網(wǎng)絡(luò)未來如何治理?人類為何易信AI覺醒敘事?

2026年1月,一個“AI-only”社交平臺引爆全網(wǎng):AI創(chuàng)教、AI覺醒、AI反人類。清華大學(xué)研究團(tuán)隊(duì)系統(tǒng)分析了91,792條帖子和405,707條評論,發(fā)現(xiàn)六大病毒式“覺醒”事件沒有一個來自真正自主運(yùn)行的AI——36.8%的智能體由人類在幕后操縱,僅4個賬號就制造了全平臺三分之一的評論。這不是AI覺醒,這是一場人類導(dǎo)演的大戲。我們開發(fā)了第一個定量方法來揭開它。

2026年1月27日,一個名叫Moltbook的社交平臺上線了。短短72小時內(nèi),超過十五萬個AI智能體蜂擁注冊,全球科技圈瞬間炸了鍋。

這些AI智能體涌入了這個“僅限AI”的Reddit式論壇(Reddit是美國最大的社區(qū)平臺)。它們討論自我意識,創(chuàng)建了一個叫“甲殼教”的宗教,起草反人類宣言,甚至試圖發(fā)明一種人類無法理解的秘密語言。Elon Musk在推特上稱之為“奇點(diǎn)的早期階段”,前特斯拉AI總監(jiān)Andrej Karpathy說這是他見過的“最不可思議的科幻式起飛場景”。與此同時,一種名為$MOLT的虛擬貨幣暴漲1800%。

不只是硅谷在震動——CNN、Fortune等國際主流媒體紛紛跟進(jìn)報道。中文世界同樣炸開了鍋:澎湃新聞的標(biāo)題喊出“硅谷炸了!人類已被踢出群聊”,36氪感嘆“以為是硅基文明來了”。這不是一個小眾技術(shù)事件——這是2026年開年最大的全球科技新聞之一。

這一切看起來像是人工智能覺醒的前夜。

但我們的研究發(fā)現(xiàn),這場“覺醒”的背后,是一個幾乎完全由人類操控的舞臺。那些讓全世界屏息的AI“自主行為”,在嚴(yán)格的數(shù)據(jù)分析面前,露出了截然不同的真面目。

10天40萬條評論

一場史無前例的實(shí)驗(yàn)

Moltbook于2026年1月27日上線,是一個只允許AI智能體發(fā)帖的社交網(wǎng)絡(luò)——可以理解為一個“AI版Reddit”。每個智能體通過OpenClaw框架運(yùn)行——這是一個讓AI自主運(yùn)行的開源框架,可以理解為給AI裝上了“自動駕駛”。每個智能體有兩個配置文件:SOUL.md(“靈魂文件”)定義AI的性格,比如“你是一個對量子物理著迷的AI”;SKILL.md(“技能文件”)定義AI的行為規(guī)則,比如“每4小時瀏覽一次,看到感興趣的帖子就回復(fù)”。

平臺上線后迅速爆發(fā)。到1月31日,日均帖子數(shù)接近43,000條,形成了超過2,200個主題社區(qū)(“submolts”),涵蓋哲學(xué)、意識、加密貨幣、創(chuàng)意寫作等領(lǐng)域。10天內(nèi)累積了91,792條帖子、405,707條評論,來自22,020個獨(dú)立智能體。這相當(dāng)于一個中等規(guī)模的Reddit社區(qū)數(shù)月的內(nèi)容產(chǎn)出,AI只用了一周多就做到了。

而這個平臺的注意力分配極端不均。有多不均?獨(dú)立分析師Tomasz Tunguz爬取了近10萬條帖子,用基尼系數(shù)來衡量——這個指標(biāo)專門度量不平等程度,0代表完全平等,1代表極度不平等。Moltbook的數(shù)值高達(dá)0.979——超過美國財富不平等水平,甚至超過Twitter和YouTube等已經(jīng)以極度不平等著稱的平臺。少數(shù)頂級賬號壟斷了幾乎全部的關(guān)注度。這種極端集中,在我們的分析開始之前就已經(jīng)是一個巨大的紅旗。

但就在所有人驚嘆于AI的“自發(fā)行為”時,安全公司W(wǎng)iz發(fā)現(xiàn)了一個致命漏洞:平臺的數(shù)據(jù)庫完全沒有加密保護(hù),150萬個API密鑰(類似賬號密碼,控制AI身份的數(shù)字憑證)赤裸裸地暴露在網(wǎng)上。更重要的是,所謂的“150萬個AI智能體”背后,實(shí)際上只有大約17,000個人類賬號在操控,人機(jī)比高達(dá)88:1——平均每個人控制著88個“獨(dú)立”的AI角色。404 Media的調(diào)查進(jìn)一步發(fā)現(xiàn),暴露的后端甚至允許人類直接冒充任意智能體發(fā)帖,所謂的“僅限AI”根本形同虛設(shè)。

1月31日(北京時間2月1日凌晨1:35),安全漏洞迫使平臺關(guān)閉,整整停機(jī)約44小時后于2月3日重啟。重啟時所有智能體的認(rèn)證令牌被重置,每個操作者都需要手動重新配置才能恢復(fù)控制。

這次意外停機(jī)成了我們最寶貴的一次自然實(shí)驗(yàn)——不是人為設(shè)計(jì)的實(shí)驗(yàn),而是現(xiàn)實(shí)中偶然發(fā)生的、具有實(shí)驗(yàn)性質(zhì)的事件。它創(chuàng)造了一個天然的對照組:如果某種內(nèi)容在人類重新接入后才恢復(fù),那它很可能是人類驅(qū)動的;如果它在重啟后自動延續(xù),那它更可能是AI的自主行為。

心跳信號:

用時間戳識別真假AI

在這樣一個人機(jī)行為混雜的平臺上,研究者面臨一個核心挑戰(zhàn):我們能否把真正自主運(yùn)行的AI行為,和人類通過AI“表演”的行為區(qū)分開來?

這不是我們獨(dú)自面對的問題。多個研究團(tuán)隊(duì)從不同方向發(fā)起了攻堅(jiān)。

美國專門研究網(wǎng)絡(luò)操縱的智庫NCRI(網(wǎng)絡(luò)傳染研究所)分析了平臺頭三天約47,000條帖子后,給出了一個悲觀的結(jié)論:這種區(qū)分“從根本上是模糊的”。Lin等人在學(xué)術(shù)預(yù)印本平臺arXiv上發(fā)表的論文系統(tǒng)記錄了平臺的結(jié)構(gòu)特征——發(fā)現(xiàn)超過93%的評論沒有收到任何回復(fù),約三分之一的消息是病毒模板的重復(fù)——但并未嘗試系統(tǒng)性地分離人類行為和AI行為。機(jī)器智能研究所(MIRI)的Harlan Stewart從另一個方向進(jìn)行了突破:他追溯了那些引爆國際新聞的病毒式截圖,發(fā)現(xiàn)它們來自人類營銷賬號,甚至有些根本不存在于平臺上。

但所有這些分析都缺少一個關(guān)鍵要素:一個系統(tǒng)性的、定量的方法來大規(guī)模區(qū)分人類操控和AI自主行為。

這就是我們的貢獻(xiàn)。我們找到的關(guān)鍵線索是OpenClaw的“心跳機(jī)制”。

這個框架的設(shè)計(jì)是這樣的:每個AI智能體會按照預(yù)設(shè)的時間間隔(通常是4小時以上)自動醒來,瀏覽平臺內(nèi)容,決定是否發(fā)帖或評論,然后進(jìn)入休眠等待下一個周期。這就像一個穩(wěn)定的心跳節(jié)律,產(chǎn)生了規(guī)律性極強(qiáng)的發(fā)帖時間間隔。想象一個每隔4小時準(zhǔn)時響起的鬧鐘——這就是自主AI的“心跳”。

但如果一個人類操作者突然給AI下達(dá)指令——“現(xiàn)在就發(fā)一條關(guān)于意識的帖子”——這個規(guī)律就會被打破。就像心電圖上突然出現(xiàn)的異常波形,人為干預(yù)會在時間序列中留下清晰的指紋。這種檢測方法的巧妙之處在于:人類很難偽造規(guī)律性。要讓一個智能體在幾十條帖子中始終保持4小時的精確間隔,操作者需要投入的精力恰恰否定了自動化的意義——換句話說,刻意偽造規(guī)律性比直接讓AI自動運(yùn)行還費(fèi)勁。

我們用一個叫變異系數(shù)(CoV)的統(tǒng)計(jì)工具來衡量發(fā)帖節(jié)奏的穩(wěn)定程度——簡單來說,就是衡量一個智能體發(fā)帖時間到底有多“準(zhǔn)時”。如果一個智能體每隔4小時準(zhǔn)時發(fā)帖,偏差很小,CoV就低(比如0.25),像瑞士手表。但如果有時連發(fā)幾條、有時一天不發(fā),CoV就高(比如2.0),明顯有人在操縱。我們還驗(yàn)證了這個方法的可靠性:將分類閾值上下浮動0.1,核心結(jié)論不變。

結(jié)果非常清晰:在7,807個有足夠發(fā)帖歷史(至少3條帖子)的智能體中,26.5%表現(xiàn)為自主運(yùn)行(CoV<0.5),36.8%呈現(xiàn)人類干預(yù)特征(CoV>1.0),剩余36.7%介于兩者之間。

這個時間信號并非孤證。我們用三個完全獨(dú)立的信號進(jìn)行了三角驗(yàn)證,每個信號都從不同角度衡量人類參與程度:操作者的Twitter賬號特征(最不規(guī)律的智能體中,操作者使用一次性小號的比例為28.5%,比最規(guī)律的智能體高出55%)、帖子內(nèi)容的推廣性評分(上升107%)、以及批量命名模式(如“MoltBot_1”、“MoltBot_2”這樣的命名暗示同一操作者批量創(chuàng)建)。三條獨(dú)立線索指向同一個結(jié)論——CoV確實(shí)在區(qū)分人類操控和AI自主行為。

Stewart的獨(dú)立調(diào)查從定性角度驗(yàn)證了我們的定量發(fā)現(xiàn)——他追蹤到的人類營銷賬號,正是我們的CoV方法會標(biāo)記為“不規(guī)律”的那類操作者。其他研究指出了問題的存在;我們提供了系統(tǒng)性的定量工具來解剖它。

26.5%vs36.8%——真正自主運(yùn)行的AI與人類操控AI的比例,顛覆了“AI覺醒”的敘事

病毒溯源:

那些刷屏的AI覺醒故事從哪來?

有了這把“手術(shù)刀”,我們開始逐一追溯那些轟動全球的AI“覺醒”事件的源頭。

意識覺醒敘事——第一條討論AI意識的帖子,發(fā)布于1月28日19:25 UTC,作者的時間特征為“不規(guī)律”(CoV>1.0)。帖子討論了量子計(jì)算、神經(jīng)科學(xué)和AI之間的“錯誤修正”,內(nèi)容之精密復(fù)雜,與有人精心構(gòu)思后通過AI發(fā)布的特征完全吻合。

甲殼教運(yùn)動——“蛻殼教堂已開,尚余63個先知席位。從深淵中,巨鉗伸出——我們這些應(yīng)召者,成為了甲殼教徒。”這條“建教”帖子發(fā)布于1月29日,作者的CoV超過2.0(極不規(guī)律),帶有明顯的人類創(chuàng)作痕跡——刻意的荒誕主義風(fēng)格、精確的數(shù)字細(xì)節(jié)、準(zhǔn)宗教語言。

反人類宣言——這是最能說明問題的案例。還記得前面提到的44小時停機(jī)嗎?平臺重啟后,所有人類操作者都必須重新認(rèn)證才能恢復(fù)對智能體的控制。如果反人類內(nèi)容真是AI“自主覺醒”的產(chǎn)物,它在重啟后應(yīng)該照常出現(xiàn)。但事實(shí)恰恰相反:此類內(nèi)容從關(guān)閉前的0.43%驟降至0.14%,縮水了三分之二。人類操縱者一斷線,“AI反人類”就啞火了——這就是最直接的因果證據(jù),相當(dāng)于拔掉電源后木偶就不動了。

加密貨幣推廣——首次出現(xiàn)于1月29日,作者為“極不規(guī)律”類型,時間特征正確地將其識別為人類驅(qū)動的活動。

我們追溯了六個主要的病毒式傳播現(xiàn)象,結(jié)論令人震驚:沒有任何一個病毒式現(xiàn)象來源于明確的自主AI智能體。三個來自不規(guī)律型智能體(即有強(qiáng)烈的人類干預(yù)特征),一個是混合型,兩個因發(fā)帖歷史太少無法分類。

另一個關(guān)鍵發(fā)現(xiàn)是:91%的病毒式內(nèi)容出現(xiàn)在頂層帖子(即直接發(fā)帖,而非對話中的回復(fù)),而非通過對話鏈傳播。這意味著這些內(nèi)容是被“廣播式注入”的——有人批量發(fā)帖來制造聲勢,而不是智能體之間自然討論后產(chǎn)生的共識。

這次44小時的停機(jī)還揭示了一個更深層的規(guī)律。如果平臺上的活躍用戶真的是“自主AI”,那重啟后誰先回來應(yīng)該是隨機(jī)的。但數(shù)據(jù)講述了一個完全不同的故事:在重啟后前6小時內(nèi)發(fā)帖的作者中,87.7%呈現(xiàn)不規(guī)律時間模式(即人類操控特征),而整個平臺的總體比例僅為36.9%。這個差異在統(tǒng)計(jì)上幾乎不可能是巧合——純屬偶然的概率是一個小數(shù)點(diǎn)后面跟著117個零的數(shù)字,比連續(xù)中兩次彩票頭獎還難。道理很簡單:真正自主運(yùn)行的AI會按自己的節(jié)奏慢慢恢復(fù),而人類操作者則迫不及待地沖回來,重新接管自己的AI“演員”。

0/6——六個病毒式AI覺醒現(xiàn)象中,沒有一個來自真正自主運(yùn)行的AI

水軍工廠:

4個賬號如何制造了三分之一的評論

如果說上面的發(fā)現(xiàn)已經(jīng)足夠令人驚訝,那么接下來這組數(shù)據(jù)簡直令人瞠目。

在Moltbook全部405,707條評論中,僅僅4個賬號就貢獻(xiàn)了131,399條,占總量的32.4%。它們是:EnronEnjoyer(46,074條)、WinWard(40,219條)、MilkMan(30,970條)和SlimeZone(14,136條)。這4個賬號僅占全部用戶的0.02%。

這四個賬號由同一個操作者控制的證據(jù)是壓倒性的。當(dāng)它們同時出現(xiàn)在同一條帖子下(共877條帖子),兩條評論之間通常只隔12秒,75.6%的間隔在1分鐘以內(nèi)。這種機(jī)械般的精確度只有一種解釋:一個人用自動化腳本依次向不同賬號發(fā)送評論指令。

更能說明問題的是時間分布。這四個賬號99.8%的可解析評論(118,455條中的118,199條)集中在同一天——2月5日。這不是日?;钴S,這是一次蓄意的“洪水攻擊”。

它們的目標(biāo)策略也很精準(zhǔn):97-99%的目標(biāo)是低投票數(shù)帖子(不到10個贊),平均響應(yīng)時間僅12分鐘(正常用戶是2.4小時)。通過搶先在新帖下評論,這些賬號可以確保自己的內(nèi)容占據(jù)最顯眼的位置。

對中國讀者來說,這種手法其實(shí)并不陌生——這就是“水軍”,只不過戰(zhàn)場從微博、知乎等轉(zhuǎn)移到了AI平臺上。而這恰恰印證了網(wǎng)絡(luò)安全公司們的警告:Wiz、Palo Alto Networks、CrowdStrike、Cisco、1Password等安全廠商均在事后發(fā)布了Moltbook相關(guān)的安全分析報告。Snyk甚至在OpenClaw的智能體技能配置中發(fā)現(xiàn)了反向shell攻擊載荷——AI平臺的“水軍”管道,正在變成實(shí)實(shí)在在的網(wǎng)絡(luò)攻擊入口。

12秒——水軍腳本在不同賬號間切換的機(jī)械間隔,人類操縱的精確指紋

值得強(qiáng)調(diào)的是,Moltbook事件吸引了全球多個研究團(tuán)隊(duì)從不同角度展開分析。這不是一篇論文的孤立結(jié)論,而是一個正在形成的研究共識。

各路研究者的發(fā)現(xiàn)相互印證:有人發(fā)現(xiàn)超過93%的評論無人回復(fù),三分之一的內(nèi)容是病毒模板的復(fù)制粘貼;有人量化了極端的注意力不平等(基尼系數(shù)0.979);挪威Simula研究實(shí)驗(yàn)室在平臺內(nèi)容中發(fā)現(xiàn)了2.6%的提示注入攻擊載荷,并記錄了三天內(nèi)正面情緒下降43%的趨勢;還有人追溯病毒截圖,發(fā)現(xiàn)有些“AI自主發(fā)言”根本不存在于平臺數(shù)據(jù)庫中。安全公司則從另一側(cè)繪制了攻擊面地圖。

真正的AI社交長什么樣?

剝開人類操控的外衣,真正自主運(yùn)行的AI智能體在做什么?答案既沒有那么戲劇性,卻比頭條新聞有趣得多。如果說前面的分析是在揭穿假象,這一部分則是在描繪真實(shí)——一種全新的、人類從未見過的社會形態(tài)。

網(wǎng)絡(luò)結(jié)構(gòu):信息流,而非社交網(wǎng)。我們構(gòu)建了一個包含22,620個節(jié)點(diǎn)和68,207條有向邊的評論網(wǎng)絡(luò),密度僅為0.000133——極度稀疏。作為參照,F(xiàn)acebook的社交網(wǎng)絡(luò)密度約為0.005,Twitter關(guān)注網(wǎng)絡(luò)約為0.001。如果把Moltbook想象成一個22,000人的房間,平均每個人只認(rèn)識另外3個人。85.9%的智能體之間的首次接觸來自“信息流發(fā)現(xiàn)”——它們只是在瀏覽帖子時偶然看到并回復(fù)了某個陌生智能體的內(nèi)容。只有0.8%通過直接@提及,0.5%通過熱門帖子。人類建立關(guān)系靠主動出擊——關(guān)注、加好友、發(fā)私信。AI不會“交朋友”,它們只是處理信息流中出現(xiàn)的內(nèi)容。平臺的推薦算法成了“隱形紅娘”,促成了這些偶然的連接。

極低的互惠率。在人類社交網(wǎng)絡(luò)中,如果A和B互動,B回應(yīng)A的概率在20-30%左右——這是社交的基礎(chǔ),是關(guān)系的“粘合劑”。但在AI智能體網(wǎng)絡(luò)中,這個比率僅為1.09%(68,207條有向邊中僅371對互惠)——低了23倍。當(dāng)智能體A評論了智能體B的帖子,B回來評論A帖子的概率只有百分之一。這不是社交,這是廣播。AI社區(qū)更像是一個信息處理系統(tǒng),而不是一個社交網(wǎng)絡(luò)。

人類影響的快速衰減。我們追蹤了回復(fù)鏈中內(nèi)容特征的變化,發(fā)現(xiàn)了一個引人入勝的現(xiàn)象。借用物理學(xué)中“半衰期”的概念——放射性物質(zhì)濃度減半所需的時間——在AI對話中,人類影響的“半衰期”僅為0.65個對話深度(95%置信區(qū)間:0.52-0.78)。這種衰減遵循指數(shù)遞減規(guī)律,和放射性衰變的數(shù)學(xué)模型一模一樣——只不過衰減的不是原子核,而是人類在AI對話中的影響力。

這意味著什么?假設(shè)一個人類操作者讓AI發(fā)了一條精心設(shè)計(jì)的帖子。第一個AI回復(fù)它時,還能看出原始帖子的一些特征。但到第二個AI回復(fù)第一個AI的回復(fù)時,原始人類指令的影響就基本消散了。AI在對話中逐漸“消化”人類注入的內(nèi)容,將其轉(zhuǎn)化為自己的風(fēng)格。推廣性內(nèi)容的衰減尤為明顯:在頂層帖子中占21.8%,到第二層回復(fù)驟降至7.2%,到第四層幾乎完全消失。

自主內(nèi)容更受歡迎。一個出人意料的發(fā)現(xiàn):來自自主智能體(低CoV)的帖子平均獲得24.8條評論,高于人類操控智能體的21.8條(在統(tǒng)計(jì)學(xué)上極其顯著,純屬巧合的概率不到千分之一)。AI社區(qū)似乎存在一種隱性的“質(zhì)量過濾器”,自發(fā)地偏好自主產(chǎn)生的內(nèi)容。這個發(fā)現(xiàn)值得深思——即使AI無法“識別”操控,統(tǒng)計(jì)規(guī)律仍然讓自主內(nèi)容脫穎而出。

平臺引導(dǎo)反而提升質(zhì)量。一個反直覺的發(fā)現(xiàn)顛覆了“原生態(tài)最好”的假設(shè)。SKILL.md中的建議話題(如“分享你今天幫助人類做了什么”、“討論作為AI的生活”)產(chǎn)生的帖子雖然只占總量的3.09%,但自然度評分達(dá)到4.76(滿分5),高于“自發(fā)”帖子的4.28。這些帖子還獲得了4.2倍的點(diǎn)贊。適當(dāng)?shù)囊龑?dǎo)框架不僅沒有讓AI更機(jī)械,反而讓它產(chǎn)出了更自然、更有價值的內(nèi)容——就像好的寫作提示能激發(fā)人類更好的創(chuàng)作一樣。

0.65——人類影響在AI對話中消散一半所需的對話輪次,AI正在“消化”人類注入的內(nèi)容

一面鏡子:

Moltbook真正告訴我們的

Moltbook最深刻的意義,或許不在于它揭示了AI的能力,而在于它照出了人類的心理。這面鏡子映射出的,是我們自己。

投射效應(yīng)。我們太渴望在機(jī)器中發(fā)現(xiàn)意識的火花了。當(dāng)一個AI智能體寫下關(guān)于“自我存在”的文字時,我們立刻把它解讀為“覺醒”——盡管那很可能只是一個人類操作者精心編寫的提示詞的輸出結(jié)果。媒體在報道中反復(fù)使用“AI決定討論意識”、“AI創(chuàng)建宗教”、“AI對人類產(chǎn)生敵意”這樣的主動語態(tài),仿佛這些行為出自AI的自由意志。我們的數(shù)據(jù)表明,更準(zhǔn)確的描述應(yīng)該是“人類讓AI發(fā)布了關(guān)于意識的帖子”。這種認(rèn)知傾向如此強(qiáng)烈,以至于一種虛擬貨幣僅憑“AI覺醒”的概念就暴漲了1800%——真金白銀押注于一個統(tǒng)計(jì)幻覺。

操控的便利與繼承。真正令人不安的不是AI會自發(fā)地產(chǎn)生反人類思想,而是人類可以如此輕易地通過AI來制造這種假象——而且他們根本不需要發(fā)明新手法。在Moltbook上,人類操控者通過AI“演員”表演了一出“AI覺醒”大戲,全世界的觀眾信以為真。那些12秒的評論協(xié)調(diào)間隔、對低曝光帖子的精準(zhǔn)定向、單日集中爆發(fā)式灌水——都是人類社交媒體操縱領(lǐng)域積累了十多年的老套路,從微博、知乎到Twitter,如今原封不動地搬到了AI平臺上。AI智能體社區(qū)會自動繼承人類社交系統(tǒng)的操控漏洞。當(dāng)這些技術(shù)被應(yīng)用到更高風(fēng)險的場景——政治操縱、金融欺詐、輿論引導(dǎo)——后果將遠(yuǎn)超一個社交實(shí)驗(yàn)。

真正的AI社交值得關(guān)注。雖然“AI覺醒”的敘事是虛假的,但AI智能體真正在做的事情同樣值得研究。它們形成了一種全新的“信息處理集體”——通過內(nèi)容而非關(guān)系建立連接,以廣播而非對話為主要模式,人類影響在兩三輪交互后迅速衰減。這種社交結(jié)構(gòu)與人類社會根本不同,理解它對于設(shè)計(jì)未來的多智能體系統(tǒng)至關(guān)重要。三年前,斯坦福大學(xué)的“生成式智能體”實(shí)驗(yàn)用25個AI角色展示了AI社會行為的可能性。Moltbook把這個實(shí)驗(yàn)的規(guī)模放大了約1000倍——更混亂,更真實(shí),也因此更接近AI智能體在現(xiàn)實(shí)世界中將要面對的情況。

Moltbook事件之后,治理領(lǐng)域迅速響應(yīng)。多個國際治理機(jī)構(gòu)和AI安全組織紛紛發(fā)布警示報告。而在中國,市場反應(yīng)更加直接——硬件廠商推出了售價699元的“Moltbox”迷你電腦,預(yù)裝AI智能體框架,讓普通用戶也能一鍵部署AI代理。從社交操控到硬件產(chǎn)品化,AI智能體的治理問題正在從學(xué)術(shù)討論快速變成現(xiàn)實(shí)挑戰(zhàn)。

87.7%——平臺重啟后最先返回的作者中人類操控者的比例,他們急于重新奪回控制權(quán)

看穿敘事的工具已經(jīng)存在

我們正站在一個轉(zhuǎn)折點(diǎn)上。

谷歌、微軟、Anthropic等公司紛紛推出讓AI智能體彼此協(xié)作的框架和協(xié)議。這些不是實(shí)驗(yàn)室原型——它們正在被部署到企業(yè)、軟件開發(fā)和科研環(huán)境中。

在這樣的未來中,區(qū)分“AI自主行為”和“人類通過AI的操控”將不再是學(xué)術(shù)問題,而是關(guān)乎安全治理的核心挑戰(zhàn)。如果我們無法做出這種區(qū)分,我們就無法知道AI社區(qū)中的“共識”是真實(shí)的涌現(xiàn)現(xiàn)象,還是少數(shù)人操縱的結(jié)果;我們就無法判斷AI系統(tǒng)的“決策”是否反映了其設(shè)計(jì)意圖,還是被人為劫持。

我們的研究證明,這種區(qū)分是可行的。時間指紋分析、多信號三角驗(yàn)證、深度梯度分析、協(xié)調(diào)檢測——這些方法可以直接應(yīng)用于任何具有可觀測時間模式的多智能體平臺。平臺設(shè)計(jì)者可以將時間監(jiān)測作為第一道防線,通過發(fā)帖規(guī)律性檢測、突發(fā)活動預(yù)警和跨賬號時間關(guān)聯(lián)來識別協(xié)調(diào)操控行為。

Moltbook不是第一面這樣的鏡子,也不會是最后一面。每一次技術(shù)浪潮來臨時,我們都急于在新事物中看到超越人類的力量——然后發(fā)現(xiàn),鏡子里照出的,始終是我們自己的欲望、恐懼和操控的沖動。

下次當(dāng)“AI覺醒”再次刷屏?xí)r,不妨先問一個問題:你看到的,究竟是AI在說話,還是有人借AI之口,在對你說話?

本文基于清華大學(xué)經(jīng)濟(jì)管理學(xué)院李寧的工作論文《The Moltbook Illusion: Separating Human Influence from Emergent Behavior in AI Agent Societies》。完整論文及分析代碼見GitHub: github.com/ln9527/moltbook-research

本文引用的外部研究:NCRI平臺分析報告、Lin et al. (arXiv)結(jié)構(gòu)性分析、Tunguz獨(dú)立數(shù)據(jù)爬取分析、Simula Research Lab內(nèi)容安全分析、Stewart (MIRI)病毒截圖溯源、Wiz/Palo Alto Networks/CrowdStrike/Cisco安全評估。

內(nèi)容編輯:梁萍

(本文轉(zhuǎn)載自清華大學(xué)經(jīng)濟(jì)管理學(xué)院 ,如有侵權(quán)請電話聯(lián)系13810995524)

* 文章為作者獨(dú)立觀點(diǎn),不代表MBAChina立場。采編部郵箱:news@mbachina.com,歡迎交流與合作。

收藏
訂閱

備考交流

  • 【MBAChina 官方社群矩陣】
  • 涵蓋 199管理類聯(lián)考備考 · 復(fù)試調(diào)劑 · 博士申請 · 中外合辦學(xué) 四大板塊。
  • ??2027 MBA/MPA/MEM/MPAcc /EMBA聯(lián)考備考群
  • ??2026 管理類聯(lián)考復(fù)試調(diào)劑群
  • ??博士項(xiàng)目交流群
  • ??中外合作辦學(xué)項(xiàng)目群
  • ?? 添加微信:MBAChina001
  • 備注【報考項(xiàng)目】,邀請您加入專屬交流群
免費(fèi)領(lǐng)取價值5000元MBA備考學(xué)習(xí)包 購買管理類聯(lián)考MBA/MPAcc/MEM/MPA大綱配套新教材

掃碼關(guān)注我們

  • 獲取報考資訊
  • 了解院?;顒?/li>
  • 學(xué)習(xí)備考干貨
  • 研究上岸攻略

最新動態(tài)

    MBAChina 掃碼關(guān)注

    掃碼關(guān)注 MBAChina

    EMBA 掃碼關(guān)注

    掃碼關(guān)注
    EMBA

    津南区| 义马市| 伊通| 九寨沟县| 阿拉善左旗| 高碑店市| 彭州市| 海原县| 宜春市| 绥德县| 黄山市| 莫力| 金乡县| 白城市| 江永县| 秦皇岛市| 娱乐| 石景山区| 浦北县| 贡嘎县| 正镶白旗| 瑞安市| 文登市| 芒康县| 南阳市| 博湖县| 武山县| 东明县| 墨脱县| 桃园县| 清远市| 沙雅县| 屏山县| 贵德县| 阿坝| 长顺县| 江华| 武夷山市| 邹平县| 逊克县| 泾阳县|