復(fù)旦大學(xué)肖仰華:Sora只是開始,AI或讓人類文明進(jìn)入“盤整期”

?智能總結(jié)當(dāng)下,科技與生活的融合程度前所未有地增強(qiáng),人類的社會(huì)經(jīng)濟(jì)結(jié)構(gòu)乃至倫理標(biāo)準(zhǔn)是否會(huì)迎來巨變?復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院肖仰華教授分享了Sora“引爆”的多模態(tài)大模型技術(shù)浪潮將怎樣影響社會(huì)變革,深入思考在與AI的共舞中,人類如何才能引領(lǐng),而非被“領(lǐng)舞”。
在人工智能的浩瀚世界中,Sora也只是冰山一角。
當(dāng)AI技術(shù)“高歌猛進(jìn)”,當(dāng)人們?yōu)锳I的無限潛能感到驚嘆,更加深遠(yuǎn)的思考也隨之而來:人類文明或許將因?yàn)锳I迎來一段“盤整期”。
當(dāng)下,科技與生活的融合程度前所未有地增強(qiáng),人類的社會(huì)經(jīng)濟(jì)結(jié)構(gòu)乃至倫理標(biāo)準(zhǔn)是否會(huì)迎來巨變?復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院肖仰華教授分享了Sora“引爆”的多模態(tài)大模型技術(shù)浪潮將怎樣影響社會(huì)變革,深入思考在與AI的共舞中,人類如何才能引領(lǐng),而非被“領(lǐng)舞”。
關(guān)于AI將如何影響人類社會(huì)經(jīng)濟(jì)發(fā)展,小管推出“智見AI”專題系列,將繼續(xù)邀請(qǐng)商務(wù)智能、平臺(tái)創(chuàng)新、信息技術(shù)商業(yè)價(jià)值等領(lǐng)域的專家學(xué)者和業(yè)內(nèi)資深人士,從產(chǎn)業(yè)應(yīng)用、教育、科研等多角度、多領(lǐng)域分享前沿視角。
肖仰華
復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授、博士生導(dǎo)師,上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任,長(zhǎng)期從事大數(shù)據(jù)、知識(shí)圖譜研究。
AI正在“造世界”
而人類是唯一尺度
Sora絕不僅僅是視頻生成工具,它本質(zhì)上是現(xiàn)實(shí)世界的模擬器,能夠?qū)ξ锢硎澜?、人類社?huì)以及人與世界的復(fù)雜關(guān)系進(jìn)行逼真模擬與生成。
早在ChatGPT誕生后不久,AI專家們就預(yù)判了大模型技術(shù)勢(shì)必要從單一的文本模態(tài)向多模態(tài)發(fā)展的基本趨勢(shì)。Sora的出現(xiàn)代表了文生視頻、視頻編輯與生成的最新進(jìn)展,某種意義上可謂“水到渠成”。
但Sora的能力仍是出乎意料的。生成視頻在長(zhǎng)度、質(zhì)量以及可控性等方面的“碾壓性”呈現(xiàn)只是表面,從深層次來看,Sora絕不僅僅是視頻生成工具,它本質(zhì)上是現(xiàn)實(shí)世界的模擬器,能夠?qū)ξ锢硎澜纭⑷祟惿鐣?huì)以及人與世界的復(fù)雜關(guān)系進(jìn)行逼真模擬與生成。
一直以來,計(jì)算機(jī)領(lǐng)域?qū)τ趶?fù)雜系統(tǒng)的模擬就是個(gè)難題,數(shù)字孿生、游戲引擎、虛擬現(xiàn)實(shí)、數(shù)字仿真、電影制作等領(lǐng)域都涉及對(duì)現(xiàn)實(shí)世界的復(fù)雜系統(tǒng)模擬??梢哉f,Sora的誕生宣告了人工智能在對(duì)現(xiàn)實(shí)世界的模擬方面能力達(dá)到了前所未有的水平,對(duì)傳統(tǒng)相關(guān)工具形成了降維打擊態(tài)勢(shì)。
當(dāng)然,我們也不得不承認(rèn),Sora對(duì)物理世界的模擬仍存在一些局限。例如老太太吹滅蠟燭時(shí),蠟燭“吹而不滅”,違背了現(xiàn)實(shí)世界的物理常識(shí)。又如,在一則中國(guó)舞龍視頻里出現(xiàn)的漢字多屬于編造的錯(cuò)字等。這些問題從根本上來講可以歸結(jié)于高質(zhì)量、高精度數(shù)據(jù)的缺失,或者是相應(yīng)物理場(chǎng)景的數(shù)據(jù)稀缺。但相信只要建立合理的診斷與發(fā)現(xiàn)機(jī)制,很快就可以通過增強(qiáng)長(zhǎng)尾場(chǎng)景的樣本供給,增強(qiáng)合成數(shù)據(jù),以解決相應(yīng)問題。
Sora的重大意義在于宣告了AGI技術(shù)路線在世界模擬這一能力上已然走通,這是具有戰(zhàn)略意義的事件,剩下的“細(xì)枝末節(jié)”提升與完善總體而言屬于戰(zhàn)術(shù)層面。
對(duì)于物理世界的模擬難點(diǎn)在于要符合現(xiàn)實(shí)世界的物理規(guī)律或人類社會(huì)的文化習(xí)俗。Sora基本解決了這方面問題,而且能夠在更大時(shí)空范圍內(nèi)解決。比如在“一個(gè)時(shí)尚的女子行走在東京街頭”這個(gè)視頻中,揭示了人類的物種生物特征,展示了人類文化的基本形態(tài),展現(xiàn)了人類行走的形態(tài),暗含了地球的重力狀態(tài),呈現(xiàn)了豐富的人文環(huán)境,暗示了豐富多彩的人與世界的復(fù)雜關(guān)系……在一個(gè)1分鐘視頻所展示的世界里,所包含的物理環(huán)境和人文環(huán)境的復(fù)雜度是驚人的。
Sora能夠做到如此逼真的模擬,完全吻合物理規(guī)律、文化習(xí)俗、生活常識(shí),各種對(duì)象與要素之間的空間關(guān)系、時(shí)序關(guān)系也合情合理。更為難得的是,即便在一些想象場(chǎng)景里,所生成的“想象”視頻也合乎人類的想象邏輯,而非隨機(jī)亂象。Sora生成視頻的質(zhì)地之精良,給人極為強(qiáng)烈的感覺與認(rèn)知沖擊,完全達(dá)到了電影行業(yè)的最高水平,可以預(yù)見,影視制作行業(yè)的發(fā)展形態(tài)必被重塑。
人人都能創(chuàng)作的時(shí)代即將到來。Sora的大規(guī)模應(yīng)用將會(huì)極大地降低視頻創(chuàng)造、內(nèi)容創(chuàng)作的專業(yè)門檻。內(nèi)容生成的速度、質(zhì)量、效率都會(huì)前所未有地提高,文化娛樂行業(yè)的井噴式發(fā)展或許將成為現(xiàn)實(shí)。在未來,只要有足夠創(chuàng)意并能用自然語言表達(dá)自己的創(chuàng)作腳本,小學(xué)生也可以制作出屬于自己的影視作品。
但是值得注意的是,創(chuàng)造過程的另一個(gè)必要環(huán)節(jié)在于評(píng)價(jià)。要符合人類的真善美標(biāo)準(zhǔn),仍然需要以人類的尺度與標(biāo)準(zhǔn)進(jìn)行檢視。人是萬物的尺度,在AI時(shí)代仍然適用。對(duì)于AI生成內(nèi)容,人類是唯一合格的評(píng)價(jià)者,人是AI的造物主,也是AI的尺度。
超級(jí)認(rèn)知能力
將刷新人類創(chuàng)造力的邊界
對(duì)機(jī)器而言,精準(zhǔn)建模就是“理解”世界的基本方式。機(jī)器對(duì)于世界的建?;蛘J(rèn)知可能比人類更接近世界本原之真相,機(jī)器對(duì)于世界認(rèn)知能力將顯著超越人類個(gè)體,用好機(jī)器的這種超級(jí)認(rèn)知能力將給人類發(fā)展創(chuàng)造全新機(jī)遇。
AI的建模能力可以視作其對(duì)世界的“理解”能力?!袄斫狻币辉~暗含了存在這個(gè)行為的主體,在全部人類歷史上,理解的主體是人,但如果不承認(rèn)機(jī)器作為主體地位的話,便談不上所謂的機(jī)器“理解”。
人類理解世界的結(jié)果也是為了表達(dá)世界,創(chuàng)造新的世界。從這個(gè)意義來講,當(dāng)機(jī)器能像人類一樣重建某個(gè)概念的實(shí)例(比如“在東京街頭行走的時(shí)尚女性”),便可被視作具備一定的理解能力。
對(duì)機(jī)器而言,精準(zhǔn)建模就是“理解”世界的基本方式。Sora借助數(shù)據(jù)驅(qū)動(dòng)方式取得了對(duì)現(xiàn)實(shí)世界的驚人建模與模擬能力,這種能力甚至遠(yuǎn)超人類對(duì)世界的認(rèn)知能力,機(jī)器對(duì)于世界的建?;蛘J(rèn)知可能比人類更接近世界本原之真相,機(jī)器對(duì)于世界認(rèn)知能力將顯著超越人類個(gè)體。
人類的認(rèn)知總體而言是線性的、有限的、簡(jiǎn)單的。在復(fù)雜決策時(shí),人能同時(shí)考慮的決策變量是十分有限的,所謂的抓大放小、抓住主要矛盾的決策方式,本質(zhì)上都是人類認(rèn)知能力不足情況下的妥協(xié)之計(jì)。然而,AI卻可以在數(shù)以百萬計(jì)、千萬計(jì)的決策變量下進(jìn)行決策。
隨著人工智能的進(jìn)一步發(fā)展,機(jī)器的感知維度也更加多元。機(jī)器所感知的范圍遠(yuǎn)遠(yuǎn)超過人類,比如高清攝像頭可以將遠(yuǎn)在幾公里范圍之外的景象看得清清楚楚。機(jī)器的這類超級(jí)認(rèn)知能力仍然有待我們深入研究,用好機(jī)器的這種超級(jí)認(rèn)知能力將給人類發(fā)展創(chuàng)造全新機(jī)遇。
一定程度的自主學(xué)習(xí),人類先驗(yàn)知識(shí)的合理褪除,是成就Sora驚人效果的關(guān)鍵。事實(shí)上,人工智能最近幾年的發(fā)展一而再、再而三地說明,人類專家越少的干預(yù)反而越能產(chǎn)生好的模型效果。自然語言處理領(lǐng)域曾經(jīng)發(fā)生過每開除一個(gè)語言學(xué)專家,機(jī)器翻譯系統(tǒng)的效果就提升幾點(diǎn)的尷尬事實(shí)——這樣的故事也延續(xù)到了大模型時(shí)代。
人類對(duì)物理世界、人類社會(huì)皓首窮經(jīng)所積累的全部知識(shí),在發(fā)展機(jī)器智能面前似乎顯得毫無價(jià)值,甚至起著負(fù)作用。人類對(duì)于發(fā)展機(jī)器智能的真正價(jià)值似乎只在于設(shè)定一個(gè)認(rèn)知世界先驗(yàn)載體(Transformer等模型架構(gòu)),準(zhǔn)備好訓(xùn)練素材(高質(zhì)量訓(xùn)練數(shù)據(jù)),使用大規(guī)模算力進(jìn)行訓(xùn)練。想想人類社會(huì)代際間的經(jīng)驗(yàn)與知識(shí)傳承,我們這代人的知識(shí)與經(jīng)驗(yàn)又有多少會(huì)被我們的下一代所認(rèn)可而繼承呢?
Sora也在刷新我們對(duì)于人類創(chuàng)造能力的理解。從AI實(shí)現(xiàn)視角來看,人類創(chuàng)造的本質(zhì)或許就是在更大的內(nèi)容或者理論生成空間中進(jìn)行合理選擇。ChatGPT和Sora這一類大模型在海量數(shù)據(jù)的喂養(yǎng)下,對(duì)現(xiàn)實(shí)世界進(jìn)行了壓縮表達(dá),進(jìn)而能以較低的信息損失度還原世界本原。
在大模型里的生成過程可以視作是在更大語義空間上進(jìn)行高效的內(nèi)容枚舉或檢索,這個(gè)語義空間可能比人類所能理解的語義空間大得多,這也將幫助人類拓展想象空間,提升人類的創(chuàng)造力。
深融實(shí)體經(jīng)濟(jì),啟發(fā)學(xué)科發(fā)展
Sora背后的技術(shù)與傳統(tǒng)行業(yè)的深度融合將進(jìn)一步釋放生成式AI的產(chǎn)業(yè)價(jià)值,進(jìn)一步推動(dòng)AI與實(shí)體經(jīng)濟(jì)的深度融合,也有利于AI技術(shù)自身的進(jìn)一步迭代演進(jìn)。
AI能力的每一次進(jìn)步,給人類社會(huì)帶來的既是重大機(jī)遇,也是重大挑戰(zhàn)。從應(yīng)用層面上看,Sora背后的技術(shù)絕不會(huì)停留在影視制作,具有重大商業(yè)價(jià)值的無人駕駛或許也將面臨一次重大機(jī)遇。
無人駕駛離不開無人駕駛汽車的感知設(shè)備(包括雷達(dá)和攝像頭),對(duì)汽車行駛路況和周邊環(huán)境進(jìn)行實(shí)時(shí)感知和建模,而借助海量的駕車數(shù)據(jù)、交通攝像頭數(shù)據(jù),Sora從原理上有可能在無人駕駛場(chǎng)景對(duì)汽車行駛環(huán)境進(jìn)行高精度模擬和建模。一旦能在無人駕駛形成應(yīng)用,無疑會(huì)給大模型產(chǎn)業(yè)注入全新推動(dòng)力。
同時(shí),Sora對(duì)現(xiàn)實(shí)世界的建模與模擬能力,相信很快就會(huì)在具有更高價(jià)值、更為廣闊的場(chǎng)景中取得應(yīng)用。例如,工業(yè)制造、游戲引擎、數(shù)字孿生、教學(xué)仿真以及元宇宙等,都將從Sora背后的生成式世界模擬能力中受益。
工業(yè)制造需要大量專業(yè)性極強(qiáng)的仿真和模擬,才能對(duì)設(shè)備運(yùn)行進(jìn)行診斷與預(yù)測(cè)。借助傳統(tǒng)工業(yè)機(jī)理模型的樣本合成,再借助Transformer架構(gòu)一個(gè)面向特定工業(yè)場(chǎng)景的Sora模擬器,從而極大提升工業(yè)場(chǎng)景模擬能力的泛化性,似乎是一個(gè)可行的技術(shù)路線。Sora背后的技術(shù)與傳統(tǒng)行業(yè)的深度融合將進(jìn)一步釋放生成式AI的產(chǎn)業(yè)價(jià)值,進(jìn)一步推動(dòng)AI與實(shí)體經(jīng)濟(jì)的深度融合,也有利于AI技術(shù)自身的進(jìn)一步迭代演進(jìn)。
未來的科學(xué)發(fā)現(xiàn)也將從Sora的進(jìn)展中受益良多。Sora的基本啟發(fā)在于數(shù)據(jù)的充分訓(xùn)練后,可以遵循數(shù)據(jù)背后所蘊(yùn)含的基本原理進(jìn)行建模。Sora視頻生成中所呈現(xiàn)的多是物理規(guī)律、社會(huì)規(guī)律??茖W(xué)認(rèn)知世界有著不同的側(cè)面,細(xì)分為不同的學(xué)科,我們是否可以想象借助AI對(duì)其他學(xué)科,比如化學(xué)、生物等進(jìn)行類似的數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)?
成就Sora的技術(shù)原理遷移到其他學(xué)科是可能的,因?yàn)楸举|(zhì)上所有學(xué)科基本都是表達(dá)各類實(shí)體、概念的時(shí)空規(guī)律、因果規(guī)律。Sora至少已經(jīng)向我們展示了從視頻數(shù)據(jù)學(xué)習(xí)物理和社會(huì)相關(guān)的時(shí)空規(guī)律、因果規(guī)律的可能性。一旦能建模某個(gè)學(xué)科的規(guī)律,進(jìn)而能夠生成某個(gè)學(xué)科的現(xiàn)象,AI就一定能成為助推該學(xué)科發(fā)展的利器。
“打雞血”的同時(shí),
警惕AI無孔不入
人類文明或許將進(jìn)入一個(gè)“亂糟糟”的盤整期,其基本特征是“剪不斷,理還亂”。在這個(gè)盤整期我們需要重新劃定AI應(yīng)用的邊界,建立AI應(yīng)用的準(zhǔn)則。人必須也終將成為AI的尺度,AI的發(fā)展只能以人類的福祉為唯一依據(jù)與標(biāo)準(zhǔn)。
從長(zhǎng)遠(yuǎn)來看,AI也可能帶來一些潛在的社會(huì)問題。“人人皆可創(chuàng)造”看似將帶來所謂“AI平權(quán)”的美好未來,但也意味著由此產(chǎn)生的藝術(shù)作品總量可能遠(yuǎn)超出生命的長(zhǎng)度。
審美對(duì)象的廉價(jià)與泛濫或造成人類審美情趣的倒退和體驗(yàn)欲望的消失。天天過生日,生日的驚喜就會(huì)喪失,美之為美或許正在于稀缺性。每天“打雞血”,靈魂恐怕也會(huì)漸漸麻木到“打哈欠”,Sora等直擊人類體驗(yàn)的AI技術(shù)恐將進(jìn)一步放大人類的“無意義感”。
生活中如果時(shí)刻都被AI賦能,恐將加速人類生存意義的毀滅。無孔不入的AI應(yīng)用,不加節(jié)制的AI濫用,讓“每時(shí)每刻”都是“高光時(shí)刻”會(huì)從根本上毀滅高光時(shí)刻對(duì)于人生的意義。日常生活的“無意義”的最大意義,或許就在于成就那片刻的重大“意義”。AI的應(yīng)用應(yīng)該給人們?nèi)粘I畹陌l(fā)呆與無聊留有余地,要為人類在未來AI時(shí)代的快速發(fā)展留下其在嬰童期田園漫步的美好回憶。
伴隨通用人工智能技術(shù)的進(jìn)一步發(fā)展,人類文明或許將進(jìn)入一個(gè)“亂糟糟”的盤整期,其基本特征是“剪不斷,理還亂”。“剪不斷”的是難以割舍的人工智能給我們帶來的先進(jìn)生產(chǎn)力,以及隨之而來的巨大社會(huì)福利?!袄磉€亂”的是AI作為一種新型智能體,盲目插足人類的倫理道德與情感事物,從而攪亂人類的精神世界。
在AI技術(shù)之前,人類的精神世界百分百體現(xiàn)的是人類自身的意志。而Sora在人類有限提示下完成的視頻生成,內(nèi)容卻已經(jīng)不是人類意志的完整體現(xiàn)。因?yàn)橥欢翁崾荆煌腁I工具,甚至同一個(gè)工具的不同版本或不同輪次,生成結(jié)果都會(huì)有差異,這個(gè)差異所在就是機(jī)器的“意志”體現(xiàn)。
當(dāng)AI生成以假亂真,人類的感覺和知覺系統(tǒng)已經(jīng)無法判斷真?zhèn)巍,F(xiàn)實(shí)世界和虛擬世界的邊界日益模糊,將造成人類感知與認(rèn)知功能紊亂與障礙。一個(gè)人類文明盤整期的到來似乎是必然的,在這個(gè)盤整期我們需要重新劃定AI應(yīng)用的邊界,建立AI應(yīng)用的準(zhǔn)則。
AI發(fā)展具有時(shí)代必然性,是先進(jìn)生產(chǎn)力的代表。我們應(yīng)該以積極心態(tài)擁抱AI技術(shù)浪潮的到來,同時(shí)做好AI發(fā)展所引發(fā)的社會(huì)變革的應(yīng)對(duì)與準(zhǔn)備工作。
很多人認(rèn)為AI是平權(quán)的機(jī)會(huì),但如果不加以合理干預(yù)和監(jiān)管,AI更可能成為集權(quán)的利器。人類在科幻電影中不止一次表達(dá)“超級(jí)英雄”很容易被超能力反噬的擔(dān)憂,當(dāng)AI被視為人類發(fā)展的“超能力”,如果不加以合理干預(yù)和監(jiān)管,人類同樣會(huì)被這種能力反噬。
沒有對(duì)于AI的積極干預(yù)、引導(dǎo)與規(guī)范,AI有可能成為人類社會(huì)發(fā)展“不可承受之重”。所以,人必須也終將成為AI的尺度,AI的發(fā)展只能以人類的福祉為唯一依據(jù)與標(biāo)準(zhǔn)。
(本文轉(zhuǎn)載自復(fù)旦管院 ,如有侵權(quán)請(qǐng)電話聯(lián)系13810995524)
* 文章為作者獨(dú)立觀點(diǎn),不代表MBAChina立場(chǎng)。采編部郵箱:news@mbachina.com,歡迎交流與合作。
備考交流
- 【MBAChina 官方社群矩陣】
- 涵蓋 199管理類聯(lián)考備考 · 復(fù)試調(diào)劑 · 博士申請(qǐng) · 中外合辦學(xué) 四大板塊。
- ??2027 MBA/MPA/MEM/MPAcc /EMBA聯(lián)考備考群
- ??2026 管理類聯(lián)考復(fù)試調(diào)劑群
- ??博士項(xiàng)目交流群
- ??中外合作辦學(xué)項(xiàng)目群
- ?? 添加微信:MBAChina001
- 備注【報(bào)考項(xiàng)目】,邀請(qǐng)您加入專屬交流群

掃碼關(guān)注我們
- 獲取報(bào)考資訊
- 了解院?;顒?dòng)
- 學(xué)習(xí)備考干貨
- 研究上岸攻略
最新動(dòng)態(tài)
活動(dòng)日歷
- 01月
- 02月
- 03月
- 04月
- 05月
- 06月
- 07月
- 08月
- 09月
- 10月
- 11月
- 12月
- 06/01 6月1日直播預(yù)告:香港理工大學(xué)SPEED學(xué)院_全新碩士課程專場(chǎng)!26fall入學(xué)!
- 06/03 6月3日活動(dòng)報(bào)名 | 北大光華-凱洛格國(guó)際EMBA項(xiàng)目Coffee Chat@上海
- 06/03 【活動(dòng)報(bào)名】中國(guó)科學(xué)技術(shù)大學(xué)科技商學(xué)院專題講座重磅開啟!
- 06/04 6月4日 席位鎖定中 | 香港中文大學(xué)(深圳)MBM2027級(jí)招生說明會(huì)
- 06/06 長(zhǎng)春理工大學(xué)2027級(jí)工商管理碩士(MBA)考生見面會(huì)
- 06/06 重磅!上財(cái)?shù)嗡呓?027級(jí)全日制金融碩士“新興金融探索日”活動(dòng)通知
- 06/06 深圳場(chǎng) | 清華-康奈爾雙學(xué)位金融MBA公開課暨2027級(jí)招生說明會(huì)報(bào)名中!
- 06/06 上海 | 紫荊課堂暨2027級(jí)清華MBA招生咨詢會(huì)報(bào)名開啟!
- 06/06 浪潮已至|南科大科創(chuàng)MBA 2027級(jí)招生啟動(dòng)大會(huì)來了
- 06/06 活動(dòng)報(bào)名 | “迅策科技”校友企業(yè)參訪暨清華五道口金融EMBA深圳招生說明會(huì)
熱門資訊
掃碼關(guān)注 MBAChina
掃碼關(guān)注
EMBA








