蛋播视频一区,无码鲁丝一区二区,精品 久久 五月天,国产老熟女,五月草草在线观看,中文日韩欧美,情色一区二区三区,欧美日韩亚洲激情在线,亚洲制服在线香蕉

諾獎得主薩金特教授論“人工智能的來源”

北京大學(xué)匯豐商學(xué)院
2022-11-09 17:40 瀏覽量: 6175
?智能總結(jié)

諾獎得主薩金特教授論“人工智能的來源”

日前,2011年諾貝爾經(jīng)濟學(xué)獎得主、北大匯豐薩金特數(shù)量經(jīng)濟與金融研究所榮譽主任托馬斯·薩金特(Thomas J. Sargent)教授主編的《薩金特數(shù)量經(jīng)濟與金融研究所時訊》(第四期)正式上線。其中,薩金特教授在其為時訊撰寫的獨家首發(fā)文章《人工智能的來源》中,分享了對人工智能與機器學(xué)習(xí)的理解與思考,以下為全文內(nèi)容。

托馬斯·薩金特

作為一個并不全面的見證者,我在本文中描述了人工智能與機器學(xué)習(xí)是如何被發(fā)明的,并列舉了該領(lǐng)域的重要人物以及他們的思想。

1簡介

這篇文章與人類、人工智能以及學(xué)習(xí)相關(guān)。我所謂的人工是指“非人類”。在描述人工智能和機器學(xué)習(xí)之前,為了表達(dá)我對自然和人工智能的理解,我將首先通過描述有智識的人類通過結(jié)合先天與后天技能來完成的兩類重要活動,即識別模式和做出選擇。智能的其他方面是對時間和空間的認(rèn)識,以及對其他人的同情和共鳴。一代又一代的父母把從上一輩傳承的技能和觀點,以及自己學(xué)到的新思想傳給孩子。在描述了伽利略·伽利雷(Galileo Galilei)和查爾斯·達(dá)爾文(Charles Darwin)如何將他們的先天才能與教科書上的知識相結(jié)合,繼而創(chuàng)造出科學(xué)上的突破之后,我將講述現(xiàn)代研究人員如何設(shè)計出能夠識別模式和做出選擇的計算機程序1。

我在這篇文章里提及了許多“樹”,即各種概念和技術(shù),這對普通讀者來說可能是新事物,但我希望我對機器學(xué)習(xí)這片“森林”的描述是清楚的。若有讀者好奇地想了解更多復(fù)雜的“樹”,我建議他們使用專業(yè)在線搜索引擎或查看本文結(jié)尾處參考文獻(xiàn)中的內(nèi)容。

2人類智能

我從認(rèn)知心理學(xué)家史蒂芬·平克(Steven Pinker)的《白板》(The Blank Slate)第13章的內(nèi)容開始講。平克這本書(2003)的第13章題為《走出我們的深淵》。如果你是高中生或大一新生,或是喜歡思考教育的目的,推薦你閱讀這一章?;趯θ祟愓J(rèn)知障礙的理解,史蒂芬·平克對在高中和大學(xué)應(yīng)該學(xué)習(xí)什么內(nèi)容以及為什么學(xué)習(xí)提供了建議。他在開章描述了進(jìn)化使我們自然擅長的一些技能,以及我們必須借助學(xué)習(xí)才能獲取的其他技能。

在人類10萬年的歷史和史前史中,進(jìn)化未賦予人類的那些技能其實并不重要。但是,現(xiàn)代生活使一些進(jìn)化未賦予我們的東西變得前所未有地重要。平克總結(jié)出了四個此類學(xué)科。

1.物理學(xué)關(guān)于重量、時間、空間、運動、能量、熱和光的理論。

2.生物學(xué)關(guān)于生命、出生和死亡的理論。

3.統(tǒng)計學(xué)描述不確定性以及識別和解釋相對頻率的方法。

4.經(jīng)濟學(xué)關(guān)于工作、生產(chǎn)、分配、價格和數(shù)量的描述。

在現(xiàn)代生活中,只有了解了這四個領(lǐng)域才能做出明智的個人和公共決策。但我們的“直覺”經(jīng)常讓我們在這些領(lǐng)域中犯錯。出于行文目的,暫且將“直覺”定義為我們進(jìn)化出來的能夠快速理解各種情況的思維方式。它的同義詞或許是“常識”,即我們本能地就能夠理解的東西。史蒂芬·平克描述了我們自然、直覺的理論在這四個領(lǐng)域中是如何將我們引入歧途的,只有通過受教育才能改進(jìn)。

平克列舉了一些四個領(lǐng)域相關(guān)的絕佳例子,以說明我們的常識和直覺并不能幫助我們理解現(xiàn)代物理學(xué)。根據(jù)理查德·費曼(Richard Feynman)和其他杰出的物理學(xué)家的說法,“常識”難以幫助我們理解廣義相對論和量子力學(xué)。平克講述了我們?nèi)绾芜M(jìn)化出統(tǒng)計計算的能力,這種能力在過去靠狩獵和采集為生時很有幫助,它讓我們能夠計算一些事件出現(xiàn)的幾率。但是,相比從前,今日的重要風(fēng)險事件發(fā)生的幾率非常低。而我們的自然稟賦不擅長應(yīng)對小概率事件。因為在公共決策中無法正確平衡低概率風(fēng)險事件的成本和收益,我們付出過昂貴的代價。平克描述了進(jìn)化如何給了我們的祖先一套關(guān)于生產(chǎn)和交換的經(jīng)濟理論,然而這些理論并沒能讓我們理解勞動分工、分配、市場、中間商、中介、穩(wěn)定市場的投機行為和利潤。事實上,我們天生就誤解了這些東西,在反復(fù)發(fā)生的針對中間商和貿(mào)易商、投機者和流動性提供者的征用和大屠殺中,經(jīng)常出現(xiàn)悲慘的后果,而受害者往往是少數(shù)民族成員。

這些認(rèn)知缺陷為平克在該書第13章呼吁重新設(shè)計課程的建議提供了理論基礎(chǔ)。平克將教育描述為一種補償我們先天的認(rèn)知限制、利用我們先天學(xué)習(xí)能力的技術(shù)。他呼吁對學(xué)術(shù)課程進(jìn)行大刀闊斧的改革,傳授那些能幫助我們在現(xiàn)代社會享受生活和做出正確決定的技能:生物學(xué)、統(tǒng)計學(xué)和經(jīng)濟學(xué)。他也承認(rèn),多教授這些科目意味著少教授其他科目。

2.1人工智能和我們天生的認(rèn)知極限

通過閱讀第13章,我們可以了解人類是如何寄希望于“人工智能”來補充并超越與生俱來的自然人類智能。

這里潛藏著一個悖論,即創(chuàng)造人工智能和機器學(xué)習(xí)的主要技術(shù)工具來自物理學(xué)、生物學(xué)、統(tǒng)計學(xué)和經(jīng)濟學(xué),而這些領(lǐng)域正是我們先天認(rèn)知有限的。換句話說,我們試圖在自己天生不擅長的領(lǐng)域創(chuàng)造人工智能和機器學(xué)習(xí)。機器學(xué)習(xí)和人工智能的早期先驅(qū)和實踐者通過透徹地學(xué)習(xí)以及富有想象力地使用現(xiàn)有的最優(yōu)化分析技術(shù),來彌補他們在自然認(rèn)知方面的不足。

3兩位機器學(xué)習(xí)的先驅(qū)

3.1伽利略

Galileo Galilei

意大利物理學(xué)家、數(shù)學(xué)家、天文學(xué)家及哲學(xué)家

因為提倡地球圍繞太陽旋轉(zhuǎn),17世紀(jì)初偉大的意大利數(shù)學(xué)家、科學(xué)家、物理學(xué)家、天文學(xué)家伽利略(1564-1642)最終被宗教裁判所逮捕。在被逮捕的許多年前,伽利略從事了一項研究,我認(rèn)為這項研究演繹了“機器學(xué)習(xí)”方法的本質(zhì)。伽利略(1)設(shè)計并進(jìn)行實驗來收集數(shù)據(jù);(2)反復(fù)觀察數(shù)據(jù),試圖發(fā)現(xiàn)模式;(3)通過擬合一個函數(shù)來減少數(shù)據(jù)的維度;(4)將該函數(shù)解釋為自然界的一般規(guī)律。伽利略的策略為機器學(xué)習(xí)和人工智能的意義提供了一個絕佳例子,也許是第一個例子。

自然地,我說的是伽利略的“斜面實驗”以及他對數(shù)據(jù)進(jìn)行的處理和降維。伽利略試圖發(fā)現(xiàn)控制落體動力的自然規(guī)律。也許你在想“這很容易,只要應(yīng)用艾薩克·牛頓(Isaac Newton)的萬有引力定律就行了”。不要太著急下定論:牛頓這時候還沒有出生呢。當(dāng)時被廣為接受的主流理論是亞里士多德(Aristotle)在2000年前宣稱的:較重的物體比較輕的物體下落得快。

伽利略想用實證方法來研究亞里士多德的理論。為什么不直接扔下不同重量的球,以便測量它們下落的速度呢?伽利略無法這樣做,因為不論多重的球落下的速度都比當(dāng)時的鐘能準(zhǔn)確測量的速度快得多。因此,伽利略決定建造不同角度的光滑斜面,并調(diào)整角度,使落下的球的速度足夠慢,這樣他就可以用他擁有的時鐘測量它們沿平面的移動速度。對于一個長度l和高度h的平面,比率h/l決定了平面的角度。伽利略扔下一個球,仔細(xì)測量了球沿平面移動的距離d,將之計作球被扔下后經(jīng)過的時間t的函數(shù)。他做了一個有兩欄的表格,其中記錄了ti 和di(i = 1,...),n為他在每個實驗中的n個測量時間。對于一個給定的實驗,他將di和ti繪制在一起。他對各種不同重量的球進(jìn)行了實驗,設(shè)置了不同的l和h (即斜面的不同角度)。然后他凝視自己記錄的圖表,發(fā)現(xiàn)一個驚人的現(xiàn)象:在所有的圖表中,行進(jìn)的距離與經(jīng)過的時間的平方成正比,與球的重量和平面的角度無關(guān)。他推斷出一個公式:

請注意,出人意料的是,球的重量不在右邊的函數(shù)中。因此,球的下落速度顯然是與它的重量是無關(guān)的。因此,通過對他的實驗數(shù)據(jù)進(jìn)行函數(shù)擬合,伽利略同時完成了數(shù)據(jù)降維和概括。他發(fā)現(xiàn)了一個自然法則,這個法則成為50年后艾薩克·牛頓思想的一個重要啟發(fā)。

伽利略的斜面實驗具有現(xiàn)代機器學(xué)習(xí)和人工智能的所有要素。他一開始不知道世界是如何運作的,也沒有一個好的理論。他所做的完全是無理論的。所以他進(jìn)行了一系列的實驗,收集了數(shù)據(jù)表,每個實驗一個表,以球的重量以及斜面的長度l和高度h為索引。他從許多數(shù)據(jù)表中推導(dǎo)(即“擬合”)出一個函數(shù),結(jié)果發(fā)現(xiàn)這個函數(shù)只由一個新數(shù)字決定,即“參數(shù)”g。2

我并不完全理解是什么啟發(fā)了伽利略去設(shè)計他的實驗,收集那些測量數(shù)據(jù),并通過擬合函數(shù)來減少測量數(shù)據(jù)的維度。不過我確實知道伽利略擁有的工具,以及本可以幫助他、但他卻沒有的工具。尤其是,他不知道微分和積分計算——幾十年后,這些工具才被費馬(Fermat)、牛頓和萊布尼茨(Leibniz)發(fā)明出來。但伽利略確實非常了解幾何和代數(shù),也十分熟悉歐幾里得(Euclid)和阿基米德(Archimedes)。如果沒有這些工具,純粹的靈感和對亞里士多德理論的懷疑態(tài)度是遠(yuǎn)遠(yuǎn)不夠的。3

3.2達(dá)爾文

Charles Robert Darwin

英國的博物學(xué)家、生物學(xué)家、進(jìn)化論的奠基人

下一個故事有關(guān)經(jīng)濟理論在達(dá)爾文(1809 - 1882)的“自然選擇物種進(jìn)化”學(xué)說中所起的作用。哈耶克(Hayek)(2011 年,附錄 B)引用了西蒙·N·巴頓(Simon N. Patton)于1899 年發(fā)表的一段聲明:“......正如亞當(dāng)·斯密(Adam Smith)是最后一個道德家和第一個經(jīng)濟學(xué)家一樣,達(dá)爾文是最后一個經(jīng)濟學(xué)家和第一位生物學(xué)家?!?/p>

達(dá)爾文使用原始經(jīng)驗主義和降維來構(gòu)建他的理論。他不知道基因是什么,也不知道DNA是什么。他“知道”的是觀察他培育的鴿子和自然界的動植物所收集來的一個龐大的數(shù)據(jù)集。僅通過研究鴿子的數(shù)據(jù),他就推斷出了三個基本原則中的兩個。

1.自然變異

2.新變化的統(tǒng)計繼承

作為一名鴿子育種者,達(dá)爾文利用這兩個原則來選擇理想的性狀,然后依靠統(tǒng)計遺傳來培育新的鴿子品種。幼鴿從父母那里獲得了一些特征?!安闋査埂み_(dá)爾文的選擇”,而不是自然選擇指導(dǎo)其育種。有很長一段時間,達(dá)爾文并不知道在自然中選擇的原理是什么。然后,他閱讀了托馬斯·馬爾薩斯(Thomas Malthus)的《人口原理對社會未來進(jìn)步的影響》。馬爾薩斯描寫了一場斗爭,這種斗爭是因人口繁殖速度超過食物產(chǎn)量增速而引發(fā)的。在此前提下,食物的可得性制約著人口數(shù)量,個體需要為生存斗爭。馬爾薩斯這方面的論證為達(dá)爾文提供了他缺失的那塊拼圖:從生存斗爭中產(chǎn)生的自然選擇。出生的嬰兒數(shù)量超過了食物所能喂養(yǎng)的數(shù)量。達(dá)爾文(1859)的引言部分將其第三個基本原則歸功于馬爾薩斯。

3.競爭選擇——為了生存的斗爭

一些杰出的博弈論者和經(jīng)濟學(xué)家現(xiàn)在經(jīng)常使用進(jìn)化論作為經(jīng)濟和社會動態(tài)的來源。也許這些人認(rèn)為他們從達(dá)爾文那里得到了啟發(fā)。但實際上達(dá)爾文理論的一個重要部分是從經(jīng)濟學(xué)家那里得到的。正如哈耶克(2011 年版,附錄 A)指出的,達(dá)爾文1838年對亞當(dāng)·斯密的研究為他提供了生物進(jìn)化自然選擇理論的一個關(guān)鍵組成部分。哈耶克(2011)還指出,文化進(jìn)化論早在1800年之前就已被經(jīng)濟學(xué)家和社會學(xué)家廣泛接受。

達(dá)爾文的研究策略是一個將龐大的數(shù)據(jù)集降維,以提取基于三個基本原則的低維模型的很好的例子。數(shù)據(jù)收集,運用三個基本原則進(jìn)行數(shù)據(jù)降維,最后進(jìn)行理論概括:多么非凡的研究策略!

像伽利略一樣,達(dá)爾文也不是從零開始。他在生物學(xué)、地質(zhì)學(xué)和經(jīng)濟學(xué)方面都很博學(xué)。對這些領(lǐng)域既有知識的深刻理解是他能夠突破已知、進(jìn)行創(chuàng)新的基礎(chǔ)。他是一個“宏觀”的人,因為他的理論的前兩個支柱,即新特征的變異和繼承,并沒有“微觀基礎(chǔ)”。對于在他的三個支柱理論下,需要多長時間,生物的進(jìn)化才能夠與古生物學(xué)與生物學(xué)已知的證據(jù)相符合,他也說得很模糊。?

4人工智能

上文都在談?wù)撊祟惖闹腔酆挽`感,現(xiàn)在讓我們轉(zhuǎn)向人工智能或機器學(xué)習(xí)。它是什么呢?

我所說的人工智能是指模仿人類完成一些“智能”事情的計算機程序?!皺C器學(xué)習(xí)”主要是通過使用微積分和統(tǒng)計來完成模式識別。參照伽利略運用斜面實驗測量下落物體速度的方法,設(shè)計者開發(fā)出能夠進(jìn)行機器學(xué)習(xí)和人工智能的計算機芯片和程序。因此,將函數(shù)視為“如果-那么”語句的集合。將“如果”部分想象為函數(shù)中的橫坐標(biāo) x,并將“那么”部分想象為y縱坐標(biāo)。使用計算機識別模式涉及:(1)將數(shù)據(jù)劃分為x和y部分,(2)猜測f的函數(shù)形式,然后(3)使用統(tǒng)計的方法從不同的x和y數(shù)據(jù)中推斷f。“統(tǒng)計學(xué)”這門學(xué)科提供了用于推斷或“擬合”函數(shù)f的工具。

舉一個簡單的例子。假設(shè)在地球上的給定位置,您在一年中的每一天都記錄了從日出到日落的“白天”長度,在x軸上按照1到365記錄天數(shù),在y軸上記錄從日出到日落的時長,制作一個以x和y為兩列的表格。該表有365乘以2等于730個數(shù)字。現(xiàn)在繪制并凝視它們。猜測函數(shù)y=cos(α +βx )也許能很好地總結(jié)這些數(shù)據(jù)。使用微積分求使函數(shù)擬合得很好的兩個參數(shù)α,β的值,它們最小化了

你會發(fā)現(xiàn)這個函數(shù)擬合得很好(盡管不完美)。通過總結(jié)數(shù)據(jù)(也可稱為進(jìn)行“數(shù)據(jù)壓縮”或“數(shù)據(jù)縮減”),我們得以找出了一個經(jīng)驗法則(一個函數(shù))來“概括”我們的發(fā)現(xiàn),并可以使用這個法則來預(yù)測365天樣本以外的“白天”時長。

5人工智能工具

機器學(xué)習(xí)和人工智能的核心方法來自以下學(xué)科:?

1.物理學(xué)

2.生物學(xué)

3.統(tǒng)計學(xué)

4.經(jīng)濟學(xué)

接下來我們將逐一分析這四個學(xué)科。

5.1物理學(xué)

歐拉(Euler)、拉格朗日(Lagrange)和漢密爾頓(Hamilton)在18世紀(jì)和19世紀(jì)的研究成果擴充和完善了運用微積分最優(yōu)化時變函數(shù)的積分方法。這為21世紀(jì)哈密頓·蒙·卡特羅(Hamiltonian Monte Carlo)的模擬技術(shù)奠定了基礎(chǔ),該技術(shù)繼而推動了復(fù)雜的貝葉斯估計和機器學(xué)習(xí)的技術(shù)發(fā)展??藙谛匏梗–lausius)、玻爾茲曼(Boltzmann)和吉布斯(Gibbs)在19世紀(jì)創(chuàng)造了用統(tǒng)計學(xué)來描述熱力學(xué)的概念。他們根據(jù)熵定義了熱力學(xué)第二定律,熵是似然比的期望值,即一個概率分布與另一個概率分布的比率。其中一個概率分布是一個平坦的均勻分布,它在統(tǒng)計上代表完全無序,另一個分布則在精確的、統(tǒng)計學(xué)意義上代表“有序”。在20世紀(jì)末和21世紀(jì)初,熵為許多機器學(xué)習(xí)算法提供了一種測量擬合模型的概率分布與數(shù)據(jù)經(jīng)驗分布之間差異的方法。保羅·薩繆爾森(Paul Samuelson) (1947) 和他的同事們將這些技術(shù)和其他技術(shù)從數(shù)學(xué)物理學(xué)引入經(jīng)濟學(xué),這將為人工智能和機器學(xué)習(xí)更多工具的發(fā)展奠定基礎(chǔ)。

5.2數(shù)學(xué)生物學(xué)

生物學(xué)從時間和空間上研究物種的繁殖和變異模式。模式可以從“宏觀”和“微觀”層面上檢測,這取決于研究的單位——個人、動物、DNA、RNA,或組成它們那些更小的分子。生物學(xué)的數(shù)學(xué)理論(例如,費爾德曼(Feldman,2014) 和費爾森斯坦(Felsenstein,1989)通過以隨機差分或微分方程的形式構(gòu)建動態(tài)系統(tǒng)來將這些模式構(gòu)成數(shù)學(xué)體系。在微觀層面,主要涉及將DNA編碼為二進(jìn)制字符串,以便分析師在該字符串上通過切割和重組進(jìn)行突變和有性生殖的數(shù)學(xué)運算。例如,參見霍蘭德(Holland,1987)。

5.3統(tǒng)計學(xué)

現(xiàn)代數(shù)理統(tǒng)計認(rèn)為“概率”有兩種可能的含義:?

? 頻率論者認(rèn)為,概率是在觀察一個非常大的獨立且同分布的隨機變量樣本后可以預(yù)期的相對頻率。

? 貝葉斯解釋,概率是關(guān)于未知隱藏“狀態(tài)”或“參數(shù)”的不確定性的主觀表達(dá)。

現(xiàn)代統(tǒng)計學(xué)運用一系列工具來:(1) 制定一個函數(shù)集,這些函數(shù)的具體形式取決于一系列參數(shù),有時參數(shù)還取決于更高層的超參數(shù);(2) 從樣本中推斷或“估算”這些參數(shù);(3) 以一個理性人的角度,描述這些推斷的不確定性;(4)使用這些擬合函數(shù)的概率版本進(jìn)行“樣本外”預(yù)測。這些機器學(xué)習(xí)的基本技術(shù)依賴于對微積分的應(yīng)用,正如我們之前提過,伽利略當(dāng)時并沒有這些工具。

5.4經(jīng)濟學(xué)經(jīng)濟學(xué)是研究人類群體如何有目的地利用和分配稀缺資源的學(xué)科?,F(xiàn)代經(jīng)濟理論是自洽環(huán)境中的多人決策理論。在一致的經(jīng)濟模型中的抽象智能人是“理性的”,因為他們處理有限優(yōu)化問題皆基于他們對自身所處環(huán)境的共同、正確的理解。?這種多人決策理論的兩個主要類別是?

? 博弈論

? 一般均衡理論

這些理論中的主要因素和內(nèi)容包括

? 約束

? 不確定性

? 去中心化和并行優(yōu)化

? 交易網(wǎng)絡(luò)的賬本

? 價格

? 競爭

在這些模型中,一個個體的決策規(guī)則構(gòu)成了其他個體選擇問題的約束集的一部分。這種約束通過模型的“均衡條件”產(chǎn)生。個體約束優(yōu)化問題的解中,可以導(dǎo)出個人價值,其中包含用以分配資源的有用信息。

這些經(jīng)濟模型描述了“并行處理”和去中心化的決策過程。一個被稱為“均衡”的安排有助于調(diào)和不同個體之間的自私?jīng)Q策以及物理資源的限制。嚴(yán)格的均衡概念在這兩個主流框架中占據(jù)主導(dǎo)地位。定義均衡是一件事,計算均衡則是另一回事。因此,著名的經(jīng)濟理論家們多年來一直在與維度的詛咒斗爭、尋求計算競爭均衡分配和價格體系的可靠方法。對這一事業(yè)做出了里程碑意義的貢獻(xiàn)的經(jīng)濟理論家有艾羅與赫維克茲(Arrow and Hurwicz,1958)、艾羅(Arrow et al.,1959)、艾羅(Arrow,1971)、二階堂與宇澤(Nikaido and Uzawa,1960)以及斯卡夫(Scarf,1967)、斯卡夫(Scarf et al.,2008)。這些算法運用了計算方案,追蹤個人和社會價值量,以及人們想要的商品和活動的數(shù)量與社會安排之間的差距。

計算均衡的研究工作最終發(fā)現(xiàn),均衡的計算與有限理性個體向均衡的收斂之間具有密切聯(lián)系。布瑞與克雷普斯(Bray and Kreps,1987)以及馬賽特與薩金特(Marcet and Sargent,1989)提出了“在均衡中學(xué)習(xí)”和“學(xué)習(xí)均衡”之間的重要區(qū)別。馬賽特與薩金特(Marcet and Sargent,1989)和薩金特(Sargent et al.,1993)通過使用隨機近似的數(shù)學(xué)方法(例如,見格拉迪夫(Gladyshev,1965))來研究向理性預(yù)期均衡的收斂。據(jù)我所知,關(guān)于隨機近似的最初工作始于霍特林(Hotelling,1941)、傅利曼與薩維奇(Friedman and Savage,1947)。他們試圖構(gòu)建一種統(tǒng)計抽樣方法,來精確地解出一個未知函數(shù)在給定點的最大值。?

舒比克(Shubik,2004)和巴克(Bak et al. ,1999)的相關(guān)工作構(gòu)建了一些博弈,他們利用這些博弈來思考價格制定者對均衡過程的促進(jìn)作用。(在一般均衡模型中,只有價格接受者,沒有價格制定者)。舒比克的工作運用了他對一個課題的專業(yè)知識,這個課題存在于一般均衡理論和博弈論的夾縫中,對機器學(xué)習(xí)和人工智能有重要意義,它就是:

? 貨幣理論

本著舒比克(Shubik,2004)的精神,思考貨幣理論的一個好方法是,注意到它的目的是解釋均衡價格向量是如何被實際生活在一般均衡模型中的個體設(shè)定的。艾羅和德布魯(Debreu)的經(jīng)典一般均衡模型描述了均衡價格向量的特性,但對誰來設(shè)定這個價格向量以及如何設(shè)定卻保持沉默。相反,一個模型之外的“神靈”神秘地宣布了一個價格向量,同時出清了所有的市場。一個均衡價格向量保證了每個個體的預(yù)算約束得到滿足。在一般均衡模型中,貿(mào)易是多邊的,預(yù)算約束在一個中心化的賬戶中得到協(xié)調(diào)。相反,貨幣理論是關(guān)于一個分散的系統(tǒng),該系統(tǒng)中的人們只是偶爾在一系列雙邊會面中見面,并通過使用“交換媒介”交換商品和服務(wù)。交換媒介可以是耐用金屬(金或銀)、代幣(便士、紙質(zhì)“美元”或“英鎊”)、流通的債務(wù)憑證,或者銀行、清算所或中央銀行的賬目條目。奧斯特羅伊與斯塔(Ostroy and Starr,1974)、奧斯特羅伊與斯塔(Ostroy and Starr,1990),以及最近的湯森(Townsend,2020)總結(jié)了該流派的研究。加密貨幣理論是這些研究的直系后代。

我再介紹一下博弈研究對機器學(xué)習(xí)的貢獻(xiàn)。幾十年來,應(yīng)用經(jīng)濟學(xué)家已經(jīng)構(gòu)建了計算博弈均衡的算法,支撐這些計算的關(guān)鍵工具包括逆向歸納法(動態(tài)規(guī)劃)和樹狀搜索。由于要研究的可能狀態(tài)的維度呈指數(shù)增長,減少要研究狀態(tài)的數(shù)量對于在近似均衡方面取得進(jìn)展至關(guān)重要。在這方面,minimax算法和α-β剪枝搜索算法是主要的方法,可參考克努斯與摩爾(Knuth and Moore,1975)的著作和https://www.youtube.com/watch?v=STjW3eH0Cik,可以了解α-β剪枝搜索的描述,并看到相應(yīng)的計算系統(tǒng)和“適者生存”的想法。一條相關(guān)的研究路線研究了一群天真地基于對手過去的行動進(jìn)行優(yōu)化的玩家是否會收斂到納什均衡。可參見蒙德勒與沙普利(Monderer and Shapley,1996)、霍夫鮑爾與桑德霍爾姆(Hofbauer and Sandholm,2002)、福斯特與楊(Foster and Young,1998)、弗得伯格(Fudenberg et al.,1998)。當(dāng)收斂成立時,這種“虛構(gòu)游戲”算法提供了一種計算均衡的方法,可參見蘭伯特三世(Lambert Iii et al. ,2005)。

5.5約翰·霍蘭德(John Holland)在約1985年提出的人工智能愿景

John Henry Holland

美國科學(xué)家、復(fù)雜理論和非線性科學(xué)的先驅(qū)、遺傳算法之父

著名的計算機科學(xué)家約翰·霍蘭德1?是一位先驅(qū)者。他結(jié)合了我們提到的所有技術(shù)領(lǐng)域的思想,為生活在給定環(huán)境中的決策者構(gòu)建了計算機模型。在這種環(huán)境中,決策者別無選擇,只能按照艾羅(Arrow,1971)的思路,“在實踐中學(xué)習(xí)”?;籼m德(Holland,1987)介紹了他的這一方法,馬里蒙(Marimon et al.,1990)描述了在多人經(jīng)濟環(huán)境中的具體應(yīng)用。霍蘭德方法的一個重要部分是全局搜索算法,他稱之為“遺傳算法”。它通過用字符串表示函數(shù)的參數(shù)來搜索“崎嶇不平的景觀”,這些字符串可以被隨機匹配成一對字符串,并進(jìn)行切割和重新組合。這是霍蘭德表示“性繁殖”的機械方式。這樣的“遺傳算法”包含了他所說的“分類器”系統(tǒng)的一部分?;籼m德的分類器系統(tǒng)包括:(1)一連串的“如果-那么”語句,其中一些必須相互競爭,以獲得在線(即實時的)決策權(quán)。(2)一種將“如果-那么”語句編碼為二進(jìn)制字符串的方法,該字符串可以進(jìn)行隨機突變、切割和重組;(3)一個為單個“如果-那么”語句分配獎勵和成本的計算系統(tǒng);(4)破壞和創(chuàng)建新的“如果-那么”語句的程序,包括基于DNA切割和重組的隨機突變和有性繁殖;以及(5)一種篩選出適合決策規(guī)則的競爭性斗爭?;籼m德分類器系統(tǒng)已經(jīng)被證明能夠?qū)W會在動態(tài)環(huán)境中保持耐心,就像拉蒙·馬里蒙(Ramon Marimon)總結(jié)的那樣,在由霍蘭德的人工智能個體組成的世界中,“耐心需要經(jīng)驗”?;籼m德分類器成功地計算出了一個動態(tài)經(jīng)濟模型的“穩(wěn)定”納什均衡,該模型的作者們事先并沒有意識到這個均衡的存在,盡管事后,他們能夠驗證霍蘭德分類器交給他們的“猜測”??蓞⒁婑R里蒙(Marimon et al.,1990)的介紹。

5.6當(dāng)今的人工智能

DeepMind的計算機程序AlphaGo實現(xiàn)了一項了不起的成就,它成功地掌握了圍棋游戲,并打敗了人類圍棋冠軍選手??蓞⒁娡酰╓ang et al.,2016)。AlphaGo的創(chuàng)造者所采用的方法讓我想起了美食的烹飪過程——在一把原料中加入一丁點另一種原料,品嘗一下,再加入其他原料……在烹飪AlphaGo的成分中,包含了從動態(tài)規(guī)劃、湯普森采樣(見湯普森(Thompson,1933))和隨機逼近(見霍特林(Hotelling,1941)、傅利曼與薩維奇(Friedman and Savage(1947))、α-β樹搜索(見克努斯與摩爾(Knuth and Moore(1975))、Q-學(xué)習(xí)(見沃特金斯和達(dá)揚(Watkins and Dayan(1992));蒙特卡洛樹搜索(見布朗(Browne et al.(2012))收集到的靈感。參數(shù)調(diào)整的經(jīng)驗法則選擇是很重要的,它可以在“探索”和“利用”之間進(jìn)行權(quán)衡(弗得伯格與克雷普斯(Fudenberg and Kreps,1993)、(Fudenberg and Kreps(1995)中也是如此論述的)。

機器學(xué)習(xí)的其他最新進(jìn)展也引入了大量經(jīng)濟學(xué)和統(tǒng)計學(xué)的方法。計算最優(yōu)運輸問題(例如,佩雷(Peyr′e et al.(2019))使用丹齊格(Dantzig)、康托羅維奇(Kantorovich)和柯普曼斯(Koopmans)的線性程序來衡量理論概率和經(jīng)驗測量之間的差異。然后,它使用該衡量方法來構(gòu)建一種高效的計算方式,以匹配數(shù)據(jù)和理論。經(jīng)濟學(xué)家霍特林(Hotelling,1930)用黎曼幾何來表示統(tǒng)計模型的參數(shù)化系列。這個想法開啟了計算信息幾何學(xué)的先河,阿瑪里(Amari,2016)將這種方法系統(tǒng)化了。

6創(chuàng)造力的來源:模仿和創(chuàng)新

我描述了伽利略和達(dá)爾文是如何通過對前人研究結(jié)果和方法的掌握,并將其與前所未有的洞察力相結(jié)合,從而發(fā)現(xiàn)新的自然規(guī)律的。對先例的尊重,以及他們冒險超越的能力,是這兩位天才的成果的突出特點。后來許多天才也采用了同樣的方法,如電磁學(xué)的發(fā)現(xiàn),以及富蘭克林(Franklin)、戴維(Davy)、法拉第(Faraday)、麥克斯韋(Maxwell)、邁克爾遜(Michaelson)、莫利(Morley)、愛因斯坦(Einstein)的一系列發(fā)現(xiàn)。他們每個人都不是從“白板”(湊巧的是,這恰好是上述平克著作的標(biāo)題)開始,而是從他們對前人的深刻理解和尊重開始的。每個人都看到了他們的前輩沒有看到的東西,往往是因為他們采用了改進(jìn)的觀察或推理方法。通過運用法拉第不知道的數(shù)學(xué),麥克斯韋組織了一個令人驚嘆的統(tǒng)一和概括,將電磁動力學(xué)的法則減少到12個方程,而海維斯德又很快將它減少到四個方程。這四個方程為愛因斯坦的狹義相對論創(chuàng)造了條件。11

看似與電磁學(xué)毫不相關(guān)的純理論數(shù)學(xué),卻與后來電磁學(xué)的發(fā)現(xiàn)恰好吻合。為了將幾何學(xué)轉(zhuǎn)換為代數(shù)并寫成函數(shù),笛卡爾(Descartes)發(fā)明了一個坐標(biāo)系統(tǒng)。50年后,牛頓和萊布尼茨利用笛卡爾坐標(biāo)系發(fā)明了微分和積分。十九世紀(jì)上半葉,高斯(Gauss)和他的學(xué)生黎曼(Riemann)完善了基于平行線相交的曲面幾何。里奇(Ricci)在此基礎(chǔ)上增加了一個明確的曲率概念。

愛因斯坦將這兩個獨立的、看似“毫不相關(guān)”的研究工作結(jié)合起來,一個是實際的物理現(xiàn)象,另一個是純粹的抽象數(shù)學(xué)。愛因斯坦在努力擴展其狹義相對論時,學(xué)會了如何使用黎曼幾何和里奇曲率,構(gòu)建了一個自洽的廣義相對論。12

科學(xué)進(jìn)步展示了“模仿”和“創(chuàng)新”兩者之間的互動,這種互動在現(xiàn)代經(jīng)濟增長理論中也有所體現(xiàn)(例如,見班哈波柏(Benhabib et al.,2014)和班哈波柏(Benhabib et al.,2020))。在“模仿”階段,電磁學(xué)、相對論和數(shù)學(xué)領(lǐng)域的先驅(qū)者主要是復(fù)制前輩和老師的技術(shù);在“創(chuàng)新”階段則是在某種程度上超越前輩和老師,因為他們比老師學(xué)得更多、理解得更深。

7結(jié)論性評述

通過對物理學(xué)、生物學(xué)、統(tǒng)計學(xué)和經(jīng)濟學(xué)中的觀點的概述,我希望證明一個主張:即平克Pinker(2003)認(rèn)為我們在認(rèn)知上有先天局限的學(xué)科,正是被用來創(chuàng)造人工智能和機器學(xué)習(xí)的學(xué)科。這正是在學(xué)期間和離開學(xué)校以后繼續(xù)學(xué)習(xí)這些學(xué)科的又一個理由。在我看來,它們自身的美則構(gòu)成了另一個理由。

腳注1:哈耶克(Hayek, 2011, 附錄A)討論了自然和人工的其他定義。

腳注2:時至今日,觀察科學(xué)家如何應(yīng)用機器學(xué)習(xí)和人工智能,你會看到這些聰明人搜集了大量數(shù)據(jù)、然后以之?dāng)M合函數(shù)。De Silva et al. (2020)與Brunton and Kutz (2022)是其中兩個漂亮的范例。

腳注3:為了找到埋藏在第谷·布拉赫(Tycho Brahe) (1546-1601) 的已知行星位置時間戳測量表中的三個行星運動定律,約翰內(nèi)斯·開普勒(Johannes Kepler)(1571-1630) 使用了類似于伽利略的方法。李(Li)等人追隨開普勒的腳步,使用機器學(xué)習(xí)技術(shù)從布拉赫(Tycho Brahe)的數(shù)據(jù)中提取開普勒定律之一。如需了解開普勒和伽利略的科學(xué)方法的精彩描述參見溫伯格(Weinberg ,2015)。

腳注4: 當(dāng)時一些頂尖科學(xué)家并沒有馬上接受達(dá)爾文的理論。例如,開爾文(Kelvin)勛爵聲稱當(dāng)時盛行的地球估算年齡還遠(yuǎn)遠(yuǎn)無法論證達(dá)爾文的理論是否成立。

腳注5:因此,現(xiàn)代計算和人工智能的偉大發(fā)明者約翰·馮·諾依曼(John von Neumann)對這四個領(lǐng)域進(jìn)行了研究并做出了重大貢獻(xiàn)并非巧合。參見 Bhattacharya (2022) 了解更多有關(guān)馮·諾依曼的工作和生活的敘述。

腳注6:這個網(wǎng)站借助 Python 代碼探索了這兩種可能的有關(guān)概率意義,參見https://python.quantecon.org/prob_meaning.html。

腳注7:當(dāng)經(jīng)濟學(xué)家談到“理性預(yù)期”時,他們指的是假設(shè)“對環(huán)境的普遍正確理解”?!袄硇灶A(yù)期”一詞修飾的是“模型”,而不是“人”。

腳注8:參見克雷普斯(Kreps,1997)進(jìn)一步了解這兩類模型的共同特征和缺點,以及一些精彩的觀點和關(guān)于新方向的猜想,在我看來,這些新方向似乎預(yù)示了人工智能隨后會進(jìn)入經(jīng)濟學(xué)。

腳注9:霍特靈、弗里德曼和薩維奇的工作最后引出了“貝葉斯優(yōu)化”這一機器學(xué)習(xí)技術(shù)??蓞⒁娝怪Z克(Snoek et al. ,2012)。

腳注10:請參考https://en.wikipedia.org/wiki/John_Henry_Holland, https://www.nytimes.com/2015/08/20/ science/john-henry-holland-computerized-evolution-dies-at-86.html.

腳注11:愛因斯坦的辦公室墻上掛有麥克斯韋的照片。

腳注12:對這些事件的記錄詳見法梅洛(Farmelo,2019)著作的第三章。

來源:《薩金特數(shù)量經(jīng)濟與金融研究所時訊》(第四期)

排版:小半

內(nèi)容編輯:劉蕊

(本文轉(zhuǎn)載自北京大學(xué)匯豐商學(xué)院 ,如有侵權(quán)請電話聯(lián)系13810995524)

* 文章為作者獨立觀點,不代表MBAChina立場。采編部郵箱:news@mbachina.com,歡迎交流與合作。

收藏
訂閱

備考交流

  • 【MBAChina 官方社群矩陣】
  • 涵蓋 199管理類聯(lián)考備考 · 復(fù)試調(diào)劑 · 博士申請 · 中外合辦學(xué) 四大板塊。
  • ??2027 MBA/MPA/MEM/MPAcc /EMBA聯(lián)考備考群
  • ??2026 管理類聯(lián)考復(fù)試調(diào)劑群
  • ??博士項目交流群
  • ??中外合作辦學(xué)項目群
  • ?? 添加微信:MBAChina001
  • 備注【報考項目】,邀請您加入專屬交流群
免費領(lǐng)取價值5000元MBA備考學(xué)習(xí)包 購買管理類聯(lián)考MBA/MPAcc/MEM/MPA大綱配套新教材

掃碼關(guān)注我們

  • 獲取報考資訊
  • 了解院校活動
  • 學(xué)習(xí)備考干貨
  • 研究上岸攻略

最新動態(tài)

    MBAChina 掃碼關(guān)注

    掃碼關(guān)注 MBAChina

    EMBA 掃碼關(guān)注

    掃碼關(guān)注
    EMBA

    井陉县| 曲阳县| 黑水县| 新乡县| 彰化县| 九龙坡区| 姜堰市| 沧州市| 全椒县| 兴山县| 新丰县| 肥西县| 贺兰县| 出国| 辰溪县| 修武县| 英吉沙县| 江达县| 桦南县| 南皮县| 云霄县| 疏勒县| 扶沟县| 安新县| 邳州市| 若尔盖县| 武安市| 杨浦区| 睢宁县| 安阳市| 凤庆县| 全南县| 洛南县| 无极县| 基隆市| 西城区| 株洲市| 无锡市| 水城县| 乐清市| 阳山县|