《領域大數(shù)據(jù)系列講座》之計算機視覺之“求真務實”

?智能總結2021年11月19日,MBA《領域大數(shù)據(jù)系列講座》第七期以在線的方式順利進行,中國科學院大學人工智能學院副院長兼副書記肖俊教授給大家?guī)眍}為“計算機視覺之‘求真務實’”主題講座。 嘉 賓 介 紹 肖...
2021年11月19日,MBA《領域大數(shù)據(jù)系列講座》第七期以在線的方式順利進行,中國科學院大學人工智能學院副院長兼副書記肖俊教授給大家?guī)眍}為“計算機視覺之‘求真務實’”主題講座。
嘉 賓 介 紹
肖俊,教授,博士生導師,中國科學院大學人工智能學院副院長兼副書記,中國科學院大學教育基金會副秘書長。任中國人工智能教育聯(lián)席會常務理事,中國科學院人工智能產學研創(chuàng)新聯(lián)盟戰(zhàn)略研究組成員,中國自動化學會模式識別與機器智能專業(yè)委員會委員、中國圖像圖形學學會青年工作委員會委員。主要從事計算機視覺、工程計算等相關研究,主持國家重點研發(fā)計劃課題、國家自然科學基金項目等橡木20余項,發(fā)表學術論文80余篇,并出版專著1部。入選中國科學院青年創(chuàng)新促進會優(yōu)秀會員和北京市科技新星。
計算機視覺被圖靈獎獲得者Jim Gray列為12大信息科學問題之一,是當前人工智能領域的研究熱點。本次講座從計算機視覺概況、三維重建、圖像取證三個方面帶領大家進入計算機視覺的世界。
01
計算機視覺概況
視覺是人類智能的重要組成部分,人類獲取的信息70%-80%來自視覺。通過視覺,人類可以清晰捕獲各種特征,從而擁有奇妙無窮的識別能力,而人類同樣希望機器具有人的視覺功能。所謂計算機視覺,就是利用計算機機器輔助設備來模擬人的視覺功能,實現(xiàn)對客觀世界的三維場景感知、識別和理解。計算機視覺是一門研究如何使機器“看”的科學。通過這一研究,使計算機具有通過一副或者多副圖像認知周圍環(huán)境信息的能力,即使計算機具有從二維圖像認知三維現(xiàn)實環(huán)境的能力,或者利用二維投影圖像來重構三維物體的可視部分。其目標主要包括:根據(jù)一副或者多福圖像計算出觀察點到目標物體的距離,目標物體的運動參數(shù)以及目標物體的表面物理特性。

通過計算機視覺的研究,可以把人類從一些諸如安全監(jiān)控,郵包分揀等繁雜的工作中解脫出來,同時幫助人類處理一些人類視覺無法處理的工作,比如海底探測,登錄火星等,最終使人類的生活更加豐富多彩。
因此,計算機視覺的目標是使計算機像人類一樣,通過視覺,觀察和理解世界。
02
計算機視覺與人工智能
所謂智能,通俗的講就是知識和智力的總和。知識是智能的基礎和前提,智力是獲取和運用知識求解的能力。根據(jù)表現(xiàn)智能的主體,可以分為自然智能和人工智能。人類智能是地球上最高級、最發(fā)達、最具代表性的自然智能。而人工智能是希望可以研制具有類人智能的智能機器,其表現(xiàn)形式主要分為六大方面:
會看:圖像識別、文字識別、車牌識別
會聽:語音識別、說話人識別、機器翻譯
會說:語音合成、人機對話
會行動:機器人、自動駕駛汽車、無人機
會思考:人機對弈、定理證明、醫(yī)療診斷
會學習:機器學習、知識表示
由此可知,計算機視覺是人工智能的一個重要方面。經過多年的發(fā)展,目前人工智能基本演化為六大方面:計算機視覺、自然語言理解與交流、認知與推理、機器人學、博弈與倫理和機器學習。而計算機視覺的主要研究內容包括底層視覺、中層視覺、高層視覺。

03
計算機視覺發(fā)展歷程
計算機視覺從二十世紀50年代開始,經過六個階段,一直發(fā)展至今。

隨著近年來深度學習的流行,計算機視覺得到了迅猛發(fā)展。其中,美國《麻省理工評論》評選出2013年度10大突破性技術,深度學習(Deep Learning)居首,成為目前最為流行的計算技術。它在圖像識別等領域取得目前最好的識別結果,在有些任務上甚至超過了人類的水平。目前計算機視覺發(fā)展的現(xiàn)狀主要在以下幾個方面:
物體分類:對圖像中的物體進行自動分類,經過多年的發(fā)展,在此領域取得了很大的進步,目前,分類的錯誤概率達到2%以內,超過人類的水平。

目標檢測:目標檢測即自動從圖像中檢測出感興趣的目標。在這一領域,計算機視覺還在逐步優(yōu)化發(fā)展階段,目前還未達到人類的水平。
04
目標檢測
目標檢測即自動從圖像中檢測出感興趣的目標。在這一領域,計算機視覺還在逐步優(yōu)化發(fā)展階段,目前還未達到人類的水平。

05
生物特征識別
生物特征識別包括人臉識別、掌紋識別、指紋識別、虹膜識別等等。已經在很多領域進行了實際應用。

除此之外,現(xiàn)階段計算機視覺還在物體分割、無人駕駛、無人飛行器、場景三維建模等領域進行發(fā)展。
06
計算機視覺行業(yè)應用
經過近些年的發(fā)展,計算機視覺的行業(yè)應用非常廣泛。涵蓋了:在工業(yè)領域的零件識別與定位、產品檢驗、移動機器人導航和自動車導航、遙感圖像分析、醫(yī)學圖像分析、安全鑒別與監(jiān)事、以及動畫和考古等領域。
應用一:自動駕駛
谷歌、百度等公司依據(jù)自身的技術實力,已經初步實現(xiàn)了無人駕駛。

應用二:醫(yī)療-辨病
美國斯坦福大學的人工智能醫(yī)生,診斷皮膚癌達到專業(yè)醫(yī)生水平。
該大學一個聯(lián)合研究團隊開發(fā)出了一個皮膚癌診斷準確率媲美人類醫(yī)生的人工智能,相關成果刊發(fā)在2017年1月底《自然》雜志的封面論文,題為《達到皮膚科醫(yī)生水平的皮膚癌篩查深度神經網(wǎng)絡》。這個神經網(wǎng)絡的診斷準確率與人類醫(yī)生不相上下,達到91%左右。

應用三:智能視網(wǎng)膜
美國的一家科技公司,通過此技術試圖讓盲人可以看得見東西。預先需要把芯片植入病人大腦,目前可以達到100多像素,已經實現(xiàn)了從0到1的過程;目前世界范圍內已經有200多人做手術,后續(xù)有廣闊的發(fā)展空間。

應用四:監(jiān)控
通過遠程監(jiān)控可以對異常行為進行檢測。

應用五:金融
2018年4月國內首家“無人銀行”在上海營業(yè):兩位智能機器人取代了銀行柜員及工作人員,市民通過身份證實名認證即可入內辦理各種業(yè)務:充分運用了生物識別、語音識別、數(shù)據(jù)挖掘等最新金融智能科技成果,整合了機器人、智慧柜員機、VTM機、外匯兌換機、人臉識別、語音導航等前沿科技。

隨著計算機視覺在各個行業(yè)的廣泛應用,諸多優(yōu)秀的科技企業(yè),美國的谷歌、IBM、Facebook、中國的百度、華為、商湯科技等企業(yè)紛紛進入此領域,推動計算機視覺的發(fā)展。
07
計算機視覺現(xiàn)狀和趨勢
雖然經過了幾十年的發(fā)展,但是就目前來看,計算機視覺仍舊處于初級階段。人的視覺系統(tǒng)是一個通用系統(tǒng),可以協(xié)調處理大量不同的任務。目前的計算機視覺系統(tǒng)還只能處理少量單一而簡單的任務,比如:對于圖像的分類和目標檢測需要不同的算法實現(xiàn),還無法融合到一起進行,也說明在此領域人工智能還處于初級階段。而從灰度圖像、到彩色圖像、再到深度圖像的信息量十分巨大,給特征提取造成了較大的困難,與此同時,存儲和計算問題也日益突出。
雖然目前存在著一定的困難,但是隨著技術的不斷演進,計算機視覺在以下兩方面依舊會向
前發(fā)展:
通用視覺技術:能夠處理復雜多樣的任務。
類腦智能:借鑒人類或者靈長類動物大腦的生理機理。
08
三維重建:追求三維真實感
所謂“三維重建”,是指對三維物體建立合適的計算機表示和處理的數(shù)據(jù)模型,是在計算機環(huán)境下對其進行處理、操作和分析其性質的基礎,也是在計算機中建立表達客觀世界到的虛擬現(xiàn)實的關鍵技術。三維重建是連接數(shù)字世界和物理世界的橋梁。

三維重建是呈現(xiàn)真是世界、對虛擬世界進行可視化的有效方法。香港科技大學權龍教授在2018年全球人工智能與機器人峰會上指出:計算機視覺下一步必須走向三維重建。而建模的真實性和精確性一直是學術界和產業(yè)界追求的目標。
三維重建主要分為以下兩類:
基于計算機軟件的三維重建:借助CAD,MAX,MAYA等計算機軟件進行三維重建。
基于計算機視覺的三維重建:隨著重建對象復雜度的提高,只使用軟件通過手工方式繪制來重建物體的三維模型已經不能滿足用戶的需求,特別是在一些復雜對象的建模中,使用軟件建模是一個不可能完成的任務。在這種情況下,借助外部設備對物體進行三維重建。包括基于三維物體斷層掃描的重建、基于掃描儀的重建和基于圖像的重建。
在這些建模方法中,各有優(yōu)缺點,可以應用于不同的場景。而三維建模也是碰撞檢測、工程計算等工作的基礎,已在工業(yè)、軍事、娛樂等各個領域得到了廣泛的應用。

09
圖像取證:追求二維的真實
隨著數(shù)字化程度到的不斷提高,人們接觸到照片、圖片越來越多,并越來越偏愛照片和圖片,“數(shù)字照片時代”已經到來。與此同時,越來越多的圖像處理和編輯軟件的廣泛使用,讓修改、編輯以及存儲數(shù)碼照片變得越來越簡單和有趣。人們在盡情享受現(xiàn)代多媒體技術及數(shù)字傳輸技術帶來愉悅,當人們在毫無限制的任意編輯、修改、復制和散步數(shù)字圖像、視頻時,這些數(shù)字媒體原創(chuàng)者的版權和經濟利益如何可以得到保護?以及人們所看到的圖像是否真實可信?
2017年,陜西林業(yè)廳公布了周正龍拍攝的華南虎照片。這一照片后來經專家多方證實,照片中的老虎是假老虎。

與此類似,2006年,第二屆中國國際新聞攝影比賽“華賽”金獎作品《中國農村城市化改革第一爆》為接片作品。

這些案例說明,數(shù)字圖像篡改和偽造如果被用于正式媒體、科學發(fā)現(xiàn)、保險和法庭證物等,將會對政治和社會穩(wěn)定產生重要的影響。數(shù)字圖像取證勢在必行。
數(shù)字圖像取證主要分為主動數(shù)字取證和被動數(shù)字取證。主動數(shù)字取證需要對圖像進行預處理,通過分析所獲得的圖像中添加的預處理信息判斷內容的性質,并實施相應的判斷。被動數(shù)字取證不事先預處理待取證的內容,它通過分析待取證圖像本身的性質實現(xiàn)判斷。下圖展示了數(shù)字圖像內容真實性篡改取證分類。

除了上述技術手段的保證,國家也出臺了相應的法規(guī)來對數(shù)字影像的真實性進行保護。

經過兩個多小時的時間,老師給大家介紹了計算機視覺的發(fā)展以及現(xiàn)階段的一些應用。盡管計算機視覺已經有了近40年的發(fā)展歷史,但目前仍舊處于初級階段,并且還將持續(xù)很長一段時間,而核心技術仍需要進一步深入研究新的更為有效地理論方法??傊?,計算機視覺的終極目標不是達到人類視覺,而是超越人類視覺。
國科大MBA

掃二維碼|關注我們
作 者|那云鵬
配 圖|那云鵬
編 輯|MBA教育管理中心
(本文轉載自 ,如有侵權請電話聯(lián)系13810995524)
* 文章為作者獨立觀點,不代表MBAChina立場。采編部郵箱:news@mbachina.com,歡迎交流與合作。
備考交流
- 【MBAChina 官方社群矩陣】
- 涵蓋 199管理類聯(lián)考備考 · 復試調劑 · 博士申請 · 中外合辦學 四大板塊。
- ??2027 MBA/MPA/MEM/MPAcc /EMBA聯(lián)考備考群
- ??2026 管理類聯(lián)考復試調劑群
- ??博士項目交流群
- ??中外合作辦學項目群
- ?? 添加微信:MBAChina001
- 備注【報考項目】,邀請您加入專屬交流群
最新動態(tài)
活動日歷
- 01月
- 02月
- 03月
- 04月
- 05月
- 06月
- 07月
- 08月
- 09月
- 10月
- 11月
- 12月
- 06/01 6月1日直播預告:香港理工大學SPEED學院_全新碩士課程專場!26fall入學!
- 06/03 6月3日活動報名 | 北大光華-凱洛格國際EMBA項目Coffee Chat@上海
- 06/03 【活動報名】中國科學技術大學科技商學院專題講座重磅開啟!
- 06/04 6月4日 席位鎖定中 | 香港中文大學(深圳)MBM2027級招生說明會
- 06/06 長春理工大學2027級工商管理碩士(MBA)考生見面會
- 06/06 重磅!上財?shù)嗡呓?027級全日制金融碩士“新興金融探索日”活動通知
- 06/06 深圳場 | 清華-康奈爾雙學位金融MBA公開課暨2027級招生說明會報名中!
- 06/06 上海 | 紫荊課堂暨2027級清華MBA招生咨詢會報名開啟!
- 06/06 浪潮已至|南科大科創(chuàng)MBA 2027級招生啟動大會來了
- 06/06 活動報名 | “迅策科技”校友企業(yè)參訪暨清華五道口金融EMBA深圳招生說明會
熱門資訊
掃碼關注 MBAChina
掃碼關注
EMBA








