編者按:6月16日,CVPR 2020 大會以全球連線的形式如期開幕。在大會的首場主題演講中,微軟公司 CEO 薩提亞·納德拉與微軟公司前執行副總裁沈向洋進行了一場精彩的爐邊對談,分享了對計算機視覺、人工智慧研究與應用前景的思考與展望。本文為大家整理了完整的文字實錄。
沈向洋:大家早上好。歡迎參加 CVPR 2020 大會,歡迎來到西雅圖,非常感謝大家從世界各地連線參加這次會議。我是 Harry Shum (沈向洋),很高興擔任本次 CVPR 大會首個主題演講的主持人。感謝大家觀看我和微軟公司 CEO 薩提亞·納德拉的爐邊對話。你好,薩提亞,非常榮幸邀請你參加 CVPR 2020。我認識你有將近20年,而且有幸在你麾下工作多年。面對今天的觀眾,能不能請你首先和大家分享一下,你是如何在印度長大,來美國學習計算機科學,在1992年加入微軟,並最終成為微軟的 CEO 的經歷。
薩提亞:首先,非常感謝 Harry,很高興受邀作為演講嘉賓參加 CVPR。我們正在經歷一個前所未有的時期,能有這樣的機會和大家相聚在一起,探討計算機視覺等技術領域的重大突破、以及科技創新能為世界帶來的積極貢獻,讓我感到特別興奮,很高興能與大家共聚一堂!Harry 要我談談我的個人經歷,我在印度海得拉巴長大,在那裡度過了很多年,那時的我從未想到會有此時此景。20世紀70年代中期的海得拉巴和今天完全不同,那時有兩樣來自美國的東西,最終改變了我的一生。第一是美國的技術,個人電腦,我很幸運在那個時候接觸到了電腦,從此有了自己的夢想,第二是美國的移民政策,讓我有機會來到美國求學。之前我從未去過孟買西部,結果卻來到了美國的威斯康星,這在當時是個不可思議的選擇。但由此開啟的機遇,無論是上學還是進入微軟工作,最終成就了我的人生和我今天的樣子。因此,我對過去所經歷的一切始終心懷感激。今天我非常確信,機遇能帶來巨大的影響,它讓我這樣一個印度孩子活出了不一樣的人生。我認為這是一種殊榮,我們應該思考,對於我們這些有此殊榮的人來說,我們在創造技術和技術平台的過程中,該如何推動它普遍造福於每一個人。這樣的想法,是推動我前進的根本動力。這也是微軟使命 「予力全球每一人、每一組織,成就不凡」的根基。它鞭策我每天努力工作,激勵我們全力以赴地做出最好的成果。
沈向洋:非常好,感謝薩提亞。你的故事非常鼓舞人心。CVPR 是計算機視覺的盛會,現在讓我們直奔主題。微軟從很早以前便投身於計算機視覺領域,就在幾天前我的好朋友、CVPR 2020 大會的主席 Gerard Medioni 教授還提醒我說,微軟研究院支持 CVPR 大會已經有差不多30年了。你能否與我們分享一下,微軟為何如此熱衷於計算機視覺?你在計算機視覺領域最關注的焦點有哪些?
薩提亞:當然可以。Harry,你本人就是微軟這個歷程的關鍵推動者。從21世紀初開始,我們在計算機視覺領域就開始了包括骨架追蹤、人體感知等基礎性的研究。在2010年,我們將這些技術轉化成了第一個商業產品,Kinect,我認為這是一個突破性的產品,而且它也的確成為了當年最暢銷的消費產品。在此基礎上,微軟劍橋研究院做出了能夠完全重構 3D 環境的 Kinect Fusion,隨後又有了 HoloDesk。我始終記得第一次看到演示的場景,它讓人與 3D 環境完全融為一體,讓你可以在桌面上擺弄一個 3D 物體。2015年,我們完成了產品化的 HoloLens,2019年,又推出了第二代的 HoloLens,HoloLens 2,它提供了兩倍的視野、兩倍的舒適度,並且還帶來了很多精彩應用。
除此之外,讓我感到特別興奮的,還是看到計算機視覺技術在雲和邊緣設備上的創新應用。我們在2016年,在物體識別領域達到了接近人類的水平。2018年發布的 Azure Kinect 提供了板載邊緣計算的能力,從此我們把 Azure 認知服務帶到了 Azure Kinect 上。有了這些完善的工具鏈,我們就可以圍繞計算機視覺,做出更有創意的研究和應用。事實上,已經有很多 ISV 和第三方開發者將 Azure Kinect 應用到從生產製造到醫療衛生的不同場景。在美國的醫院裡,每年平均會發生大約100萬起跌倒事故。一家名為 Ocuvera 的 ISV 開發出了視頻監控解決方案,利用 Azure Kinect 來分析病人的動作特徵,當無人照料的患者試圖起身離開床的時候,系統就會向護士和護工發出警告,從而提前避免跌倒事故的發生,其準確率已經達到了96%。
位於俄亥俄州的美國全國兒童醫院,在使用 Kinect 對嬰兒行為不協調的情況進行早期篩查,發現腦癱等疾病的徵兆。他們使用計算機視覺模型搭建了原型,來判斷嬰兒動作的健康程度,讓護理人員能夠儘早採取干預治療手段。對於此類疾病,儘早治療極其重要。醫療設備公司 Evolve 用 Kinect 來改善中風後遺症患者物理康復治療的效率,他們的方案將傳統的身體訓練與互動遊戲相結合,並且針對每一位患者的個人情況進行了定製。
當我們在 CVPR 大會上討論計算機視覺的未來時,有三個突破方向讓我尤其感興趣,我希望能推動它們的發展,給現實世界帶來積極的影響。第一個方向,我稱之為「4D理解(4D Understanding)」,之前我也和 Harry 聊過,可以把它發展成「現實即服務(Reality-as-a-Service)」。比如說,在醫院或者工廠車間這樣特別關注安全和質量的地方,如果我們想要利用實時的計算機視覺技術,對人、地、物這些要素進行推理以確保安全,這將是一個非常了不起的突破。我們已經在一些案例中看到了實際部署的情況,請讓我用一段視頻,來動態展示一下效果。
視頻內容翻譯:我們正在開發一項名為「4D Understanding」的技術,它整合了來自多個 Azure Kinect 的數據,通過計算機視覺模型進行實時的空間分析。系統能夠跟蹤物品、人、互動行為及群組活動。雲端的視頻和動作理解模型,會發現這個人正在用不安全的方式舉起大罐子,他用的是背部而不是腿來發力。在物品識別窗口,一個人正在組裝零件。紅色和綠色的圓圈顯示的是手部跟蹤。Azure 認知服務的計算機視覺 API 針對物品進行了訓練,能夠檢測出這些對象。另外有一些模型則用來分析組裝的動作。這能讓我們發現被遺漏的步驟。在這裡,系統檢測到有一根電纜沒有被組裝進去,因此組件被判斷為未完成。通過整合多項計算機視覺技術,我們的系統可以實時提供用來指導決策的洞察。
薩提亞:在遠程協作無處不在的今天,另一個讓我感興趣的領域,是「背景替換(Background Matting)」。即使人在家中坐,我們也可以把你搬到舞台上去。事實上,在最近舉辦的微軟 Build 開發者大會上,我們就把演講者在家中的影像拍攝下來,天衣無縫地投射到一個虛擬舞台上,完全不需要使用綠幕。我想這也是計算機視覺的一項突破,下面的視頻,將展示我們和華盛頓大學合作的成果。
視頻內容翻譯:利用計算機視覺模型和 Azure Kinect 的景深數據能製作出虛擬背景。為了保障大家的健康,今年的微軟 Build 年度開發者大會以虛擬形式召開。演講者出現在虛擬的舞台上,你可以看到他們本人其實是在一個普通的房間裡,並沒有使用綠幕。我們讓演講者利用連接到筆記本電腦的 Azure Kinect 給自己錄像。Kinect 可以記錄 RGB 色值和景深數據,將其放入以華盛頓大學的研究為基礎開發的人工智慧模型,就能生成動態的透明蒙版,然後我們就可以用虛擬舞台替換掉背景。與目前市面上的其它技術相比,背景的質量非常不錯。我們希望能夠製作出逼真的虛擬背景,從而創造出更加身臨其境的體驗。背景替換的相關代碼,已在 GitHub 上開源。
薩提亞:第三個突破,是我們在將近一年前所展示的」全息瞬移(Holoportation)」。這段視頻演示了我們的同事 Julia White 在台上用英語演講,而她的全息影像同時在講日語,這其中綜合運用了神經網絡文本到語音 TTS(Text-to-Speech)、全息計算等技術。像這樣自由地超越時間、空間和語言的局限,在我看來是一項了不起的突破,我希望這樣的技術能夠得到加速發展。
首先,Julia 啟動了 HoloLens 2。這時她的掌心裡出現了一個微型版本的自己
緊接著,一段炫酷的特效後,真人比例 1:1 大小的全息影像版 Julia 出現在了大家面前
「復刻版」Julia 的表情神態和語音語調與「本尊」如出一轍,更讓人震撼的是,她居然用流利的日語做起了演講(要知道,Julia 本人並不會日語)
沈向洋:非常精彩,薩提亞,這也喚起了我最寶貴的回憶。我想起了很多年前,我們在微軟剛剛成立計算機視覺研究小組時的情景,我們有 Rick Szeliski、Matthew Turk 還有很多了不起的人物。你也提到微軟研究院在全球有很多分院,比如英國的劍橋研究院、中國的亞洲研究院,還有印度研究院等等。很多來自微軟研究院的視覺技術,已經成功地融入到了微軟的產品中。最讓我興奮的,就像你所說的,是科學研究和產品之間的密切聯繫和轉化,比如你說的 Kinect、HoloLens 還有很多項目,像是 Julia White 的這個全息瞬移的視頻。我想計算機視覺的發展前景,一定是不可限量的。
薩提亞:絕對如此。
沈向洋:接下來,讓我們從計算機視覺轉到人工智慧,AI。微軟投身人工智慧研究也有很長時間了,特別是在比爾·蓋茨先生1991年創建微軟研究院之後。我還記得微軟研究院最初成立的三個研究小組就是自然語言處理、語音和視覺,這些都是 AI 的基礎。最近,你也在反覆強調,雲計算和人工智慧將是微軟未來成長的關鍵。上個月在 Build 大會上宣布的 AI 超級計算機也非常激動人心。那麼,微軟對於人工智慧接下來的發展的看法是什麼?
薩提亞:確實像你說的,微軟研究院最初的三個研究小組就是語音、視覺和語言。到了2020年,我們仍然在關注這三個領域,但有了更大的雄心壯志,也取得了更大的成功,我對此充滿了期待。
在我看來,過去幾年中最值得關注的一個事情,是大規模計算,能夠計算更多參數的模型將帶來更令人驚奇的結果,特別是在語言方面。你知道,從循環神經網絡(RNN)到 Transformer 模型,最後得到的結果都是巨大無比的。當你還在微軟領導科研團隊時,我們發布了帶有170億個參數的「圖靈模型」。現在,我們又和 Open AI 合作,把這個數字提高到了1700億,這是非常激動人心的進步。而我們還更進一步,特別為此打造了超級計算機。在處理這種級別的超大模型時,我們要面對種種挑戰,甚至需要克服「摩爾定律」的局限,因此我們必須要重新發明整個系統,讓超大規模機器學習成為可能。很高興我們最終在 Azure 上建成了 AI 超級計算機,我們和 Open AI 正在上面訓練這些模型。同時我們正在把這些模型平台化,讓其他人也可以在這些模型的基礎上,進行一些微調,來滿足他們自己的使用需求。讓我更加興奮的是,我們還可以舉一反三,將這些從文本、語音、圖像中學習到的 AI 訓練的方法推而廣之,來對知識形成更好的表達。因此,我想,在接下來的幾年中,我們將看到來自系統層、建模技巧、訓練技巧,當然還有應用層面的更多突破。比如說在醫療保健領域,如果我們希望能在精準給藥方面有所進步,則需要在臨床報告、醫療影像等方面的創新,並且把這些創新匯聚起來推動真正的突破。
沈向洋:的確非常值得期待。關於你提到的170億個參數的圖靈模型,還有1750億個參數的 GPT-3 大規模模型,我還想補充幾句。我們知道,在微軟內部,很多研究小組不但在利用 Azure 訓練自己的模型,甚至實現了小樣本學習、單樣本學習,乃至零樣本學習。這其中蘊藏的機遇真的是非常驚人。薩提亞,今天我們的主題演講是通過虛擬的方式在線進行的,因為我們正在經歷一個特殊時期。既然計算機視覺、人工智慧有這麼多令人興奮的前景,我想請你分享你對於 AI 視覺技術最真實的想法:現在我們該如何利用這些技術幫助大家,過好自己的生活、做好自己的工作——不僅是在當前面對疫情的時候,更重要的,還是在疫情過後的世界裡。能否和我們分享一些案例,告訴我們微軟在做什麼,微軟在如何幫助人們,特別是幫助那些在一線工作的人。
薩提亞:的確如此,Harry,我想這場疫情將人們對數位技術的迫切需求推到了前台,我們在思考技術該如何在全社會的規模上,幫助人們去應對、恢復、以及重構今後工作和生活的方式。我想,這三個階段其實是同時進行的,而包括計算機視覺在內的數位技術,將在其中發揮重要作用。事實上,我們剛才看到的那段視頻,展現了工廠車間裡的遠程感知、遠程監控,以「現實即服務」的方式來確保安全,用數字孿生來保障安全運行,這對於製造業來說,都是非常重要的趨勢。我們在製造業看到的另一個應用,是對生產線進行及時、快速的調整,比如說迅速轉產製造呼吸機。在這個過程中需要專家的遠程指導,來幫助工人重組生產線,HoloLens 結合 Dynamics 的 Remote Guides 應用,在這個過程中發揮了重要的作用。這是在製造業上。
在醫療衛生領域,在英國的醫院裡,我們看到了 HoloLens 和 Microsoft Teams 結合的應用。醫生在照料受新冠病毒感染的患者時,不但穿著全套個人防護裝備,還佩戴著 HoloLens。HoloLens 能夠拍攝到醫生看到的視野,並將其通過 Microsoft Teams 傳送出來,讓隔離區外的其他醫生也能看到患者,並遠程給出治療建議。安全和協作以一種全新的方式,在抗擊疫情的第一線發揮著作用。在醫護教學方面,凱斯西儲大學醫學院讓學生在家使用 HoloLens 遠程參與解剖課的教學,確保能夠以逼真的體驗繼續教學課程。這是很了不起的突破。
總之,我認為無論是在製造業、醫療領域,還是教育方面,我們將看到一大批突破層出不窮地湧現出來,而計算機視覺,無疑將是這個「遠程無處不在」的世界的關鍵技術。
沈向洋:確實如此。我覺得你說的非常好。現在,數字化轉型正以某種方式加速推進。我想疫情迫使我們必須要想得更長遠些。我還想問問你,對於未來的工作方式,以及疫情過後的世界有什麼想法。你認為人們將越來越多地依靠遠程技術工作嗎?我記得你之前也說過,從今以後人們用完全虛擬的方式做一切事情是不可思議的?而現在有些公司已經宣布將長期堅持遠程工作。
薩提亞:我覺得從核心層面來看,我們總是希望企業內部的每一項功能都可以實現遠程化。遠程銷售、遠程運營、遠程支持,真正大規模的遠程工作。我覺得這一點是毋庸置疑的。這將是企業維持業務連續性和彈性的基礎。我想接下來我們要學習的,是如何幫助不同行業中,不同功能部門的不同的角色,更好地提高遠程工作的效率。我相信,在某些行業中的某些角色是完全適合遠程工作的。事實上,在微軟,在疫情爆發之前,我們有很多職位就已經是100%遠程工作的,而且他們的工作都很高效。當然,也有某些職位需要人們有時候聚在一起相互協作。
我想說的是,我認為我們不是要用一種教條取代另一種教條,對我們來說,更重要的是通過實踐發現,我們在遠程工作中收穫的好處有哪些,並且要有目的地對其加以利用和放大。這樣,當我們走出疫情的影響時,我們就可以更好地發揮這種靈活性來幫助他人,不僅是用來工作,更是為人們謀福利和滿足人們的需要。比如說,現在我們在西雅圖地區的很多員工都在家工作,但我們發現,有些人希望在疫情結束後回到公司上班,因為他們希望有專門的工作場所和更好的網絡連接——因為一些結構上的問題,即使是在西雅圖這樣的大城市,Wi-Fi 和寬頻也會存在局限性。所以,我希望我們能夠理性地認識到世界不同地方的人們所面對的現實各不相同,要找到實現靈活性的最佳方式,重新認識遠程工作的優勢,並且真正為更多人提供助力。
沈向洋:很高興聽到你的想法,薩提亞。我的感悟是,無論我們面對怎樣的挑戰,比如當前的疫情,我們總能通過創新找到出路。儘管需要付出巨大的努力,但我們終將走出困境。薩提亞,讓我們回到微軟公司的話題上來。過去六年多,你做了大量的工作領導微軟實現了成功的轉型。你在社區建設上尤其投入了大量的精力,並且做出了很多大膽的嘗試,比如收購面向商業人才的 LinkedIn 和面向開發者的 GitHub。事實上,CVPR 是一個匯聚了計算機視覺研究者和從業者的大社區,這兩年,每年 CVPR 大會的參與者已經達到了接近1萬人的規模。我們中的很多人都想從你和你的經歷中得到一些建議和啟示,來促進整個社區的成長。你認為,我們這個計算機視覺社區,應該如何相互幫助、共同工作、共同成長,並更好地貢獻社會呢?
薩提亞:當然,Harry。我們說予力全球每一人、每一組織,成就不凡,其中的關鍵就是利用數位技術,幫助人們以及人們所建立的機構和社區共同創造、共同繁榮。這是微軟使命的中心思想,也是微軟商業模式的核心所在。只有我們所服務的整個世界變得更好,我們才能變得更好。無論是幫助小企業更具生產力,幫助覆蓋全球的大型國際公司更具競爭力,還是幫助公共服務部門提高效率,幫助教育、醫療得到發展,幫助大型社區共同繁榮。對我們來說,這是核心所在。你剛才提到的那些收購,包括開發者社區 GitHub、面向商業人才的 LinkedIn,還有 Minecraft 等遊戲玩家社區,我們很榮幸能夠服務這些社區,同時這些社區也讓我們的根基更為紮實。
在計算機視覺領域也是同樣的道理。計算機視覺研究者相互團結,創造科技突破的傳統由來已久,微軟研究院與學術界合作,共同推進產品創新的先例也是不勝枚舉。來自蘇黎世聯邦理工學院(ETH)的 Marc Pollefeys 就是最好的例證。他和微軟合作,推動了很多產品的創新,但同時他也在 ETH 創辦了世界級的研究中心。這樣的跨界合作正是社區建設的核心。這不僅限於計算機視覺,也適用於人工智慧的更廣大領域,並延伸到整個數位技術的範疇之中。在微軟,我們希望能夠促進生態系統平台的思考,幫助社區團結在一起,更重要的,是促進不同社區之間的相互合作,通過合作放大社區的力量。
沈向洋:說得好,薩提亞,你帶給我們很多啟示。社區的一個重要屬性就是國際化。就像 GitHub 是國際化的,LinkedIn 是國際化的,遊戲社區是國際化的,計算機視覺的 CVPR 社區也不例外。那麼,作為一家跨國公司的領導者,面對很多你熟悉的學科社區,你覺得他們該如何更好地推進國際合作呢?
薩提亞:好的,Harry,接下來我們來聊一聊國際合作。無論是 CVPR 這樣的科研社區,還是微軟這樣的跨國公司,我想我們必須要理智思考的一件事是我們的工作,無論是相互合作還是獨自完成,如何才能真正幫到每一個國家的每一個社區。所謂全球化,如果不能讓當地從中獲益,就無從談起。事實上,從上一輪的全球化來看,我們看到它讓很多人受益,但也有很多人被撇在了後面。因此我現在想說,微軟應該在某種程度上有所作為,這就是為什麼我無論去到世界任何地方,都會注意觀察,並且表達微軟希望積極參與和幫助地區和國家發展的願望。我希望我們的星星之火,可以為促進小企業、大企業、公共服務部門、醫療、教育的發展,幫助改善當地資源供給、就業情況,提高技術水平,做出些許貢獻。作為一個全球社區,無論是科研社區還是跨國公司,我們必須在推動全球合作的同時,積極參與和對本地發展作出貢獻。如果我們能在這方面有更多的想法,在這個方向上貢獻出更大的力量,我們就越能保持發展的活力。
沈向洋:非常好的觀點,薩提亞。事實上,在 CVPR 社區以及其他的大規模計算社區,比如 ICCV,我們的想法也都是這樣。這也是為什麼 CVPR 大會幾乎在每一座擁有大學或者研究院的美國城鎮都舉辦過。ICCV 大會是在不同的大洲輪流舉辦,就像你說的,只有當地社區都得到繁榮發展,才能真正成為一個全球性的組織。非常好。那麼,薩提亞,我們現在還有一點時間,我這裡有幾個提前從觀眾那裡收到的問題。第一個問題是個很適時的問題,我知道你也在這上面思考了很多。關於人工智慧,關於有道德地運用人工智慧,關於負責任的人工智慧,我們意識到你和微軟花了大量精力來闡述這個問題,還在這方面做了很多艱難的決定。你能否分享一些在這方面心得和教訓?
薩提亞:當然了,Harry。我們一直在理智地思考,如何制定一套設計規則,確保在創造 AI 時,能夠將核心的道德思考烙印到工程開發的流程中去。在我們看來,確定 AI 安全和有道德地使用 AI 的設計原則,就像在編程時確定運行環境一樣重要。在這個設計原則中,我們首先建立了一套具體的工程學原則,從公平、可靠,到安全、隱私等。這樣,我們保證符合道德成為設計流程的一部分,我們將其作為首要的設計要求而不是一個抽象的概念。
在計算機視覺領域,我們一直在實踐這樣的要求。比如基於我們的 Face API 的面部識別。首當其衝的挑戰就是我們該如何確保消除偏見。感謝 NIST 推出了可靠的評分標準,現在可以對不同種族人群的面部識別效果進行比較,從而確保我們的模型中不存在偏見,由此創造出的透明度標準也很有幫助。很快,我們將為客戶提供幫助指南,告訴他們該如何根據自己的數據,去度量 Face API 的性能表現、設置正確的閾值,並對錯誤匹配進行平衡。這是一個例子。
在另一邊,是對運行環境和有道德地使用 AI 的思考。我們必須意識到,有時候,即使在設計過程中完全心懷善意,如果沒有在運行環境中植入能夠保護隱私和民主自由的措施,最終也可能在無意間得到壞的結果。過去兩年,我們一直專注於開發和執行嚴格的原則來管理我們的面部識別技術,自2018年以後,我們也在呼籲政府制定相應的嚴格保護法規。我們公開了我們在相關項目中採用的定義原則。我們還拒絕了很多不符合原則的項目。我們沒有把面部識別技術賣給美國警局部門;我們也承諾,在美國出台符合人權的嚴格的全國性法律之前,不會將這項技術賣給美國警局部門。我們在積極呼籲制定嚴格的全國性法律,否則,我們將看到負責任的企業離開這個市場,讓另一些人乘虛而入。
面向未來,如微軟這樣的公司需要在打造負責任的人工智慧的實踐中做出最好的努力,以將其烙印到工程流程中,同時在技術被使用時確保它既符合我們堅持的原則,也滿足全球各地法律法規的相關要求。
沈向洋:這的確是規範 AI 的有效途徑。從設計原則和運行環境兩方面,讓人們必須認真思考 AI 設計的重要道德問題和責任。毫無疑問,計算機視覺也是其中一個重要的部分。那麼,薩提亞,最後一個問題是,作為全球第一號公司的 CEO,你每天都在思考重大的機遇,以及如何幫助更多的人們。那麼,能否告訴我們,你覺得今天最適合應用雲計算、人工智慧,以及計算機視覺的行業有哪些?
薩提亞:非常好的問題,Harry,因為從某種意義上看,這是我和微軟的同事們思考最多的問題——下一步,我們怎樣才能讓數位技術產生更加深遠的影響呢?想想看,過去10到15年的發展很顯眼,但我想說有些應用場景其實要窄得多。消費級網際網路方面的突破有很多,但如果你去看生產力以及生產力推動經濟增長的曲線,觀察它對小企業、大企業,對經濟中的不同方面,對世界的不同地區帶來的影響,就會發現,我們的增長率甚至還不如20世紀90年代到21世紀初由 PC 興起帶來的增長。如果你去看 Robert Gordon 對美國生產力的評價,就會看到,他明確指出在1870到1940年代之間有著驚人的進步。他還指出信息技術特別是個人電腦,帶來了20世紀90年代到21世紀初的生產力增長。但從那之後,我們就沒有實現生產力的明顯增長。原因何在?其中可能有統計學和計量方法上的偏差。但我想說的是,我希望在下一個階段,在人工智慧、雲計算,以及計算機視覺這樣的技術的助力之下,我們能看到更多行業的普遍增長。
我對此滿懷期待。比如說醫療健康領域。美國 GDP 的19%來自醫療健康領域。那麼,我們是不是有可能在精準給藥方面獲得突破呢?我們可以利用臨床數據、分子圖像,在如何治療病人以及管理診療方面真正取得突破。在這個一切皆可遠程的世界裡,自主性——無論是從內而外的還是自外向內的,例如我們在「現實即服務」的視頻中看到的就是從內而外的經濟形態,人在運動,物也在運動,有人在觀察,並幫助確保這些人和物安全地運行,或者這些物體自動化地在現實世界裡運行。能在現實世界中自主運動的物體將徹底改變交通運輸,還有很多場合下的運行安全。零售業、商業,都將因此發生顯著的改變。現在大家都在說線下、線上的全渠道,事實上新冠疫情的影響推動了諸如無接觸購物、線上下單到店自取等解決方案的快速發展。我想這將是零售業的一個重大分水嶺。而能確保食物安全的精準農業,也將是另一個大的領域。
還有一個讓我興奮的領域,與計算機視覺尤其相關,那就是無障礙設計。全球有10億人因為身體不便無法參與到社會經濟中來。如今我們所掌握的技術,像是機器閱讀理解,可以幫助閱讀障礙的人們讀書;像微軟開發的 Seeing AI 這樣的工具,藉助最新的計算機視覺突破,為視覺障礙人士講述這個世界的模樣;還有 EyeGaze 項目,能夠通過追蹤漸凍症(ALS)患者目光的運動,幫助他們打字並與他人溝通。我由衷希望,我們在人工智慧領域能夠取得真正的突破,帶來更新、更強大的無障礙技術,幫助世界各地的這十幾億人,參與到社會活動和經濟生活中來。
所以,這些都是讓我興奮的領域。
沈向洋:的確都是非常非常令人期待的領域。在我聽來,你的核心思想還是聚焦於生產力,服務於全球每個地方、每個人的生產力。
薩提亞:是的,沒錯。
沈向洋:薩提亞,我的最後一個問題,我要替在場的觀眾提問:微軟是否會聘用更多計算機視覺方向的人才?
薩提亞:我們永遠都想要更多計算機視覺的人才,而且我們真心希望能夠與今天匯聚在這裡的計算機視覺社區進行合作。再次感謝你,Harry,為我提供了這個機會。這是一個非常重要的社區,儘管面對重重阻力,但我很高興看到大家仍然能匯聚一堂共同探討技術的進步。有一點你說的很對,最重要的不僅僅是我們的技術和技術突破本身,這次大會之所以能夠鼓舞大家,其關鍵在於,這項技術將如何引領經濟以更加包容、平等的方式發展,並真正幫助地球上的每一個人更好地實現他們的夢想。我想這才是我們每個人內心深處的聲音,真高興今天能有這個機會和大家一起暢所欲言。