對話微軟中國CTO韋青:元宇宙究竟是什么?
今年以來,元宇宙火遍全球。這一概念源自上世紀90年代科幻小說《雪崩》,被視為現(xiàn)實世界在互聯(lián)網(wǎng)上的延展,吸引著國內(nèi)外科技公司投身其中,以借助5G、AR/VR(增強現(xiàn)實/虛擬現(xiàn)實)、可穿戴設備等前沿技術,讓當年的愿景照進現(xiàn)實。
激進者如Facebook創(chuàng)始人扎克伯格,直言自己是元宇宙的信徒,“不僅僅是游戲,我們相信它是移動互聯(lián)網(wǎng)的繼承者”。今年7月,扎克伯格在接受外媒The Verge采訪時表示,接下來五年內(nèi),F(xiàn)acebook要變成一家元宇宙公司。
國內(nèi)公司也沒閑著。截至今年9月,騰訊申請注冊的元宇宙系列商標達到近百個。字節(jié)跳動則在8月底以幾十億元并購VR設備廠商Pico,而VR被廣泛視為元宇宙的基礎構成要素之一。
但并非所有人對元宇宙“感冒”。蘋果、微軟等公司的高管在談及元宇宙時,態(tài)度十分謹慎。
蘋果公司CEO庫克在9月份接受《時代》雜志專訪,當被問及蘋果正在押注的AR是不是元宇宙概念時,庫克表示:“這是有明顯不同的兩個詞。我不會亂用這些流行詞。我們稱之為增強現(xiàn)實?!?/p>
工程師出身的微軟中國CTO韋青在近期接受字母榜專訪時,則更愿意將Metaverse的本意還原為微軟公司董事會主席兼CEO薩提亞·納德拉在他的《刷新》一書中文版中翻譯為的“虛擬空間”,認為它比元宇宙更能表達《雪崩》作者的原意,也更容易為普羅大眾所理解。
韋青
在韋青看來,無論稱之為元宇宙還是虛擬空間,所要解決的問題其實是一致的,即“人與機器的關系”問題和“技術使命”問題。
此外,在當前實踐中,外界很容易將“擁有技術”自動地等同于“應用技術”。韋青認為,原則上只要有錢,就有可能買到和擁有某種技術;但只有經(jīng)歷長期的學習和嘗試階段之后,人類才可能真正把擁有的技術應用到位。
韋青表示,以機器學習為例,“擁有”和“利用”之間的鴻溝是這一先進技術應用到各行各業(yè)所面臨的主要障礙之一。
“其實,僅以目前的機器學習技術水準來看,已經(jīng)足夠為人類社會的發(fā)展做出巨大的貢獻。當然,實現(xiàn)這個目的的前提是腳踏實地,大家的眼光不能只專注在看起來很美的人臉識別或語音識別上面。”韋青說。
專訪期間,除了元宇宙、機器學習等熱門領域外,韋青還針對人工智能、信息技術等當下科技前沿領域的焦點話題,一一給出了自己的獨到見解。
以下是字母榜(ID:wujicaijing)與韋青的部分對話內(nèi)容:
A
“元宇宙”還是“虛擬空間”?
字母榜:近期,元宇宙、VR等概念和技術大火,怎么看待這個現(xiàn)象?
韋青:我自己對于元宇宙的理解來源于尼爾·斯蒂芬森寫的《雪崩》這本出版于1992年的科幻小說。在薩提亞2017年出版的《刷新》這本書里,也專門講到當他1992年加入微軟時,有兩本未來主義作品獲得了全公司工程師的熱烈追捧,第一本就是《雪崩》,另一本是戴維·格倫恩特爾的《鏡像世界》。
只不過,當時中文翻譯把Metaverse譯為“虛擬空間”,而不是現(xiàn)在大為流行的“元宇宙”。其實,到現(xiàn)在我也沒搞明白為什么一定要稱之為“元宇宙”,我個人認為“虛擬空間”比“元宇宙”更能表達作者的原意,也更容易為普羅大眾所理解。
字母榜:這是不是意味著,真正的元宇宙還太遙遠?
韋青:我所受到的工程師文化的教育,特別重視技術的大眾化和普及化,尤其需要在技術的術語上盡量采用通俗易懂的語言。
《雪崩》所描述的未來愿景,早在上世紀90年代就讓人們非常激動。過去幾十年像微軟、谷歌、臉書這些公司大都受其影響,并且都在一步一步的努力實現(xiàn)當初的愿景。
但在具體的實現(xiàn)過程中,純粹的虛擬空間只是其中一部分;與物理世界的有機結合,也就是通常人們說的CPS賽博物理系統(tǒng),或者數(shù)字孿生,能夠更加精確的表達技術走勢和技術以人為本的初心。。
歸根結底,物理空間的一切對象,包括對象的屬性、行為和之間的關系,都需要經(jīng)過數(shù)字化建模映射到賽博空間,使得物理空間成為賽博空間內(nèi)可被計算的對象。但是更重要的是,賽博空間內(nèi)的計算結果還需要映射回物理空間,從而起到加強人類現(xiàn)實世界能力的作用。
在這種技術邏輯的約束下,無論稱之為元宇宙、虛擬空間、賽博物理系統(tǒng)、數(shù)字孿生,還是現(xiàn)在聽起來已經(jīng)沒有那么炫耀的物聯(lián)網(wǎng)、語義網(wǎng),其實都有異曲同工的妙義。
尤其是當人們能夠把這些貌似新鮮的概念都拉回到第一性原理之后,它們無非是同一個愿景之根上生長出來的不同枝干,要解決的還是困擾人類幾百年甚至上千年的“可計算”問題以及“計算目的”問題,最終歸結為“人與機器的關系”問題和“技術的使命”問題。
字母榜:想要解決上述終極命題,當下還需要哪些基礎能力的配合?
韋青:比如建模的統(tǒng)一化、數(shù)據(jù)的標準化,又比如RDF(Resource Description Framework,資源描述框架)、OWL(Ontology Web Language,網(wǎng)絡本體語言)。這些看似過于專業(yè)和有些年頭的技術術語,反而可以引起更多的關注,而這種實質(zhì)性對底層技術的關注,有可能更有助于幫助人類實現(xiàn)《雪崩》或者《鏡像世界》所描述的技術愿景。
B
智能時代 重新認識信息化
字母榜:我們該如何理解當下云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術的發(fā)展?
韋青:過去一百多年,人類社會的電氣化進程,最早是少數(shù)商家專注于發(fā)電謀利,其中最著名的就是早期的直流、交流電之爭,形成了歷史上著名的以愛迪生為代表的直流電技術流派,以及以特斯拉和西屋電子為代表的交流電技術流派,雙方圍繞技術與商業(yè)展開爭奪。
當然,大家已經(jīng)看到它的結果,就是近百年來電力已經(jīng)變成了全社會的關鍵公共基礎設施,全世界的主要商業(yè)都基于用電來提升自己的效率和能力,只有極少數(shù)的企業(yè)關注于如何發(fā)電。
有理由相信,在未來的智能時代,信息也是一種與物質(zhì)和能量等同的人類基本力量,或許我們可以稱其為“信息力”。現(xiàn)在大家所爭論與正在實現(xiàn)的技術,比如云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、下一代通訊技術和機器學習,都是我們能夠在短期內(nèi)感知到的賦能型信息技術。
字母榜:更長遠的信息技術會如何賦能?
韋青:我們也需要有這樣一種視野,就是當這些信息技術都成為像電力這種能源技術一樣的、可供全社會使用的關鍵公共基礎設施之后,這一類公共基礎設施會孕育出什么樣的產(chǎn)品與服務能力。
就像人類不能夠直接用電,需要通過被電所賦能的產(chǎn)品與服務而享受到電力的好處一樣,我們也需要有大量的商業(yè)、產(chǎn)業(yè)與學術機構,開始認真思考如何基于這種即將普及的新型信息公共基礎設施,重構全社會所有產(chǎn)品與服務形態(tài)與能力。
在這種技術思維范式下,我們就要精確區(qū)分擁有技術的能力和使用技術的能力。而使用信息技術的能力,恰恰是目前社會大部分企業(yè)以至于個人的短板,這也就是前面我所說的擁有與使用技術的不同思考維度以及不同的發(fā)展路徑。
我們現(xiàn)在不會無聊到問每間公司,或者每一個家庭,或者每個人是否在用電和在用什么種類的電;同樣的道理,什么時候我們不再關注信息技術本身,因為它已經(jīng)融入人類社會的每一個環(huán)節(jié)和每一個角落,也就是微軟對未來技術愿景描述所稱的“無處不在的計算”、“無處不在的智能”和“以人為本的技術”。那個時候,人們就會像過去百年電氣化社會改造所經(jīng)歷的路程一樣,專注于利用各種先進的信息技術改造全人類的生活、學習與工作。
字母榜:現(xiàn)在再提起信息化,是否會顯得有點過時?
韋青:有人可能會質(zhì)疑信息化是一個過時的字眼,我們已經(jīng)快速地邁向智能化的時代。但我們仔細認真想一想,我們?nèi)鐣乃辛鞒痰降子卸嗌僬嬲ㄟ^數(shù)字化技術實現(xiàn)了信息化。全社會的信息化是一個系統(tǒng)工程,它不僅取決于最先進的那一部分,也受制于最落后的那一部分。
正如系統(tǒng)論短板效應所指出的,全社會的信息化能力取決于最短的那塊板。如果不把那塊短板補齊的話,全社會的整體信息化程度是不完整的。這也就是為什么在互聯(lián)網(wǎng)發(fā)展了那么多年之后,大家認識到虛擬經(jīng)濟與實體經(jīng)濟是不可分割的一個整體,數(shù)字能力與物理能力同樣也是一個不可分割的整體。
當我們利用數(shù)字化技術,把過去幾十年未被信息化的全社會流程、產(chǎn)品和服務都做到信息化之后,虛擬和物理空間完全呼應之后,物理實體與數(shù)字孿生完全對應之后,如果把這個稱之為元宇宙,那倒可能是人類開始踏入智能社會的象征。要想實現(xiàn)這個目標,我們現(xiàn)在所談論的所有先進的或者不先進的數(shù)字化技術,就有了它們真正的用武之地。
當然,與此同時還會有科學家們繼續(xù)突破人類現(xiàn)有的認知局限,堅持不懈地去探索和摘取最終的人工智能的明珠。這種工程實現(xiàn)與科學探索是交相呼應、協(xié)同發(fā)展的過程,都會對社會的發(fā)展做出巨大的貢獻,只不過它們的關注點和實現(xiàn)方式有所不同。
C
人工智能:尚待摘取的皇冠明珠
字母榜:Facebook人工智能首席科學家楊立昆最近出版了新書《科學之路——人、機器與未來》,你為何為其撰寫推薦語?
韋青:楊立昆教授在人工智能和機器學習領域以敢言而著稱。他親身經(jīng)歷了人工智能在過去幾十年的發(fā)展過程,堅持倡導以深度學習為代表的機器學習方法,屢經(jīng)挫折和考驗。這種經(jīng)歷和感受,對于有志于在人工智能與機器學習領域有所發(fā)展的后來者,有很大的借鑒意義。
“以史為鑒,可以知興衰”;“以人為鑒,可以知得失”。了解任何一門得到廣泛應用的技術,都需要經(jīng)歷漫長的探索與研究過程。而作為一個科學家為了能夠有所成,就要甘于寂寞,勇于創(chuàng)新,同時又要有所堅持。這種科學精神和具體實踐,對于即將到來的智能時代的技術發(fā)展,具有重大的指導意義。
字母榜:讀完這本書給您帶來了哪些新的認知?
韋青:我為這本書寫序的過程,也是一場伴隨機器學習成長的學習之旅。可能由于我的工程師背景,我對楊立昆教授在實現(xiàn)機器學習過程中的工程方法論感同身受,對于技術的“擁有”和“利用”,也就是大家口頭上經(jīng)常說的技術是否“有”和”用“之間的矛盾與統(tǒng)一非常認可。
在我們的實踐中,人們很容易將“擁有技術”自動地等同于“應用技術”,而原則上只要有錢就有可能買到和擁有某種技術。但是之后往往需要經(jīng)歷長期的學習和嘗試階段,才可以把花費了很多資金而擁有的技術真正應用到位,讓它確實發(fā)揮作用。這恰恰是目前機器學習開始應用到各行各業(yè)所面臨的主要障礙之一。
字母榜:有哪些辦法能讓機器學習能力再次突破嗎?
韋青:機器學習發(fā)展到目前這個階段,要想做出突破已經(jīng)不是一件容易的事情,大概率上需要有科學范式的突破。這種突破需要集全球眾多科學家、數(shù)學家和工程師的共同努力,應該不是一般企業(yè)能夠獨自承擔的重任。對于絕大多數(shù)企業(yè)而言,我們真正的任務和社會使命是利用現(xiàn)有機器的能力來造福人類,重點應該是聚焦于工程實現(xiàn)領域。
其實僅以目前的機器學習技術水準來看,已經(jīng)足夠為人類社會的發(fā)展做出巨大的貢獻,當然實現(xiàn)這個目的的前提是腳踏實地,大家的眼光不能只專注在看起來很美的人臉識別或語音識別上面。
從人類社會的運作機制而言,我們有大量的任務流程,可以被目前的機器學習能力所優(yōu)化、完善和自動化。我們現(xiàn)在已經(jīng)可以利用機器學習,將上一世紀末已經(jīng)做過“業(yè)務流程再造”,繼續(xù)循環(huán)迭代地重復進行下去,只不過現(xiàn)在我們有了機器學習這一強大助力,因而能夠更高效地為人類社會帶來利益和福祉。
字母榜:有人認為,目前多數(shù)人工智能公司依然屬于勞動密集型,人工占比很重。
韋青:另一位人工智能領域的科學家吳恩達博士,最近給正在利用機器學習為各行各業(yè)賦能的實踐者提出了建議。
吳恩達博士提醒大家,業(yè)內(nèi)大量的實踐者已經(jīng)體會到,在機器學習落地的具體工作中,80%精力要消耗在數(shù)據(jù)的收集和整理方面;而那些看起來很美、很炫、很厲害的算法工作,其實只占到了大約20%的精力。
那么我們?yōu)槭裁床话阎饕木Ψ旁趦?yōu)質(zhì)數(shù)據(jù)的獲取和清理呢?這其實反映的就是我們常說的科學、技術與工程的不同特征。很多在我們?nèi)粘I钪袘玫降年P鍵技術,都不是當時最先進的技術,但必須是當時最可靠、易于維護和經(jīng)濟效益最佳的技術,這是工程實踐的基本理念。
舉一個例子,大家可能以為,能夠登上火星的設備所使用的技術,應該是最先進的技術。實際上,控制“毅力號”火星車的中央處理器,是一片與1998年Power PC芯片技術相同的芯片。它的重點不在于計算的速度和用多少納米來實現(xiàn),而在于在外太空的嚴酷環(huán)境下,還能夠正常運行,以實現(xiàn)它被賦予的任務。
無論是楊立昆還是吳恩達,以及包括微軟在內(nèi)的眾多行業(yè)實踐者,所推崇的都是一種平衡的發(fā)展觀。這是對技術創(chuàng)新與工程實現(xiàn)的綜合考慮,也是對擁有技術與利用技術的理性把握。
字母榜:當前的人工智能處在什么階段?
韋青:我曾有機會與楊立昆書中提到的若干業(yè)界前輩交往。這些在這個領域鉆研數(shù)十年的學者,對于人工智能和機器學習能力的不同階段,有非常清醒的認知。
他們大都將人工智能定義為人類希望摘取的科學皇冠上的一顆明珠。但具體什么時候能夠摘取到這顆明珠,沒有人能夠給出確切的答案。也許幾十年,也許幾百年、幾千年,也許不可能實現(xiàn),因為人類現(xiàn)在連什么叫“智能”都沒有給出統(tǒng)一的解釋。
正因為如此,他們也大都將目前機器的能力精確定義為是機器學習階段。薩提亞在他的《刷新》一書中說,人工智能分為三個層次,即底層的簡單模式識別能力,中間層的感知能力,以及最高級的認知能力。現(xiàn)在的發(fā)展大致處于底層和中間層的階段。
字母榜:明確這個階段機器所能達到的能力,對業(yè)界有什么作用?
韋青:當人們把關注點放在機器的現(xiàn)有能力,而不是科幻小說中所描寫的未來能力的時候,人們就可以把精力放在如何充分發(fā)揮機器的特長,來幫助人類減輕工作負擔和生活壓力。
在我看來,這種能力由場景驅(qū)動,或者也可以稱為實際行業(yè)痛點驅(qū)動,然后基于數(shù)據(jù),通過計算,由算法實現(xiàn)的流程自動化能力。這是一種工程實現(xiàn)的能力,也是一種“學以致用”、“有以致用”的能力。
據(jù)我所知,這也是包括微軟在內(nèi)的大多數(shù)科技公司正在做的事情:通過技術賦能人類社會的各行各業(yè),通過機器的幫助成就他們原來不可想象的非凡能力。
明確這一點非常重要。就像過去幾百年來的一些思想家們不斷提醒人們的,機器的能力既可以幫助人類獲得更高的幸福感,也可以損害人類的利益。其發(fā)展方向絕對不是唯技術論的,必須是以人為本。
本文來自微信公眾號 “字母榜”(ID:wujicaijing),作者:趙晉杰,36氪經(jīng)授權發(fā)布。