讀而思
duersi
VR作為文字、圖片、視頻之后新的一種信息傳遞的載體,其關(guān)鍵屬性是連接人和人的工具,如何在連接人和人上面實現(xiàn)高效浸入式的交互是VR最核心的未來。當(dāng)下,我們應(yīng)該關(guān)注交互技術(shù)背后必然要求的全新硬件構(gòu)架和軟件語言,其巨大的發(fā)展?jié)摿εc遠(yuǎn)大的前景已經(jīng)畫下了美好的發(fā)展藍(lán)圖。
陳建文 電子科技大學(xué)媒體與視覺研究中心主任,教授/博士生導(dǎo)師, 入選中
組部千人計劃和四川省千人計劃,中國多媒體視頻領(lǐng)域國際專家。
本文發(fā)表于《中國工業(yè)評論》雜志2016年第8期
Facebook CEO扎克伯格稱虛擬現(xiàn)實(VR,Virtual Reality)為“下一代計算機平臺”,而VR這個在世界突然火熱的話題,早在1935年的《皮格馬利翁的眼鏡》這部小說中就有所提及,文中描述戴上這種眼鏡后,就能“看到”、聽到、摸到各種東西。1957年,Morton Heilig發(fā)明的Sensorama提出了VR的概念,從上世紀(jì)60年代到80年代的早期探索,從80年代末到90年代初的爆點和沉寂,到今天全面進入大眾視野。2016年可以說開啟了VR潮流的第三個元年。
VR是人類夢想的實現(xiàn),而很多富有想象力的作家則是預(yù)言家。雷布萊伯利在他1951年發(fā)表的小說《大草原》講述了一對嬰孩和一個虛擬育兒所的故事,而弗雷得里克波爾1955年的小說《地底下的隧道》則提到了一個永遠(yuǎn)重復(fù)體驗同一天的男人,這個男人最后發(fā)現(xiàn)自己原來被困在了一個可怕的行銷虛擬體驗中。簡單來說,虛擬現(xiàn)實技術(shù)是指利用計算機生成一種模擬環(huán)境,并通過多種專用設(shè)備使用戶“投入”到該環(huán)境中,實現(xiàn)用戶與該環(huán)境直接進行自然交互。VR讓用戶使用人的自然技能對虛擬現(xiàn)實中的物體進行操作,并能提供視覺、聽覺、觸覺等直觀自然的實時感知。
開啟VR潮流第三個元年
不可否認(rèn),作為第三個元年,2016年是VR快速發(fā)展的一年。VR是一項融合了計算機圖形學(xué)、人機接口技術(shù)、傳感技術(shù)、心理學(xué)、人機工程學(xué)及人工智能的綜合技術(shù)。它帶給人們的感受是:虛擬和現(xiàn)實之間已沒有明顯界限。通過某種方式,比如佩戴VR設(shè)備,來使用戶產(chǎn)生處于虛擬世界的感覺,包括視覺聽覺,甚至延伸到觸覺及嗅覺。VR技術(shù)可以直接將我們投入虛擬的三維空間中,與交互的環(huán)境融為一體。或者說,讓我們主觀感受到我們本體是沉浸于一個三維的虛擬空間的。例如,可以通過眼睛看到三維立體圖像,通過手和空間的物體進行操作支配,通過在真實世界的行走實現(xiàn)在三維虛擬世界的移動。顯然,這樣的技術(shù)具備三個主要特征:
沉浸感:用戶能夠沉浸于由高性能處理器產(chǎn)生的逼真的三維畫面中。這需要一個封閉的視野范圍,才能夠使用戶沉浸于構(gòu)建的虛擬世界中,并不會有明顯的虛擬和現(xiàn)實的差別。這也是許多VR設(shè)備都需要讓用戶佩戴一個封閉小盒子的原因。但單純滿足于沉浸感,把左右格式的3D視頻搬到眼罩上,并不屬于VR范疇。
交互性:用戶與環(huán)境之間的交流可以被視作交互。利用傳感器、眼球識別、動作捕捉等實現(xiàn)人機交互。VR系統(tǒng)可以說就是一種高級的人機交互系統(tǒng),因此人機交互是虛擬現(xiàn)實的核心,同時也是VR技術(shù)的突破口和技術(shù)難點。
構(gòu)想性:用戶能構(gòu)想客觀不存在或者不可能發(fā)生的事情,通過想象與虛擬現(xiàn)實的結(jié)合來提高效率。虛擬現(xiàn)實技術(shù)給我們描繪的是一個充滿想象的第二個世界,在這個虛擬的世界中,一切都是剛剛開始,目前社會中所有的商業(yè)模式和社交行為,在虛擬的空間中都可以得到復(fù)制甚至增強的體驗。
基于以上三個特點,VR技術(shù)阻斷了人原有的視覺輸入,達到沉浸性;用虛擬構(gòu)想的影像光線占據(jù)全部視覺,實現(xiàn)與影像的交互,達到欺騙大腦的效果。實際上,VR技術(shù)的本質(zhì)是連接方式,處于不同空間位置的用戶可以通過VR,與其他用戶連接在一起,多人同時出現(xiàn)在所構(gòu)想的虛擬世界中。
實際上早在20世紀(jì)90年代,VR的概念就已經(jīng)出現(xiàn)在軍事、工業(yè)、科研、醫(yī)療等領(lǐng)域。然而由于當(dāng)時的技術(shù)條件有限,對于VR的理解還局限在平面模擬的層面,雖然有一定的促進作用,但是整體上不能算是革命性質(zhì)的變革。
從技術(shù)發(fā)展的本質(zhì)上看,虛擬現(xiàn)實經(jīng)歷了下面幾個階段的演進:第一,桌面虛擬現(xiàn)實:這個階段是以電腦仿真和顯示為基礎(chǔ)的相關(guān)應(yīng)用;第二,沉浸的虛擬現(xiàn)實:包括頭顯顯示、虛擬空間的內(nèi)容消費;第三,增強現(xiàn)實性的虛擬現(xiàn)實:頭顯和相關(guān)體感設(shè)備的使用,讓虛擬現(xiàn)實有了初步的交互體驗;第四,分布式虛擬現(xiàn)實系統(tǒng):前面的所有虛擬現(xiàn)實場景都是單人單用戶的虛擬場景,虛擬現(xiàn)實的目標(biāo)是連接人和人,因此多用戶協(xié)同共享虛擬現(xiàn)實才是虛擬現(xiàn)實的未來。
核心技術(shù)難點在于實現(xiàn)VR交互
人們想要進入虛擬現(xiàn)實的VR世界,終端設(shè)備是一個重要工具。當(dāng)下,谷歌、微軟、Oculus、三星、索尼、HTC已率先占據(jù)市場的一席之地,在中國大陸,暴風(fēng)影音、樂相科技等也搶先推出了自己的相關(guān)設(shè)備。隨著終端設(shè)備的市場逐步成熟,將會呈現(xiàn)千軍萬馬過獨木橋的特點,而最后勝出的往往是擁有強悍的技術(shù)和芯片能力的公司。所以,終端設(shè)備已成紅海,市場很快趨于飽和,終端設(shè)備的體驗和成本問題在硬件巨頭入局的情況下會逐步得到解決。目前虛擬現(xiàn)實產(chǎn)業(yè)標(biāo)準(zhǔn)嚴(yán)重缺失,導(dǎo)致產(chǎn)業(yè)鏈發(fā)展不健全,硬件制作五花八門。不過此問題已經(jīng)引起國際各方關(guān)注,行業(yè)標(biāo)準(zhǔn)將會逐步出臺。
筆者認(rèn)為,當(dāng)下VR發(fā)展的核心技術(shù)難點在于實現(xiàn)VR交互。考慮到各種VR設(shè)備的推出以及VR內(nèi)容制造商的逐步統(tǒng)一,步入2016年,VR的交互性將會成為核心。VR作為新一代多媒體手段,將帶給人們更真實的視覺體驗。不同的應(yīng)用場景將存在不同的應(yīng)用界面以供選擇,而且在各個場景中也有很多的人機交互需求。VR的多維特點決定了它的交互要比平面圖形交互擁有更加豐富的形式。目前市面上VR交互方式大致有以下幾種:動作捕捉、觸覺反饋、眼球追蹤、肌電模擬、手勢跟蹤、方向追蹤、語音交互、傳感器這幾個方面,其中手勢追蹤、眼球追蹤、動作捕捉均是目前VR主流的交互方式。
然而交互方式各有優(yōu)缺點,在短期內(nèi)很難實現(xiàn)統(tǒng)一。首先,VR設(shè)備和手機、PC等不一樣,它還不是一個標(biāo)準(zhǔn)化的交互載體,所以交互模式很難達到標(biāo)準(zhǔn)化;其次,VR是三維世界,這必將提高交互的復(fù)雜性與多樣性。若想在三維世界實現(xiàn)沉浸感,VR交互自然應(yīng)該包含現(xiàn)實世界所有的交互方式。著眼于現(xiàn)實,現(xiàn)有的VR技術(shù)主要仍依賴于手柄來進行界面選擇和交互操作,同時運用各種傳感器和機械器件來實現(xiàn)人體動作的捕捉和識別以及人體運動的采集。然而這種交互方式很難讓人擁有最好的體驗和最高的用戶普及使用率。
對于創(chuàng)業(yè)者來說,應(yīng)該提供差異化的服務(wù)和創(chuàng)造新的需求,以此來面對新的挑戰(zhàn)。殊途同歸,大家的目的都是能夠理解用戶并使用戶擁有更加方便的體驗。與所有高新技術(shù)的發(fā)展趨勢一樣,解放雙手永遠(yuǎn)是人們追求的目標(biāo)。沉浸在虛擬現(xiàn)實體驗中的用戶,現(xiàn)在主要靠手柄來實現(xiàn)VR界面選擇和交互操作,而通過手柄進行交互操作會有很強的帶出感,并且長時間的手柄操作將帶來較強的疲勞感和束縛感。
而通過動作捕捉來取代手柄解放雙手,將現(xiàn)實中手的動作導(dǎo)入虛擬界面之中,用戶仿佛置身現(xiàn)實一般,通過自己的雙手選取界面,參與交互。眼球識別追蹤則可以獲知人眼的真實注視點,使得用戶獲得更加真實的視覺體驗,另外通過眼球運動調(diào)整視界,選取功能將會更加便捷。這種基于視頻圖像處理的動作捕捉和眼球追蹤則能很好地提高用戶的參與度和沉浸感,甚至未來可以通過腦電波識別來統(tǒng)一用戶的意識和VR交互操作,以便獲得更具沉浸性的交互體驗。VR交互手段將不斷向著更現(xiàn)實化更簡潔的操作模式邁進,人的機體將更多地參與交互,浸入感將不斷增強。
關(guān)注全新的硬件構(gòu)架和軟件語言
縱觀當(dāng)下VR市場,硬件部分格局顯現(xiàn),內(nèi)容部分即將爆發(fā)。將VR運用到各個領(lǐng)域中,即“VR+行業(yè)”模式潛力巨大。游戲、開發(fā)者服務(wù)、周邊產(chǎn)業(yè)、影視、直播、房產(chǎn)、社交,醫(yī)療、教育等領(lǐng)域?qū)⑹呛芎玫那腥朦c。高盛的分析中指出:“VR可應(yīng)用的幾個領(lǐng)域,從視頻游戲到零售。其中視頻游戲占比最大,但從醫(yī)療到房地產(chǎn)的各行各業(yè)都可能受到?jīng)_擊。”伴隨著VR頭顯以及游戲內(nèi)容分發(fā)平臺等的成熟,標(biāo)志著VR整體技術(shù)進入了成熟期,并且用戶社交習(xí)慣已經(jīng)養(yǎng)成,對內(nèi)容的需求會更加旺盛,將推動電影、短視頻、直播、房產(chǎn)、教育等品類逐漸成熟。
鑒于終端移動化和網(wǎng)絡(luò)速度的提升,互聯(lián)網(wǎng)未來的數(shù)據(jù)80%都會集中在視頻上,它是整合了文字、圖片、音頻的綜合信息形式。所以,視頻VR,也就是虛擬現(xiàn)實視頻,將會改變整個產(chǎn)業(yè)。視頻技術(shù)將是VR行業(yè)的核心基礎(chǔ)技術(shù)。目前行業(yè)中存在浮躁的現(xiàn)象,我們不能草率地認(rèn)為內(nèi)容是VR的核心競爭力。因為從行業(yè)來看,內(nèi)容畢竟屬于少數(shù)具有內(nèi)容創(chuàng)造能力的團體所具有的能力,潛力有限。我們對VR的看法是,VR作為文字、圖片、視頻之后新的一種信息傳遞的載體,其關(guān)鍵屬性是連接人和人的工具。如何在連接人和人上面實現(xiàn)高效浸入式的交互是VR最核心的未來??梢灶A(yù)計,當(dāng)VR連接了醫(yī)生和病人,這個在線醫(yī)療的體驗將會超越目前所有的互聯(lián)網(wǎng)醫(yī)療產(chǎn)品;當(dāng)VR連接了老師和學(xué)生,再偏遠(yuǎn)的山區(qū)的孩子也可以跟最優(yōu)秀的教師一起上課,在線教育的愿景會再次被改寫。
基于以上的市場分析,我們認(rèn)為,提升終端計算力并不是目前科技發(fā)展的主流趨勢,大家更希望借助于速度越來越快的網(wǎng)絡(luò),將主要計算放在云端進行,而直接向終端下發(fā)計算結(jié)果。與此同時,減小計算量、應(yīng)用更有效的視頻處理及壓縮算法也是同樣的道理。我們可以以視頻視覺技術(shù)為切入口,以云計算和高并發(fā)的處理平臺為依托,以視頻分析、視頻感知技術(shù)為交互方式入局VR。VR背后的技術(shù),代表的是在網(wǎng)絡(luò)中直接向人類或者機器人提供感官輸入,這個感官輸入需要更高數(shù)量級的計算能力、更高數(shù)量級的數(shù)據(jù)傳輸能力,自然也會要求全新的硬件構(gòu)架和軟件語言。
目前,電子科大成立的MediaLab就是專注于VR交互的研究和演進,提供在虛擬環(huán)境中人和人連接的最高效交互方式,其形態(tài)包括了視頻交互、全景交互、VR交互等擁有極大潛力的交互方式。同時,作為VR的基礎(chǔ)核心技術(shù),視頻技術(shù)的研究不容忽視。例如視頻壓縮、視頻處理、視頻無線網(wǎng)絡(luò)自適應(yīng)編碼、視頻存儲優(yōu)化等方面的技術(shù)仍可繼續(xù)深入優(yōu)化。目前VR的終端產(chǎn)品一般需要插入手機、PC或者用手柄操作,筆者認(rèn)為這只是階段性的。未來的VR眼鏡應(yīng)該是一體式的,直接和云端的內(nèi)容、應(yīng)用和計算能力相連。所以,交互云平臺的搭建也是一個重要環(huán)節(jié)。比如,實現(xiàn)云平臺動態(tài)負(fù)載均衡、服務(wù)器端多碼率轉(zhuǎn)碼,提供移動端流暢度,實現(xiàn)錄播云存儲,提供實時錄播發(fā)布等,這些都是云平臺的搭建指標(biāo),可以作為我們攻克的方向,同時也是入局VR的機會。
虛擬現(xiàn)實是一場交互方式的新革命,人們正在實現(xiàn)由界面到空間的交互方式變遷。在基礎(chǔ)設(shè)備端,與智能手機和平板電腦的采納過程相比,我們必須承認(rèn)VR在一兩年內(nèi)難以走向大眾,但我們堅信它會在5年內(nèi)像當(dāng)年的智能手機一樣實現(xiàn)井噴。分析師指出:“隨著科技進步、零售價下降以及出現(xiàn)全新的企業(yè)和個人應(yīng)用市場,我們相信VR有望孵化成為數(shù)十億美元的產(chǎn)業(yè),并可能和PC一樣具有劃時代的意義。”所以在當(dāng)下,我們應(yīng)該關(guān)注交互技術(shù)背后必然要求的全新硬件構(gòu)架和軟件語言,其巨大的發(fā)展?jié)摿εc遠(yuǎn)大的前景已經(jīng)畫下了美好的發(fā)展藍(lán)圖,讓我們拭目以待。
(來源:中國工業(yè)評論)