【盤點】眼動追蹤在XR中的八大應用,注視點渲染僅是「前菜」

2023-05-09     VR陀螺

原標題:【盤點】眼動追蹤在XR中的八大應用,注視點渲染僅是「前菜」

文/VR陀螺 冉啟行

眼動追蹤——能夠快速準確地檢測用戶在 VR 頭戴設備內的注視方向,經常在注視點渲染的應用場景下被談論,它是如何調用資源,提高用戶近眼顯示質量,降低設備功耗。

多年來,眼動追蹤一直被認為是 XR 一項遙遠的技術。伴隨著以 Tobii、七鑫易維為代表的供應鏈技術的成熟,XR 開發需求的疊加,從 2022 年以來,越來越多的 XR 設備開始配備眼動追蹤技術,PS VR 2、Quest Pro、Vive Pro Eye 和 PICO 4 Pro 是目前 XR 消費市場中最典型的商用案例。

眼動追蹤技術落地勢頭猛烈,預測在未來幾年內可以看到該技術成為消費級 VR 頭顯的標配,當然,AR 眼鏡在顯示、功耗與體積未達最優解前可能還需要更長時間。

雖然注視點渲染是眼動追蹤在 AR 和 VR 頭戴式設備中的一個令人興奮的技術場景,但眼動追蹤的作用不僅於此。基於眼動追蹤技術與更多 XR 軟硬體的「串聯」,可以開啟更多產品功能,顯著提高用戶體驗。

圖源:網絡

一、注視點渲染,基於人眼中央凹

注視點渲染(Foveated Rendering)是大多人對於眼動追蹤技術的第一印象,它旨在降低顯示要求苛刻的 XR 場景所需的算力。

「注視點渲染」的名稱來自「中央凹」(fovea)——它是視網膜中視覺(辨色力、分辨力)最敏銳的區域。以人為例,在視神經盤顳側約 3.5mm 處,有一黃色小區,稱黃斑,其中央的凹陷,就是中央凹。

圖源:網絡

中央凹為我們提供了視野中心的高解析度視覺,與此同時,我們周邊的視覺實際上在捕捉細節和顏色方面非常差,更適合發現運動和對比。你可以把它想像成一個相機,它有一個只有幾百萬像素的大傳感器,不過還有一個位於中間的小傳感器,有著上千萬像素。

實際上,人類可以看到高細節的視野區域比大多數人想像的要小得多,僅在視野中心占有幾度。中央凹與視網膜其餘部分的分辨能力差異巨大,如果沒有中央凹,用戶也將無法辨認此頁上的文字。

現在,我們可以做一個小實驗。如果你將眼睛集中在這個詞上——「Fovea」——並嘗試閱讀下面的三行文字,你會發現幾乎不可能看清楚這些文字,只能感受到它們是一群模糊的文字。人們高估視覺中央凹區域的原因似乎是因為大腦做了很多無意識的解釋和預測,以建立一個我們相信的世界的模型。

注視點渲染旨在通過僅在中央凹看到的區域以高解析度渲染虛擬場景,利用人類視覺特性,大幅降低周邊視覺中無法仔細分辨的細節場景顯示質量。這樣做可以讓我們將 XR 設備大部分處理能力集中在對畫面細節貢獻最大的地方,同時在其他地方節省運算資源。

圖源:網絡

這聽起來可能不是什麼大不了的事,但隨著 XR 頭戴設備顯示解析度和 FOV 的提高,渲染複雜場景所需的功率也會相應提升。此時眼球追蹤自然會發揮出最大的作用,成為提高近眼顯示質量和節省設備資源的最佳調解器。

二、注視點顯示,提高解析度質量

注視點顯示不是僅僅是改變螢幕顯示中某些部分的渲染細節,而是實時跟蹤渲染,無論用戶看向哪裡,它都始終保持在用戶視線的前面。

圖源:網絡

注視點顯示打開了在 AR 眼鏡和 VR 頭顯中實現更高解析度的大門,而無需通過試圖在整個視野範圍內以更高解析度填充像素來強行解決問題。這樣做不僅成本高昂,而且由於像素數量接近視網膜解析度,還會遇到具有挑戰性的功率和尺寸限制。

相反,注視點顯示器會根據眼球追蹤數據將一個更小的、像素密集的顯示器移動到用戶所看的任何地方,這種方法甚至可以獲得比單一平面顯示器更高的視野。

在Varjo的頭顯中,像素密集的注視點顯示器與更大、像素密集程度低得多的顯示器大致近似。(圖源:Varjo)

一個經典行業案例是 Varjo 的 VR 頭顯光學系統設計,他們在頭顯中使用一塊顯示屏,覆蓋了廣闊的視野(但像素密度不是很高),然後在上面疊加一個像素密度要高得多的微顯示屏。這兩者的結合意味著用戶的周邊視覺可以獲得廣闊的視野,而中央凹的視覺可以獲得非常高解析度的區域。

誠然,這種注視點顯示仍然是靜態的(高解析度區域停留在顯示器的中間),而不是動態的,但該公司已經考慮了許多移動顯示器的方法,以確保高解析度區域始終處於用戶視線的中心。

三、個體識別、XR支付、自動IPD調整

除了檢測眼球運動外,眼動追蹤還可以用作生物識別符。這使得眼動追蹤成為單設備,多用戶差異化帳戶配置的理想選擇——當一名用戶戴上 XR 頭戴設備時,系統可以立即將其識別為一個獨特的用戶,並調用自定義的虛擬環境、內容庫、遊戲進度和功能設置。當其他用戶戴上 XR 頭戴設備時,系統可以加載他們的偏好設置和應用數據。

當然,這裡涉及在眼動追蹤模組中加載其他生物識別算法(如虹膜識別),據 VR陀螺獲悉,眼動追蹤和虹膜識別可以共用一套傳感器,而無需增加新的硬體,通過相應虹膜算法SDK的加載,XR 設備的眼動追蹤還可以實現虹膜 XR 硬體解鎖、虹膜支付等功能。

眼動追蹤還可用於精確測量 IPD(瞳距)。了解用戶自身的 IPD 在 XR 中很重要,因為需要將鏡頭和顯示器移動到最佳位置,用戶才能獲得舒適的視覺效果。

圖源:網絡

不幸的是,很多人並不知道他們的 IPD 是多少,從而導致在使用過程中,視野中常出現一條黑線,雙眼分看割裂畫面,調試適配的過程並不難,然而卻是無形中增加了時間成本,同時讓人感覺 XR 的手動「落後性」。

通過眼動追蹤技術,XR 設備可以很容易地檢測到每個用戶的 IPD,然後讓頭戴設備通過系統調動鏡頭移動,以毫米級的精度自動適配人眼的最佳觀看位置。從用戶體驗角度來看,整個適配過程是更具含金量,並且相比於傳統的手動 IPD 調節,依賴眼動追蹤技術的自動 IPD 調節更加精準與科學。

在某些 XR 設備中,IPD 的適配是全自動化的,開機即用,而無需用戶做任何適配動作,就像是你的智慧型手機在日光下,光線傳感器會受到刺激,從而調用最大亮度,以讓你可以看見,而 XR 設備未來的 IPD 趨勢也將在眼動追蹤的驅動下,更加無感智能化和自動化。

四、可變焦顯示器,解決VAC難題

從非球面透鏡到 Pancake 摺疊光路,VR 頭顯的光學投影方案愈加成熟和精進,相關技術路線也十分多樣。然而,它們卻並不支持人類視覺的一項重要功能:動態變焦。

當前的 VR/AR/MR 頭戴式顯示設備經常存在所謂的視覺輻輳調節衝突(vergence-accommodation conflict,簡稱「VAC」),通常立體圖像能夠驅動用戶的人類視覺系統的聚散狀態至任意距離,但在頭顯中用戶眼睛的調節或聚集狀態被光學系統驅動到了一個固定的距離。

因此,在長時間的 VR/AR/MR 環境中,當雙眼視差與眼睛的聚散調節不一致時,VAC 便會產生,其後果是導致人眼疲勞,甚至是噁心和頭痛(具體反應因人而異)。

圖源:網絡

變焦顯示器——那些可以動態改變焦深的顯示器——被提議作為解決 VAC 的一種方案。變焦顯示器有多種實現方式,其中最簡單的可能是從光學系統層面實現,在該系統中,顯示器在鏡頭之間物理地來回移動,以動態改變焦深。

實現這種可驅動的變焦顯示器需要眼動追蹤,因為系統需要準確地知道用戶正在看場景中的哪個位置。通過從用戶的每隻眼睛追蹤進入虛擬場景的路徑,系統可以找到這些路徑的交點,從而建立用戶正在查看的正確焦平面。然後將此信息發送到顯示器以進行相應調整,將焦深設置為與用戶眼睛到物體的虛擬距離相匹配。

採用良好的變焦顯示器不僅可以消除 VAC,還可以讓用戶專注於比現有頭戴設備更接近他們的虛擬物體,達到更沉浸式的體驗。

一個變焦頭顯原型(圖源:英偉達)

在我們將變焦顯示器放入 XR 設備之前,眼動追蹤可以用於模擬景深,這可以近似於用戶眼睛焦平面之外的物體的模糊。

截至目前,市場上還沒有具備變焦功能的 XR 頭戴設備,與以前的「眼動追蹤」技術類似,這是一項具備未來應用價值,但尚未成熟的技術。在眼動追蹤技術加入後,有望進一步加速該技術的研發與落地。

五、更自然的VR虛擬社交,眼神交互

目前,大多數 VR 社交軟體似乎都向用戶展示了真實的眼球運動,包括眨眼、掃視和物體聚焦,包括《VRChat》、《Horizon Worlds》 和《Rec Room》等。

精確的眼球追蹤數據可以很容易地應用於 VR 數字化身,以表示用戶何時眨眼,以及他們在看哪裡。它還可以解鎖有意識和無意識的非語言交流,如眨眼、眯眼和瞳孔擴張,甚至可以用來推斷一些情緒,如悲傷或驚訝,這些情緒可能會反映在化身的臉上。

以社交起家的 Meta 一直在推動次時代 VR 硬體上的社交,如 Quest Pro 就具有眼球追蹤和面部追蹤功能,為虛擬形象帶來了更真實的表達。

六、意圖理解與分析,適用於VR遊戲開發

正如上文所提,通過對於用戶眼球的追蹤,眼動追蹤對於被動地理解玩家的意圖和注意力也非常有用。

假設開發者正在製作一款恐怖遊戲,其中玩家在鬼屋中徘徊。傳統上,開發者可能會花很長時間製作一個腳本序列,讓怪物在玩家進入某個區域時從壁櫥里跳出來,但如果玩家沒有直視壁櫥,他們可能就會錯過恐懼。

圖源:網絡

而現在,眼動追蹤就可以用來觸發對應事件,只有用戶看向正確的方向,怪物才會猛然出現,又或者直接跟隨出現在人眼直視的區域。當然,如果設計師想製造一個更加驚悚恐懼的氛圍,還可以讓 NPC 出現在人眼的的周邊區域,利用眼動追蹤,每當人眼試圖捕捉它時,它就自動切換位置,最大程度地展示恐懼,達到最佳效果。

在 PlayStation VR2 上,VR 恐怖射擊遊戲《黑相集:之字路VR》在眼動追蹤和恐怖方面做了一些更有創意的事情——在遊戲的某些區域,有一種幽靈般的人體模型,只有在你眨眼的時候才會移動……

圖源:網絡

除了利用眼動追蹤來最大化恐怖感,這種被動輸入還可以幫助玩家在虛擬環境中獲得更高的精確度。例如,同樣在 PlayStation VR2 上的《地平線 山之呼喚》中,用戶的視線被用作一種「自動瞄準」,以幫助遠距離拉弓顯示更準確。

眼球追蹤製造商 Tobii 展示了如何使用相同的概念來提高 VR 里投擲物體的準確性,通過根據用戶的目光推斷他們打算將物體扔向何處,系統將改變投擲物體的軌跡,使其達到完美精確的投擲。下面的剪輯動圖雖然顯示了實際和修正的軌跡,但在 VR 里的實際使用中,這對用戶來說是完全不可見的,讓人感覺更自然,體驗更佳。

圖源:網絡

除了這種實時的意圖理解,眼動追蹤對分析也非常有用。通過收集有關用戶正在查看的內容和時間的數據,開發人員可以更深入地了解他們的應用程式是如何被使用的。

例如,眼球追蹤數據可以顯示用戶是否發現了一個重要的按鈕機關,他們的注意力是否被環境中一些意想不到的畫面部分所吸引,介面元素是否未被使用等等,幫助開發者更好地優化內容。

七、主動輸入:遠距離抓物,提升交互效率

當然,眼動追蹤對於主動輸入也很有用,允許用戶有意識地利用他們的目光使遊戲任務更容易完成。雖然現在許多 XR 應用程式允許用戶通過指向物體,並按住「側握鍵」遠程抓取物體到手中,但眼球追蹤可以使這一過程更快、更準確,讓用戶只需觀察並抓取即可。

在該操作中使用眼動追蹤實際上可以更準確,因為我們的眼睛實際上比用手柄更擅長指向遠處物體,而我們的手有時會產生自然的抖動,對於指向遠距離的物體時會有一定誤差。

與抓取物體類似,眼動追蹤輸入還有助於拓展提高 XR 鍵盤輸入交互的速度和效率,允許用戶按下按鈕和做其他動作,比移動身體或用手要快得多。可以預測,當 XR 成為一個真正高效的通用計算平台時,眼動追蹤輸入將發揮重要作用。

八、醫療保健和研究,檢測腦震盪

此外,眼動追蹤在醫療保健和研究領域也有廣泛的應用,像 SyncThink 這樣的公司正在使用帶有眼動追蹤功能的頭戴設備來檢測腦震盪,據稱可以提高現場診斷的效率。

2022 年 3 月,SyncThink 宣布與 PICO 合作, PICO Neo 3 Pro Eye 設備結合 EYE-SYNC 後 ,將可以在開機後 10 秒內開始為病患進行評估。通過內置的眼動追蹤,以 90Hz 的頻率運行,臨床醫生可以捕捉到更多重要的數據,以輔助臨床決策。

圖源:網絡

環繞聲空間音頻等其他功能也有助於實現測試程序和病人指導的自動化,在此過程中節省寶貴的時間。

研究人員也可以使用眼動追蹤來收集和輸入數據,比如更好地理解自閉症人群對社交目光接觸的影響,或者為更多人提供遠程無障礙服務等。

考慮到眼動追蹤潛在的諸多功能拓展,眼動追蹤必然會成為未來 XR 的硬體標配,與市場普及的重要推手。

編譯來源、參考資料:

1.眼動追蹤是XR的遊戲規則改變者,它遠遠超出了注視點渲染

https://www.roadtovr.com/why-eye-tracking-is-a-game-changer-for-vr-headsets-virtual-reality/#1525802507571-6d24d015-7321

2.Pancake+可變焦,揭秘Meta(Facebook)輕薄VR頭顯光學設計

https://www.vrtuoluo.cn/528510.html

文章來源: https://twgreatdaily.com/zh-my/707c85543f7a73189c71f9516f4703ab.html