为什么说AR头显并非FOV越大体验感越好?

研究显示其实40、50°就够了...





Esther| 编辑

上个月,一家名为Kura的美国AR初创公司发布一款全新的轻量级AR眼镜:Gallium。据官网称,Gallium采用一体化设计,机身重量仅80g,采用自研的结构化几何光波导方案,视场角高达150°,透光率达95%,亮度也高达4000nit,支持8K分辨率和DCI-P3色域。

Gallium的推出,引发了业内人士的讨论,有人甚至还曾质疑其真实性。此前青亭网在《AR光学系统全解析》一文中也曾提到过,根据光学公式推算,150°对角线光波导理论上其光学模组尺寸可达135mm x 100mm左右,不仅在体积上不可行,还将产生双目重叠的问题。

Kura
总之,考虑到目前市面上主流AR头显Magic Leap One和HoloLens 2的视场角分别仅为40°x30°和43°x29°,不难想象增大视场角是目前AR光学领域依然需要攻克的难题,毕竟这同时还受到其他因素限制,比如角分辨率、亮度、对比度、透光率、图像伪影、失真、一致性,或者非显示问题,如:适眼区、大小、重量、电池、成本、耐用性等。



黑色为头显遮挡的视觉区域,可见HoloLens 2比Magic Leap One的透视区域大得多

对AR视场角的执着来源于VR?

FOV对于AR固然重要,但就像吃冰淇淋一样,数量多了很容易产生副作用。不过,现在很多人将FOV作为评判和对比AR头显唯一重要的标准,这可能是因为受到了VR影响,而AR和VR从多种方面是非常不一样的。

VR主打沉浸感,大视场角能更好避免打破沉浸,目前市面上的VR头显已经可以做到100°到200°左右,是HoloLens 2视场角的很多倍。同时,VR起步比AR更早一些,人们在体验过VR的大视场角后,也希望能在AR中看到同等水平,甚至将视场角作为评判标准。

殊不知,AR与VR的应用场景其实并不完全相同,目前AR可能更注重于生产力等场景,旨在为用户提供信息,也就是说重点在于能够显示足够清晰的文字,因此很多应用场景对于光学模组的分辨率要求较高。

理想的角分辨率是每像素1弧分,而大多数VR头显的角分辨率约为每像素5弧分。为了让用户看清文字,VR中的字体不得不放大,而且看起来也比较粗(由于纱窗效应),因此文字和数字会占据大面积FOV。与此同时,人眼扫视的范围也更大,长时间观看容易产生视觉疲劳。

若想有效显示清晰的文字,那么角分辨率需要得到提高。目前,与手机、电脑甚至智能手机的屏幕相比,VR显示屏分辨率还有很大差距。

VR与AR光学结构不同

市面上大多数VR头显采用手机屏幕大小的平面显示器和简单的透镜,这种结构不仅可降低成本,也能带来大FOV,缺点是角分辨率低。此外,VR头显的体积大多笨重,像是在滑雪护目镜上加上了沉重的附加模块。

相比之下,AR头显的外形设计普遍偏轻,并且具有一定透明度。而且,光学模组采用的微型显示屏面积约比VR显示屏小100倍,像素颗粒长度约小12倍。为了让微型显示屏的小颗粒像素更适合阅读,则需要采用较为昂贵的透镜,而且还需要混合的光学模组结构将数字内容与真实世界融合。

微型显示屏像素颗粒小意味着分辨率高,不过若要提高FOV,微型显示屏尺寸也需要增大,这样并不实际。于是,市面上采用微型显示屏的AR头显的角分辨率约在每像素1到1.5弧分范围,并且难以提供50°以上的视场角。除了光学模组本身限制,光波导类型的混合光学本身特性也会限制视场角。

(注:1弧分在阅读距离大约能显示300ppi,苹果曾将首款超过300ppi的iPhone屏幕成为视网膜显示屏。)

为了提升FOV,也有些较低成本的AR头显,采用类似于鱼眼原理的半反半透式光学模组,结合类似于手机屏幕大小的显示屏和一对球面组合器(Meta 2、Mira、DreamWorld、iGlass)。这样做的好处是FOV变大了(Meta 2视场角可达90°),不过角分辨率非常低(与一般的VR头显差不多),同时也存在图像失真、焦点不均匀等缺陷。

此外,尽管混合光学模组体积较大,采用这种技术的AR头显体积并不会比光波导光学的AR头显更大。

为什么大FOV不见得是好事

在今年国际光学工程学会举办的Photonis West展览会上,前Google Glass项目的技术主管/经理Thad Starner主张,大FOV不仅牺牲了体积、重量、成本、舒适度、可被社会接受的外形等关键元素,而且还可能起到反作用。

Thad Starner
据了解,Starner从1993年开始一直持续使用AR眼镜,到现在已经26年了。在AR领域里,他更像是一个逆向思维者,主张降低AR头显/眼镜的FOV,从而优化体积、重量、舒适度和外形等更重要的部分。

Starner觉得,并不是FOV越大越好,AR应该越简单越好,复杂的光学反而失去了AR的优势,他愿意为了更轻便自然的外形而牺牲AR眼镜的其他性能。在今年Photonics West上,他本人就佩戴了一副North Focals AR眼镜,这款眼镜视场角仅为15°,适眼区小,而且图像质量一般,不过他觉得适合自己。

大FOV遮挡医生的手
而他所说的反作用,指的是过多的AR图像可能会遮挡真实环境中你需要看到的东西,比如外科医生做手术时的手。此外还建议,或许将AR影像放在正面视觉的一侧通常效果比较好。

叠加在真实环境上的AR内容,是会提升用户的能力,还是会产生干扰,甚至产生危险,将是一个重要的问题。比如,如果AR头显遮挡住用户的余光,那么他是不是就看不到周围的环境。尽管我们常说,人眼余光分辨率较低,但是它对于周围的运动足够敏感,如果受到遮挡,会不会让过马路的行人看不到驶来的车辆?

那么多少FOV够大呢?

Starner指出,即使是电影院屏幕的视场角其实也不大,THX标准中指出电影屏幕与座位之间的摆放方式只需要为观众提供约35到40°的最佳视场角。这是因为视场角太大,观众就需要像近距离看乒乓球一样来回摆头,体验感并不好。Starner甚至还列举了现有屏幕技术通常所需的FOV,范围大约在6.4度到55度(横向视场角)之间。



尽管Starner列举出的包括一些最低视场角,以及低配iPhone和iPad mini所需的视场角,但是他的观点足够合理,大家高估了人眼所需的FOV。

他表示:许多AR的应用场景中,其实并不需要超过30°FOV(相当于普通的HDTV),而且即使是FOV更小的眼镜也很实用。因此认为,AR的FOV大小与不同的应用场景有关,而且即使是家里有大尺寸LCD电视的人,在坐着观看的时候通常也只需要20到30°FOV。

关于固定视觉敏锐区

Bernard Kress论文图表
那么对于AR眼镜来讲,到底需要多少视场角来显示清晰的细节信息呢?对于这个问题,前Google [X] Labs首席光学架构师,现微软HoloLens合作光学架构师Bernard Kress在论文中用一张图表解释了人眼视场角原理。

Wikipedia图解
图表中显示,人眼中央凹(视网膜中视觉最敏锐区域)分辨率最高的区域仅占3°视场角(Wikipedia数据则认为占5°),不过实际情况也会因不同的中央凹大小和形状而定,而且中央凹也会受到儿童早期近视等原因影响。总之,人眼视觉最敏锐区域仅占整体FOV的一小部分。

尽管中央凹是唯一达到20/20视觉的部分,但研究表明其周围分辨率较低的近窝区也可以帮助阅读文字。同时,人眼会保持持续跳动(飞快扫视,saccade),而人眼视觉系统会结合每次扫视捕捉到的各种分辨率快照生成眼前的图像,这一过程通常人眼察觉不到。

人眼阅读规律
Starner强调,通常报纸专栏仅占6.6°横向视场角(以阅读距离查看),只有6.6°横向视场角才可以向人眼传递足够多的文字。

而Kress认为,人眼在一个固定视觉敏锐区中移动中央凹,可保持舒适体验感,这个区域大概占40°到50°视场角,不过具体因人而异。同时也有其他研究认为,这一数字在25°到40°之间。



此外,Starner还认为,即使人眼在短时间内可以在固定视觉敏锐区移动自如,但进行不到30分钟后也会产生视觉疲劳。他引用了Malcolm Haynes 2017年论文中提到的论点:眼球生理学为未来的头显设计提供了一些基础范围,比如由于眼球运动的机械限制,横向视场角不应该超过55°,45°以内最佳,而舒适的视觉甚至不超过主要注视点左右的10-20°。

研究还表明,人眼注视点外20°以上的地方不应该持续显示内容,如此一来,如果AR头显将清晰内容显示在用户注视点前方,那将有可能阻挡他们的视线,如果显示在注视点较边缘的地方,则容易引起视觉疲劳。

而超过固定视觉敏锐区外的内容,可能将需要你通过转头而不是转动眼珠才能看到。通常,人们在看电视的时候会不得不转头,不过AR头显将显示屏放到你眼前,本质上应该减少这种情况。

与2D屏幕不同之处

AR头显和电视、电脑屏幕有相当大差别,因为你在转头的时候头显的屏幕也会跟着移动,也就是说内容超出人眼水平注视点15°左右的时候,会忍不住转头。

如果使用SLAM和眼球追踪技术,则可以将AR内容定位在周围空间中,类似于将显示屏固定在你四周,不过这将需要尽量模拟人眼跳动和聚焦,才能带来自然的体验感。总之,AR头显的界面需要与固定的2D显示屏有所不同。

拿Varjo来讲,其VR头显为每只眼睛提供两块屏幕,一块高分辨率放在中间,而周围则采用一块较低分辨率屏幕。不过高分辨率屏幕不能随人眼移动,仅覆盖32°x18°视场角。为了避免肉眼识别到两块屏幕的交界,Varjo甚至将高分辨率屏幕的70像素每弧分提升到60像素每弧分,以覆盖更多视场角,不过这并不是万无一失,除非将视场角提高到40到50度左右。

相比之下,苹果在前不久曝光的一项MR全息眼镜专利中指出,利用多个扫描激光投影仪和激光阵列,可为MR头显生成一个视网膜投影的注视点渲染方案。据悉,苹果专利中提及的AR眼镜包括反射式全息组件,目的就是将光源图像反射到用户眼中,同时一并将环境光输入,提升整体的视觉观感。

总结

总之,不同应用场景对于AR头显的FOV和角分辨率要求各有不同,而且FOV并不是决定AR眼镜体验感更好的唯一因素,支持清晰文字阅读的高分辨率也十分重要。

对于AR厂商来讲,他们自然希望AR眼镜能兼顾外形和舒适感,只是目前的产品更像是为了兼顾所有元素,而并没有专注于哪一个。除了尽量提高光学和显示参数外,甚至还集成计算模块、传输硬件和电池(或采用分体式模块),结果是这些AR眼镜只能被比较小众的B端市场接受,而且几乎没有人愿意长时间使用。在不使用的时候,还需要用大盒子来进行保存和携带。

(END)


推荐阅读



每天五分钟,轻松了解前沿科技。
—— 青亭网


0 个评论

要回复文章请先登录注册