AR眼镜行业专题报告:AI+眼镜崭露头角,AR市场蓄势待发

发布时间:2024-07-26 16:48  浏览量:78

1.1 Meta智能眼镜大卖,AI+眼镜模式好评如潮

Meta 2023 年 9 月发布智能眼镜 Ray-Ban Meta,AI 大模型赋能下销量或已突破百万。 2023 年 9 月,Meta 与 EssilorLuxottica 合作推出的新一代 Ray-Ban Meta 智能眼镜正式 发布。Ray-Ban Meta 内置定向扬声器、麦克风、摄像头等组件,可用于 FPV 拍摄/视频 录制、通话、听音乐等,产品起售价 299 美元。2024 年 4 月,Ray-Ban Meta 在 AI 方面 进行更新,新型号搭载 Meta Llama 3 大模型并可实现语音交互、物体识别、文字翻译等 诸多功能。Ray-Ban Meta “AI+眼镜”的模式一经推出便广受好评,根据 The Verge 数 据,截至 24 年 5 月 Ray-Ban Meta 的全球销量可能已经突破 100 万副;相比之下根据 VR 陀螺数据,初代产品 Ray-Ban Stories 从 2021 年 9 月至 2023 年 2 月累计只售出 30 万副。

我们认为,Ray-Ban Meta 作为 AI 智能眼镜,取得成功的主要原因是其拥有出色的 AI 交 互能力、多模态性能与设计理念,为用户带来了良好的佩戴体验,有望成为 AR 眼镜普及 道路上的里程碑。

Ray-Ban Meta 搭载高通 AR1 Gen1 芯片并集成 Meta AI,提供对话式 AI 助手功能, 有望为 AI+眼镜提供成功范例。硬件方面,Ray-Ban Meta 眼镜采用 4nm 工艺制程的 主控芯片高通 AR1 Gen 1,该平台配备了第三代 Hexagon NPU,同时专门针对散热 限制在功耗方面进行独特设计优化,终端侧 AI 还能够提供音质增强、视觉搜索和实 时翻译等个人助手体验。软件方面,2024 年 4 月 Ray-Ban Meta 在 AI 功能方面进行 更新,新型号搭载 Meta Llama 3 大模型,可以协助处理智能眼镜所获取的文本、音 频与视觉信息。更新后 Ray-Ban Meta 眼镜用户可以通过“Hey Meta”指令唤起 AI, 主要功能包括:1)播放歌曲、开启相机拍摄/录制等基本功能;2)询问天气、对话 交流等互动功能;3)通过指令调用摄像头,实现物体识别、实时翻译等更多视觉化 操作。

Ray-Ban Meta 视频、音频等硬件升级带来了更加强大的多模态性能。视频方面, Ray-Ban Meta 眼镜拥有 1200 万像素超广角摄像头,支持 1080p/ 60fps 视频录制, 同时支持用户直接在 Facebook 或 Instagram 上进行直播;音频方面,该眼镜采用了 新设计的扬声器和 5 麦克风阵列,支持空间音频录制,低音相比初代产品提升 2 倍,最大音量提高 50%,缓解了音频失真缺陷并优化了漏音问题。根据 Wellsenn XR 的 数据,通过对来自 Besy Buy、亚马逊、Meta 官网 3 条线上渠道的 Ray-Ban Meta 智 能眼镜用户评论进行统计,影像、音频是用户关注度较高、评价较好的功能体验,约 43%的用户提及影像(其中 97%表示满意),约 34%用户提及音频(其中 94%表示 满意)。

设计理念方面,Meta 侧重于眼镜的时尚与佩戴属性,更好控制产品形态。Meta 选择 了“先发展智能眼镜产品,随后叠加 AR 显示”的产品逻辑,2021 年初版 Ray-Ban Stories 发布时就提出了“兼顾外形与功能、提供第一人称视角、让用户停留在当下” 的准则,使得 Ray-Ban Meta 眼镜尽量趋近于普通墨镜,提高用户穿戴体验。以产品 重量为例,根据 Wellsenn XR 的数据,普通眼镜的重量通常在 10-30g,而 Ray-Ban Meta 智能眼镜重量在 50g 左右,与传统眼镜相差不大。

Ray-Ban Meta 的 BOM 成本中占比前三依次为芯片、结构件、OEM/ODM,国产供应商 价值量占比 38.90%。根据维深 wellsenn XR 数据,Ray-Ban Meta 的 BOM 成本约为 164 美元,综合硬件成本约为 149 美元。按品类看,芯片成本约为 85.6 美元(占比 52.20%); 结构件成本约为 19 美元(占比 11.59%);OEM/ODM 成本约为 15 美元(占比 9.15%); 摄像头成本约为 9 美元(占比 5.49%)。供应商方面,Ray-Ban Meta 国产供应商包括佰维 (ROM+RAM)、舜宇(摄像头模组)、歌尔等。根据维深 wellsenn XR 数据,国内供应商 综合硬件成本价值量约 63.8 美元,占整机比为 38.90%。

1.2 AR眼镜是智能眼镜的高级形态,有望成为AI端侧落地最优解

Ray-Ban Meta 眼镜属于 AI 智能眼镜,是传统眼镜向 AR/MR 眼镜迭代的过渡形态。目前 的 Ray-Ban Meta 眼镜并不支持 AR 功能,也并不具备眼镜屏幕、3D 拍摄录制等功能, 属于 AI 智能眼镜产品,与 AR 眼镜形态上具有相通性。AR(Augmented Reality,增强现 实)是将由电脑产生的文本、图形、声音等虚拟数据叠加在真实世界中,将虚拟与现实两 个信息进行相互作用,从而达到对真实世界中的数据进行“增强”的效果。AR 眼镜与智 能眼镜在麦克风方案、扬声器方案上有高度重合,双方的一大核心区别在于是否配备显示 屏幕。

目前 AR 整机可分为一体式和分体式两种形态。理想状态下的 AR 智能终端设备需满足计 算、显示和交互三大要素,其中算力单元和显示单元整合为一体的为一体式设备,而依赖 手机、计算盒子等外部计算单元以达到减重等优化效果的为分体式设备。随着未来 AR 终 端设备技术逐渐成熟,理想状态下的 AR 终端设备会倾向于一体化设备,但未来较长一段 时间内会存在一体式/分体式共存的情况。AR 眼镜方面,目前 AR 眼镜按产品形态可分为 单色分体式 AR 眼镜、双目全彩分体式 AR 眼镜与双目全彩一体式 AR 眼镜。

AI 在 XR 行业内应用范围持续扩展,未来 AR 智能眼镜有望成为 AI 端侧落地的最优解。 根据《2023 年中国 XR 企业发展报告》数据,2023 年中国 TOP25 XR 领域技术行业应用 企业中,有 24 家企业应用 AI 拓展行业场景,占比达 96%。细分来看,布局数字教育场 景的企业最多(17 家),其次是数字文旅(12 家)、智能制造(11 家)、智慧能源(8 家)、 数字人(7 家)等,AI 已经逐渐成为 XR 行业标配。

我们认为,随着端侧 AI 逐渐普及,AR 智能眼镜有望成为比肩手机的下一代计算平台, 原因:1)产品形态上,相比其他 AI 产品(VR、MR、AI PIN 等),眼镜产品由来已久, AR 智能眼镜佩戴成本较低;2)信息获取上,AR 智能眼镜贴近人体,能实现随时随地的 交互和信息获取,同时 AR 眼镜具有独特的视角优势,可以实时对佩戴者所看到的场景进 行分析反馈;3)用户体验上,与手机、PC 等传统产品不同,AR 智能眼镜可以通过虚拟 成像等技术来突破物理尺寸的局限,为佩戴者提供更广阔的视觉感受。

AI赋能推动AR眼镜出货量高增,24Q1全球/中国AR眼镜出货分别同比增长16%、34%。 根据 Wellsenn XR 数据,24Q1 全球 AR 销量为 11.3 万台,同比增长 16%,增量销量贡 献来自于消费级 AR 眼镜公司 XREAL、雷鸟、Rokid、Viture 等;预计 2024 年全球 AR 销量为 65 万台,同比增长 27%,增长来源主要来自于 BirdBath 观影眼镜的持续增长,而 “AI+AR”眼镜预计将是行业发展的新变量。中国大陆方面,24Q1 国内 AR 销量为 4.3 万台,同比增长 34%,增量主要来自于雷鸟、XREAL 等观影 AR 眼镜等,此外魅族 MYVU、 影目 air 2、Go、李未可 Metalens 2 等信息提示类眼镜也贡献了一定销量。

1.3 AR眼镜革故鼎新,科技巨头加速布局

由于看好智能眼镜等硬件未来成为 AI 大模型的合适载体,Meta、谷歌、微软、亚马逊、 苹果都准备将 AI 大模型应用在智能眼镜等带有摄像头的可穿戴设备上。科技巨头积极布 局,AR 眼镜有望走上蓬勃发展的快车道。

1.3.1 Meta:AI附能+联手高通+战略侧重,第一部AR眼镜“Orion”呼之欲出

Meta 智能眼镜产品持续迭代,AR 眼镜“Orion”有望于 2024 年亮相。2024 年 4 月 Meta 官网发文预告将推出公司有史以来的第一副 AR 眼镜,该产品有望将现有的两个空间计算 产品线(Meta Quest 3 VR 产品与 Ray-Ban Meta 智能眼镜)整合,形成 AI+AR 眼镜的新 产品形态。而根据 Bussiness Insider,Meta 有望于 2024 年展示一副真正的 AR 眼镜。目 前 Meta 已经积累了 Ray-Ban Meta 智能眼镜的成功经验,叠加 Meta AI 大模型加速迭代 与公司对 XR 领域战略侧重,我们持续看好其在 AR 眼镜领域的发展,未来以 Orion 为代 表的 Meta AR 眼镜值得期待。 大模型方面,Meta Llama 3 在多个基准测试中性能领先,4050 亿参数多模态大模型在 AR 领域应用前景广阔。Meta Llama 3 是在两个定制的 24K GPU 集群上、基于超过 15T token 的数据上进行了训练——相当于 Llama 2 数据集的 7 倍多,代码数据相当于 Llama 2 的 4 倍。Llama 3 在多个关键的基准测试中性能优于业界先进同类模型,能够进行复杂的 推理、可视化想法并解决问题。多模态模型方面,Meta 的 Llama 3-405B 作为多模态 AI 开源模型,能够理解并处理图像、文本等多种媒体内容,进一步拓宽了 AI 技术的应用场 景,并有望在未来持续赋能 Meta 的 AR 与 VR 系列产品。

硬件方面,Meta 与高通合作开发 XR Gen 2 与 AR1 Gen 1 平台,并已在 Meta 的 AR/VR 产品实现应用。2024 年 4 月,高通宣布与 Meta 进行合作,双方将优化 Meta Llama 3 大 语言模型(LLM)直接在智能手机、PC、VR/AR 头显和汽车等终端上的执行能力,同时 高通宣布支持 Meta Llama 3 在骁龙终端上运行。此前高通与 Meta 已经合作开发了 XR Gen 2 与 AR1 Gen 1 平台,其中高通骁龙 XR Gen 2 的 GPU 性能比其前身提高 2.5 倍, 在处理任务时的人工智能性能也提高了 8 倍;而高通骁龙 AR1 Gen 1 平台强化了智能眼 镜侧出色的 AI 能力,能够帮助增强照片和视频的拍摄质量,通过降噪实现更清晰的通话, 并通过计算机视觉实现更清晰的视频拍摄等。目前高通 XR Gen 2 已经应用于 Meta Quest 3 VR 设备,而 AR1 Gen 1 应用于 Ray-Ban Meta 智能眼镜。

战略布局方面,Meta 重组 Reality Labs 部门突出 AR 重要地位。根据 The Verge,2024 年 6 月 Meta Reality Labs 部门宣布重组,所有团队将合并为包括 Quest 头显产品线中央 “元宇宙”部门与涵盖 Ray-Ban Meta 智能眼镜新的“可穿戴设备”部门。部门重组后 Meta 将 AR 产品组更名为可穿戴设备组,并与 Quest 头显产品组并列,突出了 Meta 未来 将持续专注于 Ray-Ban 等智能眼镜产品的战略规划。

1.3.2 谷歌:智能眼镜先行者,联手三星重回XR未来可期

谷歌早在 2012 年就推出其首款 AR 眼镜 Google Glass,但受限于当时硬件算力、制程工 艺、社会接受程度等因素,该产品于 2015 年停售。2024 年 5 月谷歌于“I/O 2024”上发 布发布 AI 助手 Project Astra,实现跨文本、音频、视频多模态实时推理功能。发布会视 频中谷歌展示了盲人戴上搭配 Astra 的智能眼镜后,在走路、看东西时可以实时解读的功 能,凸显了其在 AR 智能眼镜领域的应用潜力。而根据 VR 陀螺,谷歌和三星合作开发了 一款搭载谷歌新软件平台的 MR 头显。我们认为,谷歌与三星联合有望成为其回归 XR 领 域的标志,结合其收购 North、重组 AR 部门等,未来谷歌在 AR 眼镜领域表现值得期待。

1.3.3 苹果:Vision Pro引领空间计算,专利彰显智能眼镜领域设计理念

2023 年 6 月苹果发布全新空间计算硬件产品 Apple Vision Pro,支持 AR 功能并搭配了切 换 AR/VR 模式的控制旋钮,同时使用 EyeSight 技术实现真实世界与虚拟世界随时切换,彰显了苹果在 AR 核心技术领域的丰富积累。而根据 VR 陀螺,美国专利商标局公布了苹 果公司智能眼镜专利申请,该智能眼镜采用“主辅双屏幕+LED 阵列”的设计,当用户检 查新消息或电子邮件时,消息将出现在更高分辨率的主屏幕当中,体现了苹果在未来智能 眼镜领域的设计理念。

1.3.4 国内厂商:“AR四小龙”一马当先,品牌大厂着眼未来

AR 整机厂方面,雷鸟创新、XREAL、Rokid、影目 INMO 在国内 AR 市场份额较高,被 称为“AR四小龙”。根据亿欧智库数据,从2023年消费级AR终端国内出货量来看,Rokid、 雷鸟创新和 XREAL 三家出货量占比分别为 27.9%、26.9%和 26.4%,四家公司占据中国 AR 市场 85%以上的出货量。

大厂方面,华为、小米等均已推出智能眼镜产品,而字节通过收购不断扩充其在 VR/AR 领域能力。华为于 2021 年推出首款搭载 HarmonyOS 的华为智能眼镜切入音频眼镜细分 赛道,并于 2023 年 9 月推出升级版本华为智能眼镜 2;2024 年 5 月推出的华为智能眼镜 2 方框太阳镜已接入华为盘古 AI 大模型,用户可通过敲击镜腿唤醒小艺进行智慧交互。小 米旗下 AR 生态链企业蜂巢科技 2022 年 8 月推出“米家眼镜相机”,采用自由曲面 AR 光 机并配备 Micro OLED 硅基显示屏,可实现部分 AR 增强现实功能;2024 年 4 月推出 MIJIA 智能音频眼镜悦享版,产品定位为价格更低的音频眼镜,售价 499 元。字节 2022 年就有 AR 项目立项,在 VR 领域收购 PICO 后,2024 年 3 月字节又收购了 OWS 公司 Oladance 大十科技,未来有望将其音频技术应用到智能眼镜领域。

AR 眼镜主要包括光学显示、传感器、摄像头、计算处理中心、音频和网络连接等主要模 块。根据艾瑞咨询数据,AR 整机设备中光学显示单元的 BOM 占比最高,约 43%;计算 单元占比第二,约 31%;随后依次是存储单元(15%)、感知单元(9%)与电池(2%)。

2.1 光学单元:光波导为AR眼镜理想方案,Micro-LED未来可期

2.1.1 光学组合器:多种方案各有千秋,光波导是消费级AR理想解

光学组合器将来自微显示器的虚拟信息和现实世界的物理景象组合在一起,决定 AR 头戴 式显示器的体积大小、亮度、视场、效率和眼动范围大小等;目前比较成熟的 AR 技术中 的光学显示方案主要分为 birdbath 方案、自由曲面方案和波导(Lightguide)方案等。 棱镜方案:棱镜方案光学显示系统主要由微型投影仪和反射棱镜组成,微型投影仪 (projector)将图像投射出来,棱镜(prism)通过半返半透结构将图像直接反射到人眼 视网膜(retina)中,与现实图像相叠加,形成虚实融合的视觉体验。采用棱镜方案的 AR 产品包括 Google Glass、Vuzix M300、GLXSS ME 等。棱镜方案有着价格便宜的优点, 但该方案视场角较小,光学显示系统会遮挡用户视线。以 Google Glass 为例,Google Glass 采用的 LCoS+棱镜的方案视场角仅有 15 度,但光学镜片厚度为 10mm,而且存在 亮度不足、图像有较大畸变等问题,因此 Google Glass 在 2014 年正式发货后很快于 2015 年停产。

Birdbath 方案:Birdbath 结构将来自于微显示器的光线投射到位于眼睛前方的分光镜上, 分光镜同时反射和透射光线,而位于分光镜一侧的凹面镜用来反射光线,将光重新导向眼 睛,使用户在看清现实世界的物理景象时,也可看到微显示器生成的数字影像。Birdbath 结构为 AR 眼镜提供了一种较简单的解决方案,广泛应用于谷歌眼镜、ODG R8 和 R9、 联想 Mirage 等 AR 头戴式显示器中。根据易观数据,2022 年第三季度使用 Birdbath 方案 的 AR 眼镜占据了国内消费级 AR 眼镜 87.5%的市场份额。但采用 Birdbath 结构的 AR 眼 镜通常体积较大,视场角一般为 50°左右,同时由于分光镜为半透半反镜,光线经过分 光镜时被多次反射,每次反射都会产生 50%的光损,因此 Birdbath 结构的能量损失严重。

自由曲面方案:自由曲面是一种有别于球面或者非球面的复杂非常规面形,可以使系统的 光学性能指标得到显著提高,同时为系统设计带来更加灵活的结构。自由曲面方案可分为 自由曲面反射镜结构与自由曲面折射镜结构。

自由曲面反射镜结构:自由曲面反射镜结构仅使用一个曲面反射镜收集来自于微显示 器和现实世界的光线。采用自由曲面反射镜结构的 AR 眼镜体积较大,可实现的视场 角为 50°-100°;由于光线仅被反射一次,自由曲面反射镜结构的光损明显降低, 远低于 Birdbath 结构的光损。采用此方案的 AR 眼镜包括 Mira Prism、Meta 2 和 DreamGlass 等。

自由曲面棱镜结构:自由曲面棱镜结构将两个折射面,一个全内反射面和一个部分反 射面合并到一个元件中,此种结构可以增大视场角,同时提高成像质量。但该结构光 学元件的厚度较大,且通常需要一个校正棱镜来消除环境光从自由曲面棱镜的折射。 爱普生 BT 300、耐德佳 X2 等 AR 眼镜采用了此种结构。

光波导方案:光波导的基本原理是耦入区域的光学元件将微投影光机发出的光束耦入进波 导片并以全反射的方式传播,主要可分为几何光波导与衍射光波导两大类。相对于 Birdbath、自由曲面等光学方案,光波导可以实现更轻薄的体积、更高的透光率、更大的 Eye-box,并可通过纳米压印等微纳加工技术将 AR 眼镜的波导片做到类普通眼镜形态。

几何光波导:几何光波导是基于传统几何光学的原理进行设计和制造的光波导方案, 分为锯齿光波导和阵列光波导,其中最常见的是阵列光波导。几何光波导光线的入射 耦合是通过反射镜或折射棱镜(In-coupling prism)实现,而出射耦合则是通过部分 反射镜阵列(Partially reflective mirror)实现。 应用方面,由于几何光学的原理简单,几何光波导的设计思路相对明确、制备技术较 为成熟,同时结合扩瞳技术可以在保证图像质量同时获得较大的动眼眶范围。目前使 用该方案的 AR 眼镜有 Lumus 等。Lumus 是少数拥有超高亮度光波导的公司,其方 案可以在未使用遮光罩的情况下在户外显示 AR。对比相同视场角和眼动范围的衍射 光波导方案,采用阵列光波导的 Lumus Maximus 在效率、亮度和耗电量方面表现优 异。但几何光波导的全内反射角限制了结构的视场角,且多次反射容易产生杂光,使 得出射光线强度分布不均匀,图像质量下降。

制造方面,阵列光波导的加工流程主要是研磨、抛光、镀膜和胶合。首先通过切割玻 璃基材获得各种规格的波导小棱镜,然后对小棱镜进行粗磨、精磨与抛光,之后在小 棱镜上分别镀不同膜系的薄膜获得不同的反射/透射比,最后对小棱镜进行胶合将它 固定为表面光滑的波导片,并通过测角仪、干涉仪等仪器对波导片进行检测。阵列光 波导制造工艺复杂,很难满足理想条件,且产出率相对较低。

衍射光波导:衍射光波导的设计不依赖于几何光学,而是利用光的衍射效应,主要采 用光栅结构实现对光束的调制。根据光栅种类的不同,衍射光波导主要可分为表面浮 雕光栅波导与体全息光栅波导,其中表面浮雕光栅波导方案中通过使用亚波长尺度的 表面浮雕光栅(Surface Relief Grating,SRG)作为光波导中耦入、耦出和扩展区域 的光学元件,从而实现对光束的调制;而体全息光栅波导方案采用体全息光栅 (Vol⁃ume Holographic Grating,VHG)作为衍射光波导中的耦入耦出元件。

随着纳米压印等微纳加工技术的不断进步,衍射光波导有望在未来会成为主流的光波 导方案之一。衍射光波导体积小、灵活度高,具有较大发展潜力,目前谷歌、Intel、 苹果、索尼、三星等大厂在光学显示技术领域积极布局衍射光波导的技术方案。

表面浮雕光栅波导结构制备技术较为成熟,大视场、大眼动范围优势使其成为目前 AR 头戴式显示器的主流方案。制备方面,目前表面浮雕光栅波导的技术较为成熟, 批量生产表面浮雕光栅波导的常用方法为紫外线纳米压印光刻法,该工艺可分为纳米 压印工作模具制备阶段和批量生产两个阶段。应用方面,SRG 结构具有大视场和大 眼动范围的优势,目前市场中基于衍射光波导的 AR 近眼显示设备大多都采用了表面 浮雕光栅波导方案,如微软 HoloLens、Magic Leap One、DigiLens 等。SRG 目前 的主要问题有:(1)效率低;(2)色彩不均匀和彩虹效应;(3)波导板两侧均有图像 信息耦出;(4)纳米压印的良率问题。

受材料与工艺等因素的限制,体全息光波导在大规模量产等方面仍与表面浮雕光栅波 导有一定差距。体全息光波导相比于阵列波导结构采用几何光学元件来耦入和耦出光 线,可有效降低显示系统的厚度和重量,同时具有色彩均匀性好、易于实现单片彩色 波导的优势。但其采用全息干涉曝光的方法进行波导片的加工,目前尚无法进行大规 模的量产;同时,做大视场角需要叠加多层全息光栅、做彩色波导片需要高密度的曝 光材料,进一步增加了工艺难度。目前在做全息体光栅(VHG)波导方案的厂商较少, 包括 Digilens、Sony、Akonia 等。

我们认为,通过对以上方案进行对比,光波导方案在光学效果、外观形态和量产前景等方 面都具备良好的发展潜力,有望成为未来 AR 眼镜走向消费级的理想方案。

性能端:光波导方案体积较小,但目前也存在色彩不均匀等亟待解决的问题。棱镜方 案体积较大而视场角最小,仅有 15°左右,搭载此方案的 Google Glass 于 2015 年 停产;Birdbath、自由曲面方案成像质量虽好,但体积较大,且结构视场角越大、光 学镜片越厚则体积越大,限制了它们在 AR 头戴式显示器方面的应用;几何光波导中 的阵列波导结构具有轻薄、眼动范围大和色彩均匀的优势,设计方案成熟,但在杂散 光和人眼兼容性、各膜层反射率和透过率、镀膜工艺控制、整个眼动范围内亮度和色 彩的均匀性等方面存在挑战;表面浮雕光栅波导(SRG)方案体积较小,具有大视 场和大眼动范围的优势,但也存在效率低、色彩不均匀和彩虹效应、波导板两侧均有 图像信息耦出等问题;体全息光栅波导具有色彩均匀性好和易于实现单片彩色波导的 优势,但该方案视场角偏小,当前已经被设计并制造出的产品均不能兼具大视场角与 高图像质量,同时制造较为困难,限制了其进一步的应用。

制造端:表面浮雕光栅波导(SRG)已经形成完整产业链,体全息光波导工艺难度 较大。几何光波导中的阵列光波导采用研磨、抛光、镀膜和胶合的制造方法,产出率 相对较低,如何控制各个膜层的反射率和透过率与镀膜工艺是制造难点;衍射光波导 的体积小、灵活度高,具有较大发展潜力。随着纳米压印等微纳加工技术的不断进步, 衍射光波导在未来会成为主流的光波导方案之一。其中表面浮雕光栅波导(SRG) 采用的纳米压印具有一定的便利性,目前已经形成完整产业链,但还需进一步完善设 计方案和提升量产良率;体全息光栅波导采用全息干涉曝光的方法进行波导片的加工, 无法进行大规模的量产,同时做大视场角需要叠加多层全息光栅,且做彩色波导片需 要高密度的曝光材料,这进一步增加了工艺难度。

应用端:目前推出的 AR 眼镜中 Birdbath 与光波导方案成为主流。我们统计了 2022 与 2023 年上市的 57 款 AR 眼镜,其中采用光波导方案的产品 23 款,占比 40.35%; 采用 Birdbath 方案的眼镜共 18 款,占比 31.58%。在 2023 年 11 款采用光波导方案 的 AR 眼镜中,衍射光波导方案 8 款,几何光波导方案 3 款。

供应商方面,目前 AR 眼镜光学方案供应商包括歌尔股份、水晶光电、DigiLens 等。随 着光波导方案逐渐成为业务主流光学方案,中国企业从 2014 左右开始相继布局光波导技 术,逐步进入技术迭代、产品量产阶段,并尝试向 C 端消费者渗透,逐步缩小与国外厂商 的技术和产品差距。

2.1.2 微显示器:Micro-OLED当前主流,Micro-LED未来可期

AR 眼镜的主流显示技术可分为被动式微显示技术、主动式微显示技术及扫描显示技术。 被动式微显示技术以 RGB LED 或 RGB 激光作为光源,包括 LCD、LCoS 和 DLP 等。主 动式微显示技术包括 Micro OLED 和 Micro LED;扫描显示技术(Laser Beam Scanning, LBS)使用 RGB 激光作为光源,搭配 MEMS 进行扫描成像,但可能导致散斑现象。 LCoS:工艺成熟,但分辨率较低、响应时间长。硅基液晶(Liquid Crystal on Silicon, LCoS)是一种基于液晶光电效应和 CMOS 工艺的小尺寸矩阵液晶显示装置,是传统液晶 显示技术(Liquid Crystal Display,LCD)的一个新分支。LCoS 主要由硅基背板,框胶、 液晶及 ITO 玻璃所构成的液晶盒子组成,主要制备工艺包括硅基背板与 ITO 玻璃制备、 液晶填充等。借助成熟的半导体工艺和液晶产线,LCoS 制备工艺发展迅速,具有工艺成 熟、成本较低等特点。应用方面,应用 LCoS 的 AR 产品包括 Google Glass 1、Hololens 1、Magic leap 1 等。LCoS 的优点在与:1)发光亮度较高,目前商用 LCoS 已经可以达 到 6000nits;2)高像素密度(>4000 像素/英寸);3)技术发展较早,产业化较为成熟使 其具有低成本优势。但如更短的响应时间、更高的分辨率以及更小更轻便的体积等目标仍 是 LCoS 技术需要努力发展的方向。

DLP:效率与亮度较高,在AR眼镜领域无法兼顾高质量体验与低成本。数字光处理(DLP) 在原理上属于微机电系统(MEMS)技术,是基于数字微镜元件(DMD)实现可视数字信 息光学处理的过程。DLP 采用数字光开关来反射光线,具有较高的光效率和亮度,而且每 个微镜片的尺寸一般为 14μm×14μm,因而可被用于 AR 头戴式显示器中,目前已被Vuzix 和 DigiLens 等公司 AR 眼镜产品采用。缺陷方面,单片 DLP 由于色轮的使用可能 会引起彩虹效应,并使佩戴者产生眩晕头晕等症状;而 3DLP 技术虽然解决了彩虹效应, 但造价更加昂贵且体积重量都更大。因此 DLP 技术对于头戴式 AR 设备无法兼顾高质量 体验与低成本两方面,该技术更适合车载的 AR-HUD 显示。

Micro-OLED:成像质量优于 LCoS,亮度与寿命因素制约其在 AR 眼镜领域应用。 Micro-OLED 是一种自发光显示技术,目前适用于 AR 眼镜的 Micro-OLED 典型结构是在 白光 OLED 上排列彩色滤光片,彩色滤光片选择需要通过的波段光波并反射掉其他不需要 通过的波段,使人眼接收到饱和的颜色光线。Micro-OLED 相比 LCoS 具有更广的色域和 极佳的对比度,能实现自发光、低功耗,但 Micro-OLED 的主要缺点有:1)亮度较低, 目前全彩色 Micro-OLED 已可实现 3000~5000nits 的显示亮度,但这对于在室外使用几乎 是刚需的 AR 眼镜来说仍处于较低水平。2)寿命较短,Micro-OLED 容易随着工作时间变 长变色,且显示亮度与使用寿命呈反比。目前使用 Micro-OLED 的产品包括 INMO Air 2、 Rokid Max、XREAL Air 2 等。

Micro-OLED 已初步具备量产性。Micro-OLED 制备过程分为发光层蒸镀、密封处理、玻 璃盖板贴合、切割与封装等,制造成本较高但已初步具备量产性。供应商方面,目前全球 范围内 Micro-OLED 制造商包括美国的 eMagin、法国的 MicroOLED、日本的 SONY、中 国大陆的京东方和视涯等。

Micro-LED:光电特性独特,与 VR/AR 设备适配性较佳。Micro-LED 通过在 CMOS 驱动 芯片上集成微小尺寸的 LED 阵列,形成 Micro-LED 微显示器,每个 LED 像素点单独寻址 点亮形成图像,是高度集成的自发光器件。在 VR/AR 领域,Micro-LED 相比传统方案拥 有更好的显示特性,具体表现在:1)高刷新率:Micro-LED 属于自发光技术且由电流驱 动,响应时间可达到微秒甚至纳秒级别,实现 AR 设备超高的刷新率;2)高亮度:得益 于自发光能力与无机物的稳定性,Micro-LED 在亮度指标上性能明显高于 OLED 技术,同 亮度下功耗也明显低于背光式的 LCoS 和 DLP;3)体积小:Micro-LED 无需额外光源, 高 PPI 下相关驱动也较为简单;4)寿命长:Micro-LED 使用的无机物较为稳定,寿命可 达 100000h 以上;5)色彩高保真:Micro-LED 和 OLED 同属于自发光显示技术,具有实 现色彩高保真的能力。

目前 Micro-LED 技术成熟度有待提升,限制其大规模应用于 AR 产品的主要问题包括巨 量转移、全彩方案等。

巨量转移:由于在制备过程中难以将驱动电路直接制备在 Micro-LED 的衬底上,因 此需要将 Micro-LED 从其衬底上转移到 CMOS 驱动电路衬底上。然而转移的 Micro-LED 尺寸小、数量多,且需要精确对位和非常高的良率,因此巨量转移技术是 目前难以实现的一项关键性技术。

全彩方案:Micro-LED 主要采用三色 RGB 法与发光介质法两种方法来实现彩色显示。 其中三色 RGB 法需要将 3 种不同的 Micro-LED 转移到目标基板上,对巨量转移技术 要求很高,实现起来非常困难;发光介质法利用沉积在短波长 Micro-LED 上的发光 介质(如荧光粉或量子点)作为颜色转换层来实现全彩显示,但该方法需要将颜色转 换层放置在尺寸很小的像素上,荧光粉材料颗粒容易造成沉淀不均匀,量子点材料则 稳定性较差且寿命短。

全彩 Micro-LED AR 眼镜关键技术逐渐突破,大规模应用未来可期。由于 Micro-LED 全 彩化技术方案难题和红色晶片发光效率低等问题,过去使用 Micro-LED 的 AR 眼镜采用单 目单绿或双目单绿方案,例如 OPPO 翻译眼镜、小米 AR 眼镜探索版等均为单色 AR 眼镜, 无法提供全彩双目异显等功能。2023 年 10 月 13 日雷鸟 X2 正式发售,雷鸟 X2 可以看做 全球范围内第一款真正意义上实现了双目全彩 Micro-LED 的光波导眼镜,标志着 Micro-LED 大规模应用的关键技术逐渐成熟。根据 Trendforce 数据,预计 Micro-LED AR 智慧眼镜晶片产值将由 2023 年的 200 万美元增长至 2026 年的 3.83 亿美元。我们认为, Micro-LED在光学显示领域的综合性能优势明显,随着制造难点的逐渐突破与成本降低, 未来有望成为 AR 显示领域的主流方案。

当前上市的 AR 眼镜中 OLED 方案成为主流,全彩 Micro-LED 眼镜初露头角。我们统计 了 2022 与 2023 年上市的 57 款 AR 眼镜,其中搭载 OLED 方案(以 Micro-OLED 为主) 方案的 AR 眼镜一共 37 款,占比 64.91%;搭载 Micro-LED 方案的 AR 眼镜 11 款,占比 19.30%。2023 年的 6 款搭载 Micro-LED 方案的 AR 眼镜中,有 4 款为单绿方案 AR 眼镜; 2 款为全彩 AR 眼镜,分别为雷鸟 X2(售价 4999 元)、MYVU Discovery(售价 9999 元)。供应商方面,目前 AR 眼镜微显示器主要的供应商包括 Sony、Epson、Omnivision、 JBD 等。其中日本 Sony 和 Epson 在硅晶 OLED 领域布局较早;美国 Omnivision、TI 分 别在 LCoS 与 DLP 领域拥有明显竞争优势;以 BOE、JBD 为代表的中国企业正加速布局 Micro-LED 技术。

适配的光学和微显示屏方案结合可发挥 1+1>2 的效果,Micro-LED+光波导有望成为未来 AR 眼镜优解。目前 AR 眼镜的主流方案包括两种,其中硅基 OLED 与 Birdbath/自由曲面 搭配,该方案显示质量表现好但体积偏大;另一种方案是 LCoS/DLP 与光波导搭配,该方 案处于发展演进阶段,虽然显示质量还待优化,但透视性更好且能提供较大的眼动范围并 大幅减小体积。由于衍射光学与阵列光学都可以很好的与 Micro-LED 配合,在控制功耗、 增加续航的同时实现 AR 眼镜的高亮度显示,Micro-LED+光波导的光学显示系统有望成为 未来 AR 眼镜的理想解。

2.2 计算单元:高通主导XR SoC市场,分布式架构成为行业标杆

“算力、功耗、尺寸”是 AR 眼镜 SoC 的关键指标,协处理器方案有望成为 XR 行业共 识。AR 眼镜由于设计尺寸的原因无法容纳大容量电池,而用户有全天使用眼镜的需求, 对 AR 眼镜芯片的能效比提出了很高的要求。此外,AR 眼镜需要具备高性能拍摄、语音 识别、手部追踪、眼动追踪等功能,对 AR 眼镜的算力也提出了挑战。XR 协处理器是一 种专门针对 XR 设备进行优化和加速的芯片,它可以与通用芯片协同工作,分担部分或全 部的交互和显示任务。XR协处理器可以根据不同的XR 形式和应用场景进行定制化设计, 以满足不同的性能和体验需求。如苹果 Vision Pro 采用“M2+R1”的双芯片设计,图像 处理芯片提供对感官输入的实时处理,降低用户感知周围环境的延时,助力虚实无缝连接。 协处理器方案在未来有望成为 XR 行业谋求高质量交互与显示的共识。

生成式 AI 丰富了 XR 性能,对 XR 领域 SoC 提出了更高要求。生成式 AI 在 XR 头显中的 应用包括对话式 AI 与 AI 渲染等,其中 AI 渲染工具主要聚焦在 3D 内容创作和虚拟体验优 化,用户可以使用如文本、语音、图像或视频等各种类型的提示生成 3D 物体和场景,并 最终创造出完整的虚拟世界。硬件方面,生成式 AI 的普及对 AR 眼镜的端侧 AI 计算能力 提出了更高要求,也有望成为未来 SoC 性能提升的重点方向。以高通骁龙 XR2 为例,通 过搭载 Hexagon NPU,第二代骁龙 XR2 的每瓦功耗对应的端侧 AI 计算性能为第一代的 8 倍。

供应商方面,高通主导当前 XR SoC 市场,为主流 AR/VR 产品提供支持。高通在 AR 技 术早期就投入相关研究,最早的 AR 项目可以追溯到 2007 年,在 XR 领域专用计算平台 推出前就已经发布了多个有线/无线 AR 眼镜参考设计。目前高通已经推出骁龙 XR1、骁 龙 XR2、骁龙 XR2+等多款 XR 专用计算平台,骁龙 XR 和 AR 平台提供了完善的底层驱 动能力,包括 SLAM 定位追踪、本地锚点和持久性、手势追踪、眼球追踪以及注视点渲染、 空间映射和环境感知等,可为 AR/VR 提供丰富的交互体验。

骁龙 AR2 Gen1 采用多芯片分布式架构,有望为未来 AR 眼镜计算平台提供参考基准。 2022 年 11 月,高通在骁龙峰会上发布了骁龙 AR2 Gen 1,成为高通首个专为 AR 眼镜打 造的平台。骁龙 AR2 Gen1 平台将骁龙 XR1、骁龙 XR2 的单片 SoC 式方案改为多芯片分 布式方案,分为 AR 处理器、AR 协处理器和 Wi-Fi 连接三大模块。其中 AR 处理器将负责 图像/视频捕获、计算机视觉和显示驱动等典型的 GPU 类型功能;协处理器专注于提供 AI 加速以及传感器和相机数据聚合功能;连通性模块将负责分布式架构实现所需的高速、 低延迟通信。此外,骁龙 AR2 设备还可以和搭载骁龙平台的智能手机、PC 或其它计算模 块连接,意味着未来的 AR 眼镜将具备极强的互通能力,有望建立一个无线的、动态的分 布式处理环境。

AR1 Gen1 侧重拍摄与 AI 能力,标志着高通 AR 眼镜系列已逐渐形成独立产品线。2023 年 9 月高通推出 AR1 Gen 1 平台,标志着专为 AR 智能眼镜打造的计算平台已经逐渐与 VR/MR 产品分离并形成独立产品线。相比骁龙 AR2 Gen 1 更强调的分布式计算支持的沉 浸式体验,骁龙 AR1 Gen 1 则主打出色的拍摄与 AI 能力,更加契合以信息提示为主要目 标的轻薄 AR 智能眼镜。AI 方面,AR1 Gen 1 采用了第三代 Hexagon NPU,在眼镜侧支 持本地部署视觉搜索、定向音频采集、实时翻译等 AI 能力;同时还能帮助增强照片和视 频的拍摄质量、通过降噪实现更清晰的通话,并可以通过计算机视觉实现更清晰的视频拍 摄。

联发科:较早布局 AR/VR 领域,与 Meta 合作开启 AR 眼镜 SoC 新征程。联发科于 2016 年就加入了中国 VR 行业首个官方组织“中国虚拟现实产业联盟”,并于 2017 年在 MWC 上发布了 10 核的 Helio X30 芯片,成为了少数支持谷歌 DayDream VR 平台的智能手机 芯片之一,同时也可实现类似于谷歌 Tango AR 技术的应用场景。2023 年联发科芯片峰 会上,联发科正式宣布与 Meta 建立新的合作伙伴关系,双方将共同研发用于 AR 眼镜的 定制芯片;同时联发科推出括 M60 调制解调器 IP 和 T300 芯片系列的 5G RedCap 系列 解决方案,面向穿戴设备、轻量级 AR 设备、物联网模组以及边缘 AI 设备等。

恒玄科技:BES2700 已应用于智能眼镜项目,2800 新品量产打开成长空间。恒玄科技已 支持开发了四代音频眼镜产品,目前 BES2700 可穿戴芯片已经在一些智能眼镜项目上量 产,其中 BES2700BP 支持最高 640x480 的分辨率,可应用于轻型智能眼镜产品并增添 部分显示功能;BES2700iBP 搭载 192MHz 的 BECO Dual Core,可以提供 AI 加速运算 功能。2023 年公司推出的新一代产品 BES2800,集成多核 CPU/GPU、NPU、大容量存 储、低功耗 Wi-Fi 和双模蓝牙,相比 BES2700 CPU 算力提升 1 倍,NPU 算力提升至 4 倍,同时先进工艺可让芯片在相同尺寸上可集成更大内存,以支持更大模型的 AI 语音算 法和传感器检测算法,能够为可穿戴设备,特别是智能眼镜、智能手表、智能助听器等产 品提供强大的算力支持。

海思:发布 XR 芯片平台,专有架构 NPU 为 AI 时代提供算力支持。2020 年 5 月,上海 海思正式发布 XR 芯片平台,推出首款可支持 8K 解码能力,集成 GPU、NPU 的 XR 芯片, 首款基于该平台的 AR 眼镜为 Rokid Vision。目前海思在 XR 领域的核心技术包括:1)提 供从采编、传输、解码到显示的全链路 8K 端到端能力,助力 XR 实现从内容制作到用户 体验的真双目 8K;2)海思的新一代达芬奇 AI 引擎高效赋能 AR 场景的识别、VR 游戏智 能应用、画质提升等场景;3)海思提供从基带到射频一站式解决方案和高带宽、低时延 低功耗 WIFI6 解决方案,确保室内、室外不同场景下 XR 设备的高质量联接体验;4)依 托在智慧视觉领域的深厚技术积累,在新一代超高清 ISP、极低照度降噪、数字防抖等维 度进行全面升级,更适合 XR 场景需求。

瑞芯微:与诠视科技在 XR 领域战略合作,目前搭载 RK3588 系列的 AR 眼镜已量产。瑞 芯微在 2016 年推出的旗舰芯片 RK3399,下游 VR 设备客户包括嗨镜、Niribu 等国产厂 商;2021 年 12 月,瑞芯微新推出的旗舰芯片 RK3588 采用三星 8nm 工艺设计,搭载四 核 A76+四核 A55 的八核 CPU 和 Arm 高性能 GPU,内置 6 TOPS 算力的 NPU 并支持 AR/VR 应用。2022 年瑞芯微与诠视科技(Xvisio Technology)联合宣布达成战略合作, 共同打造基于瑞芯微 RK3588 平台的高性能 XR 平台解决方案。目前搭载 RK3588 系列的 AR 智能眼镜已发布,如 Xrany Space1 等。

2.3 其他组件:电池、传感器等是AR眼镜性能的重要保障

电池:需兼顾性能、重量与续航,锂电池为当前智能眼镜主流方案。AR 眼镜需要在环境 日光条件下清晰的显示图像,高亮度会增大光学显示系统功率与耗电量,如果电池容量过 小,AR 眼镜需要短时间内多次充电并产生续航焦虑。根据《Wearing Comfort and Perceived Heaviness of Smart Glasses》研究数据,智能眼镜的重量必须不超过 40 克才 能获得较高用户接受度,如果增大电池容量,就会增加 AR 眼镜整机重量,不利于用户的 综合佩戴体验。根据 Activelook 数据,如果 AR 眼镜综合功耗在 300mW,达到单次使用 18h 所需的整机质量在 75g 左右,远高于功耗 20mw 对应的 39g。因此 AR 眼镜的电池需 要兼顾性能、重量、续航等因素,对所用电池的综合性能提出了更高要求。应用方面,锂 电池以其高能量密度、长循环寿命等优点,成为了智能眼镜首选的电源解决方案。目前国 内供应商包括紫建电子、亿纬锂能等。

微型扬声器:定向扬声将是未来消费级 AR 眼镜的核心能力之一,兼顾隐私保护与高音质 是关键。AR 眼镜作为近耳声学设备,声音是感知和体验中重要一环,安装在眼镜腿部的 微型扬声器作为 AR 眼镜的重要器件之一,其体积与尺寸设计会影响整机的重量和薄厚程 度,进而影响佩戴舒适度。同时,AR 眼镜作为非入耳式佩戴的设备,如何减少声音外泄、 提升聆听私密性也是用户关注的痛点。AR 眼镜定向扬声技术需要通过高精密扬声器声学 器件与空间声学等算法实现,以瑞声科技为例,公司推出的搭载于 Rokid Max 的 AR 专用 超线性扬声器,采用 8x20x3mm 的超微型设计将重量控制在 1.45g,通过泄声孔和主发声 孔的设计有效抑制声音外溢,提升了聆听私密性。

传感器:AR 眼镜传感器包括摄像头、CIS、IMU 等,实现 SLAM 空间定位与感知交互等 功能。XR 终端配备了摄像头、IMU 传感器、深度传感器、光传感器等多个传感器,可以 配合 SLAM 算法进行实时的空间定位计算,同时捕捉用户头部、手部和身体动作以及语音 和视线等输入信号,并将其转化为虚拟环境中的交互动作,实现用户与虚拟环境的自然、 直观、沉浸的交互。根据艾瑞咨询数据,感知单元占 AR 设备 BOM 价值量的 9%。

SLAM 功能:AR 眼镜的基础能力,6DoF 是 SLAM 技术前端的里程碑。即时定位与 地图绘制(SLAM)是几乎所有 AR 系统的基础能力,主要由传感器数据、前端视觉 里程计、后端非线性优化、建图以及回环检测 5 个模块组成。SLAM 系统通过 IMU、 摄像头等传感器获取数据,经过计算实时跟踪 AR 设备在空间中的 6DoF 位姿并绘制 地图,增强视觉效果。DoF 即自由度,6DoF 是指 AR 眼镜可以在 6 个自由度上定位 使用者的位置和姿态,6DoF 定位的实现是 SLAM技术前端视觉里程计模块的里程碑。 传统 3DoF 技术仅能跟踪 AR/VR 设备的旋转,无法捕捉用户在空间中的移动,因此 用户体验受限于固定的视角和位置,适用于较为简单和静态的应用场镜;相比之下, 6DoF 通过精确跟踪用户的位置和方向变化,使用户能够在虚拟空间中进行自由的移 动、操作和互动,从而实现更加沉浸和真实的体验。目前 VR 行业已基本处于 6DoF 水平,AR 行业考虑使用场景及佩戴舒适性,3DoF 的应用更加普及。硬件方面,SLAM 主要依靠 IMU 传感器、摄像头与 CIS 传感器等实现。

智能交互功能:AR 眼镜智能交互功能主要包括 1)语音交互:接收用户发布语音指 令后实现交互,所需传感器为麦克风;2)手势追踪:基于计算机视觉和人工智能算 法,对摄像头采集到的图像中用户手部区域进行检测和对其姿态进行估计,从而得到 全自由度自然手势跟踪的技术。3)眼动追踪:通过图像捕捉或扫描提取眼部特征, 从而实时追踪眼睛的变化,预测用户的状态和需求,达到用眼睛控制设备的目的。目 前主流的眼动追踪设备采用的红外灯+1~2 枚红外相机组成的红外相机阵列,VR/AR 领域则可以选择眼动仪;4)智能终端交互:通过能与 AR 眼镜互联的其他终端如智 能手机、神经接口手环等实现交互。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

外部推荐