智能眼镜，引爆MEMS音频市场

发布时间：2026-02-28 17:59 浏览量：139

智能眼镜有潜力引发MEMS麦克风普及率的又一次大幅提升。

在过去的二十年里，MEMS麦克风行业经历了变革性的增长，成为现代音频技术的关键赋能者。2007年苹果iPhone的发布和2019年AirPods Pro（带有主动降噪功能的真无线立体声耳机）的推出，是MEMS麦克风在其中发挥关键应用赋能作用的重大转折点。这些技术创新不仅凸显了MEMS麦克风的能力，还将该行业推向了令人难以置信的新机遇。

快进到2025年，根据ABI Research的数据，仅智能手机中MEMS麦克风的全球总潜在市场(TAM)就达到了惊人的每年30亿颗。紧随其后的是TWS（真无线立体声）设备中MEMS麦克风的TAM，达到每年17亿颗。值得注意的是，TWS市场仅用了五年时间就发展成为一个目前规模超过智能手机MEMS麦克风市场50%的类别。这种快速增长突显了MEMS麦克风技术的绝对适应性和可扩展性，使其处于创新消费电子产品的核心地位。

那么，该行业将何去何从？人们对“下一个大事件”的不懈探索始终在进行，许多人押注下一波MEMS麦克风的需求可能来自一个准备重塑科技格局的产品类别：智能眼镜。

智能眼镜有潜力引发MEMS麦克风普及率的又一次大幅提升。虽然仍是一个新兴市场，但智能眼镜和增强现实(AR)眼镜正在迅速获得吸引力，Meta和小米等公司正引领潮流。包括微软、谷歌和Meta的技术领导者在内的硅谷远见者认为，语音交互将从根本上改变我们参与AI技术的方式。这种用户交互的转变与智能眼镜作为AI驱动体验自然接口的崛起完美契合。

但是，为什么MEMS麦克风在智能眼镜成为我们未来的日常个人AI助手方面发挥着如此关键的作用呢？语音是智能眼镜和其他可穿戴设备自然的“人机接口”，因为它在没有屏幕或屏幕极小，且触摸既不方便也不安全的设备中，实现了免提、抬头的控制。说话比点击菜单更快，还能让你保持对周围世界的注意力——非常适合散步、工作或学习。它也更具包容性和卫生性，即使戴着手套、手湿或灵活性有限也能操作。与触摸相比，语音简直是为这些设备量身定制的：即时、自然且更安全，不会转移你的视线、双手或注意力。

在这个等式中，MEMS麦克风代表了用户与智能眼镜中个人AI助手之间的关键接口，其位置尽可能靠近用户的嘴巴和耳朵。在当今的产品中已经可以观察到一个清晰的例子：例如，Meta的最新型号每台设备配备了令人印象深刻的五个MEMS麦克风阵列。

这项技术进步改善了用于视频录制的360°声音捕捉，实现了即时翻译，增强了噪音抑制能力，并提升了复杂声学条件下的用户体验。除了便利性之外，“对话聚焦”等新功能还能为轻度听力损失患者提供宝贵的支持——或者只是在嘈杂的环境中提供便利的放大效果。

随着此类眼镜等创新的普及，它们已经转化为可衡量的市场需求。即使在2025年，智能眼镜和AR眼镜中包含的MEMS麦克风也已创造了每年超过6000万颗的TAM。但这仅仅是个开始。如果这些眼镜发展成为真正的主流产品类别（正如许多人今天已经预见的那样），TAM预测表明，五年内，智能眼镜中MEMS麦克风的市场可能每年超过10亿颗。

眼镜不仅有潜力充当个人AI助手的“眼睛和耳朵”，还能服务于无数令人兴奋的用例，从沉浸式AR体验到更高级别的音频捕捉。

随着新进入者使智能眼镜市场变得日益拥挤，差异化将成为制造商面临的重大挑战。毫无疑问，视觉叠加和数据显示功能将成为许多公司的关键差异化因素，使用户能够以独特和沉浸式的方式访问信息和交互式内容。然而，考虑到视觉叠加所带来的额外尺寸和电池寿命限制，它是否会成为决定商业成功的关键因素还有待观察。尽管存在这种不确定性，但有一点是清楚的：音频将作为智能眼镜中AI交互的主要接口发挥至关重要的作用。随着语音命令和音频反馈变得越来越重要，音频质量将成为顶级品牌与其他品牌之间的主要差异化因素。为了在拥挤的市场中脱颖而出，智能眼镜制造商将需要提供卓越的音频性能，利用MEMS麦克风等先进技术提供清晰、可靠和高质量的声音。通过优先考虑音频质量，公司可以创造无缝直观的用户体验，使其产品在竞争中脱颖而出。

几个关键因素将在决定智能眼镜音频设计的成功方面发挥至关重要的作用，包括：

微型化

：风格决定尺寸。与智能手机或TWS耳机不同，智能眼镜必须保持轻便和时尚，通常与传统眼镜难以区分。实现这一目标意味着在不影响性能的情况下，减小包括MEMS麦克风在内的每个组件的宽度、高度和整体占地面积。

高能效

：由于电池空间有限，能源效率变得至关重要。MEMS麦克风需要提供卓越的性能，同时消耗尽可能少的能量，让每一毫瓦都发挥作用。

定向音频捕捉

：确保在不同环境下的准确音频捕捉至关重要，特别是对于免提通信或AI助手等应用。MEMS麦克风必须与先进的波束成形和降噪算法无缝集成，以实现智能、聚焦的音频处理。

耐用性

：与智能手机非常相似，眼镜面临着因暴露于自然环境而产生的磨损。需要坚固的MEMS麦克风设计：防水、防尘和防震，确保长效性能。

先进的音频捕捉和处理

：智能眼镜在恶劣条件下的户外佩戴，例如在嘈杂的环境中或在刮风条件下的运动中。眼镜需要能够捕捉用户的输入，同时阻挡来自环境的有害音频信号。

这些苛刻的要求揭示了当前音频解决方案中的一个关键差距。市场上现有的传感器可能满足上述部分严格要求，但无法同时满足所有要求。这正是英飞凌的微型高性能MEMS麦克风系统产品、英飞凌振动传感器(IVS)以及如Alango Technologies等英飞凌合作伙伴提供的先进信号处理技术成为整个智能眼镜市场游戏规则改变者的地方。

2026年第三季度，英飞凌将推出XENSIV IM65D130M，这是世界上最小的数字麦克风之一，具有标准性能和创纪录的极低功耗。其紧凑的2.75×1.85×0.8 mm³外形尺寸使其成为智能眼镜和AI驱动配件的理想选择。

XENSIV IM65D130M提供65 dB(A)的信噪比(SNR)——可与领先的移动电话相媲美——并且在始终开启的低功耗模式下仅消耗250µW，有助于延长电池寿命。它具有130 dB SPL的声学过载点(AOP)，能够在嘈杂的环境中处理声音而不会失真，使其适用于音乐会录音等应用。

凭借其小巧的尺寸、高性能、低功耗以及高达IP57防护等级的高稳健性，XENSIV IM65D130M成为满足智能眼镜苛刻要求的完美麦克风。目前已可通过英飞凌支持渠道获取样品。

虽然MEMS麦克风多年来一直为语音技术提供动力，但下一次飞跃已经到来：英飞凌的XENSIV振动传感器(IVS)。与通过空气捕捉声波的传统麦克风不同，IVS直接从声带检测振动，即使在最嘈杂的环境中也能实现清晰的通信。然而，这个概念并不新鲜。

骨传导麦克风早在阿波罗任务中就被使用过，但早期的设计存在音质差的问题，声音通常发闷且缺乏高频。

英飞凌利用新型XENSIV振动传感器IVS解决这些缺点。凭借小巧的外形尺寸和前所未有的高信噪比水平，IVS将实现通过骨传导进行高质量音频拾取。即使在高性能模式下，IVS的功耗也不会超过250µW，这意味着眼镜不仅智能，而且两次充电之间的使用时间更长。由于IVS不需要外部声音端口，它允许智能眼镜制造商设计防尘防水的音频拾取解决方案。

微控制器将来自IVS的振动数据转换为听起来自然的音频，可与传统麦克风相媲美，同时保留了骨传导的关键优势：在具有挑战性的声学条件下进行不失真的对话。

与XENSIV IM65D130M一样，新型XENSIV振动传感器IVS的样品也可应要求提供。

将XENSIV IM65D130M和XENSIV振动传感器IVS与基于AI的信号处理相结合，是克服音频捕捉的所有挑战，并使语音和音频成为用户与其日常AI助手之间主要接口的关键步骤。

智能眼镜中的音频处理需要硬件支持信号捕捉和计算。英飞凌的MEMS麦克风和振动传感器在严格的尺寸和功率限制内提供纯净的输入，而PSOC Edge微控制器提供实时工作负载所需的端侧处理能力。区别体验的是塑造最终输出的算法层。

英飞凌的合作伙伴，如Alango Technologies，正处于这项创新的前沿，提供先进算法以实现卓越的音频体验。

Alango Technologies为智能眼镜带来先进的信号处理，提供听力增强、清晰的用户语音拾取和远场语音捕捉。听力增强使用声学波束成形来放大用户面前人员的语音，同时利用Alango专有的零延迟、基于神经网络的降噪技术抑制环境噪音，从而改善在嘈杂环境中的面对面交流。通过使用来自骨传导传感器的信号，可减少对用户自身语音的放大。清晰的用户语音拾取可确保高质量的电话呼叫、可靠的语音控制以及与AI助手的有效沟通。输出信号动态结合了向下声学波束成形和经AI降噪增强的骨传导语音。远场语音捕捉支持实时翻译和转录等应用，其中骨传导传感器区分远场语音和用户语音。为最终用户带来的结果是增强的情境感知、改善的沟通以及更自然的对话体验。

此外，英飞凌的合作伙伴利用基于AI的语音重现和重建推进了音频信号增强。集成英飞凌XENSIV振动传感器(IVS)后，它将语音捕捉为骨传导振动而不是空气传播的声音，因此风等周围的噪音不会被记录，也就不需要消除。然后，较低保真度的原始振动信号通过重建算法得到显著增强，以产生清晰、自然的音频。对于智能眼镜来说，这实现了更准确的语音命令、在嘈杂环境中更清晰的语音通话以及实时音频翻译。在技术上，在海量音频数据集上训练的机器学习模型学习高质量语音的模式和特征，并重建缺失或失真的组件以提供更易于理解的输出。

英飞凌硬件与来自Alango Technologies和其他合作伙伴的高级算法之间的强大协同作用，源于他们算法充分利用英飞凌产品的能力。

提高的语音识别率：纯净、高信噪比的输入即使在嘈杂的条件下也能准确检测单词和短语增强的音频质量：联合解决方案可产生自然、细节丰富的音频，且伪影极少

所有这些成就的取得都利用了英飞凌的低功耗优势，从而延长了可穿戴设备的电池寿命。硬件最大限度地减少了能源消耗，使算法能够运行更长时间而不会迅速耗尽电池。

随着智能眼镜音频与机器学习、AR和AI集成以及MEMS麦克风进步的共同发展，一个真理清晰无误：耳听为实，谁能把音频做好，谁就能赢得客户。

英飞凌的硬件产品以及它与Alango Technologies等公司的合作伙伴关系，为“把音频做好”的真正含义设定了新基准。

在这个生态系统中，高精度MEMS麦克风、振动传感器和高性能MCU与高级算法相结合，将原始声学输入转化为自然的语音交互、水晶般清晰的通信以及无缝的AI辅助功能。

简而言之，智能眼镜的未来将由一流的硬件、先进的算法和强大的生态系统合作伙伴关系来定义。

*声明：本文系原作者创作。文章内容系其个人观点，我方转载仅为分享与讨论，不代表我方赞成或认同，如有异议，请联系后台。

想要获取半导体产业的前沿洞见、技术速递、趋势解析，关注我们！

标签：眼镜音频智能眼镜 mems mems音频

智能眼镜，引爆MEMS音频市场

相似文章

资讯分类

热门资讯

热门标签

热门产品