移动智能终端的下一站 真的架在鼻梁上吗?

发布时间:2026-04-09 16:25  浏览量:2

到了2049年,大多数智能手机将被智能眼镜取代。当数十亿生活在城市地区的人戴上这些智能眼镜时,他们看到的是现实世界与虚拟世界的叠加。对于这个虚拟世界,我称之为"镜像世界",因为你所看到的既是现实世界,也叠加着一个现实世界的数字孪生。

——凯文·凯利

【CNMO科技】回溯人类现代科技史,个人设备的演进始终遵循着一个清晰的方向:不断变小、日益便携。无论是现实的技术发展路线,还是科幻作品中的未来构想,都与之呼应。

在凯文·凯利所著的《2049:未来10000天的可能》这本书中,他以2049年为时间节点,从各个方面预想了未来社会图景,尤其该书开篇所提出的“镜像世界”,正式提出了智能眼镜将取代手机成为人机交互核心界面的设想。

凯文·凯利

巧合的是,这未来10000天的起始锚点,正好是刚刚过去的2025。并且诸如理想、夸克这类与智能眼镜相关性不大的品牌,都在2025行将结束之际一头扎进了这条赛道,这样的市场选择,似乎更加印证了“镜像世界”这一概念的可行性。但事实真的如此吗?

夸克AI眼镜S1

回顾近十年“尖端科技”的发展,VR与元宇宙都曾站在聚光灯下,在2016年与2021年被冠以元年之称,如今虽未消失,却已退居产业一隅。这让我们不禁审视如今的最新焦点——AI智能眼镜,它正站在同样的十字路口:是成为小众极客的玩具,还是演化为人人标配的下一代终端?想要解开道悬而未决的谜题,我们不妨先翻开它的“黑历史”看看——这条架在鼻梁上的智能之路,到底已经走了多远。

智能眼镜的漫长进化

在上世纪80年代,被誉为“可穿戴计算之父”的史蒂夫·曼恩教授,开始尝试制作可以架在自己的鼻梁上,能够以第一人称的角度来记录周遭事物的眼镜。直到1999年,他研发出了一款名为“EyeTab”的设备,但遗憾的是,由于时代背景下的技术限制等原因,EyeTab距离商用阶段还相差甚远。

史蒂夫·曼恩

事实上,史蒂夫·曼恩不仅是多伦多大学的一位教授,更是公认的第一位“赛博格”,一位电子狂人。他曾将自己设计的智能眼镜永久固定在头骨上,为此常年随身携带医生开具的身份证明。然而这份证明并未给他带来便利:一次在机场,他虽出示所有文件,仍被强制搜身,最终设备遭损毁;另一次在麦当劳,他更遭遇三人袭击,眼镜被毁,连证明文件也被当场撕碎。

当然,极客自己搞实验是一回事。真正让智能眼镜走进公众视野的,还得是科技巨头的亲身入局。

在距离EyeTab问世的13年后,谷歌在2012年4月5日正式发布了划时代的Google Glass,首次将摄像头、麦克风、骨传导耳机集成到眼镜形态中,奠定了今天智能眼镜的基本雏形。遗憾的是,由于实际体验、隐私安全等一系列的问题,Google Glass无疾而终。

Google Glass

从外观上来看,Google Glass的造型与EyeTab十分类似,因此许多人都称EyeTab为当代“智能眼镜”的原型机。此外,从2013到2018年,索尼、微软等大厂虽然纷纷尝试,结果却大多不尽如人意。

直到2023年9月,Meta与雷朋(Ray-Ban)联合出品的智能眼镜 Ray-Ban Meta,用一种极其粗暴却行之有效的方式给出了当前版本下的最优解——它彻底放弃了复杂的光学显示模组,将设备简化为一个带有高像素摄像头、麦克风和骨传导扬声器的“智能蓝牙耳机”,同时通过一枚闪烁的拍摄指示灯化解了Google Glass曾面临的隐私伦理危机,而这个方案也被各大厂商沿用至今。

正是这条充满妥协意味的“减法路线”,真正引爆了市场,造就了奇迹。

Ray-Ban Meta

根据Wellsenn XR的报告显示,2024年全球AI智能眼镜销量为234万台,而这其中的225万台都来自于Ray-Ban Meta智能眼镜,可以说Meta凭借一己之力直接拉动了全球智能眼镜出货量的激增。

Ray-Ban Meta智能眼镜如此成功的市场表现,彻底撕裂了行业的共识,同时这样的产品取向也为当下的“百镜大战”定下了基调——先用最低的佩戴门槛把设备架到用户的鼻梁上,再用云端强大的AI大模型去填补硬件端侧的苍白。这虽然是一种无奈的妥协,但确实是能够撬动消费市场的最优解。

阵营的割据与分歧

随着旧共识的瓦解,各路玩家开始在新的坐标系中重新校准自己的位置。

撇开营销层面的包装,在回归产品的本原后,我们会发现,这场“百镜大战”的参与者们正依据各自的基因划分为四大阵营。在两条截然不同的技术路线上,正在交付属于自己的标准答案。

首先是四大阵营,分别由手机厂商,互联网大厂、专业XR厂商以及跨界新锐品牌所构成。其中手机厂商将眼镜作为生态延伸,追求与手机、智能汽车与智能家居等全场景设备的无缝互联。

互联网巨头更是凭借自身在AI大模型上和内容生态上的优势,意在推动眼镜在AI服务上的深度整合,比如信息查询、扫码支付、电商比价等;至于专业的XR厂商,则是依靠在光学领域的技术积累,牢牢把持着最为接近未来的产品形态。

理想AI智能眼镜 Livis

还有一股不容忽视的力量是新锐跨界品牌,他们通过聚焦垂直场景实现创新突破。在最近的跨界选手里,理想是个“出乎意料”的存在。但实际上,李想早在前年年底的“2024 理想 AI Talk”上就明确表示,理想的愿景已升级为聚焦人工智能领域。这意味着“理想汽车”这一名称已难以涵盖其未来的发展方向。因此,虽然AI眼镜的亮相出乎许多人预料,但结合企业一贯的战略规划,这一步实则在意料之中。

接着再看两条路线。如果将以上的品牌属性都打乱,单从产品的形态、功能上来划分,第一条路线就是AI+拍摄眼镜的轻量级路线。这类产品的成功秘诀在于做减法——舍弃复杂的光学模组,在外观上接近普通眼镜的同时,功能上则依靠语音助手和镜腿按键实现摄像、音频和AI交互。凭一己之力拉动智能眼镜市场的Ray-Ban Meta,很大程度上就是得益于这种设计的成功。

另一条是AI+AR眼镜的显示增强路线,通过微显示和光波导两种技术的组合搭配,在用户眼前呈现虚拟屏幕。雷鸟、Rokid以及XREAL这些品牌都是此类产品的佼佼者。从功能点上来看,这条路线可以说是最为接近”镜像世界”的终端产品,但目前不够轻便的外观、对外接设备的依赖以及居高不下的成本与售价,仍是目前亟待突破的核心瓶颈。

因此,AI+拍摄眼镜的轻量级路线可以说是目前基于市场需求以及技术瓶颈所形成的妥协产物,只有当第二条路线的产品形态能够做成与第一条线路一样的存在,才会迎来技术成熟度曲线最后一步——实质生产的高峰期。

“不可能”的物理三角

美好的未来固然值得畅想,但我们更需要看清当下的路。智能眼镜之所以被称为移动终端领域最难啃的骨头,是因为它被死死锁在了一个由“性能、功耗、舒适性”构成的物理学“不可能三角”之中。

人类对于头部穿戴设备的重量极其敏感。一副适合全天候日常佩戴的眼镜,其重量的生死线在40克左右,这是毋庸置疑的行业共识。因此在这个极其逼仄、甚至按毫米计算的镜腿空间内,需要塞入SoC芯片、麦克风阵列、微型扬声器、摄像头传感器,最后留给电池的重量和体积几乎所剩无几。

这就引出了当前行业最致命的深层矛盾——AI大模型的高并发算力需求,与极度贫瘠的端侧能源供给之间的不可调和。

不久前,我们集齐了市面上近十款主流的AI智能眼镜。在深度体验一段时间后,一个鲜明的感受是——2025年确实配得上“AI智能眼镜元年”的称号,其中一些产品的实际表现确实让人眼前一亮,基本符合我们对第一代AI穿戴产品的短期期待。以发布仅数月的夸克S1为例,我们一致认为这款眼镜在综合体验上最为出色。尤其是在物体识别方面,得益于其强大的数据库和AI模型,即便是面对造型高度相似的小米13 Ultra和小米14 Ultra,它也能迅速且准确地区分,展现出难得的多模态落地能力。

当然,有亮眼者,就必然有掉队者。不同产品之间的体验落差之大,有时令人咋舌,部分产品甚至难逃“工业垃圾”的粗暴定论。比如这款INMO GO 3,就成了我们整个体验过程中被吐槽最多的一款产品。

首先是基础体验上的割裂感:眼镜摘下后不能自动断连,需手动断开;而当你想再次启用时,又必须手动重连。这种繁琐的操作逻辑,在强调“无感交互”的AI穿戴设备上显得尤为鸡肋。其次,漏音问题较为严重,在办公室等安静环境下使用,私密性几乎无从谈起。

而在核心的识物能力上,INMO GO 3的表现同样令人失望——它只能对画面进行泛泛的描述,却无法给出明确的结论。至于人物识别功能,则需要提前录入信息才能触发,极大限制了使用的即时性与随机性。拍摄体验上,由于缺乏实体拍照按键,操作存在明显延迟,严重影响了抓拍的成功率。此外,续航能力也明显不足,难以满足连续使用的需求。唯一值得一提的亮点,或许只有支持更换电池这一项,但巧合的是,夸克S1同样采用了换电设计,这让它最后的一丝独特性也变得黯淡。

当然,本文并非AI智能眼镜的横向评测报告,以上只是选取了两款在体验上形成鲜明对比的产品,借以窥见行业当下的真实生态——在“不可能”三角的禁锢下,有人正拼命拓宽技术的边界,也有人仍在为最基础的产品定义而挣扎。

AI智能眼镜在未来,真的是最优解吗?

凯文·凯利在《2049:未来10000天的可能》这本书中,除了将85条未来预言聚焦于智能眼镜这一核心载体,从而构建出现实世界数字孪生的镜像世界之外,他同时也提出了这其中最大的挑战是如何做出既透明通透又可以展示图像的智能眼镜镜片。

他在书中以触摸屏的发明和广泛使用真正推动了智能手机的普及为例,表示它既可以显示影像,又能够感知到我们的点击和滑动。从而推导出当一种能够集AR和VR于一身的镜片诞生之后,才会推动智能眼镜成为真正的“Next Big Thing”。

在笔者看来,凯文·凯利这样的推断不自觉地窄化了可能性,如果镜像世界的核心是AI对现实的实时理解与交互,

那我们为什么非要把它框在一副眼镜里?

凯文·凯利将智能眼镜视为“镜像世界”的必然入口,这实则是把手段当成了目的。镜像世界的本质是AI驱动、无感融入现实的智能交互,其载体并不一定要固定。无论是“颇受争议”的豆包手机、Mac上大火的Clawdbot,还是游戏《原神》中须弥地区人手一个的“虚空终端”,都或多或少证明了,未来的智能移动终端,必定不必依赖某一固定形态。

凯文·凯利对眼镜载体的坚持,更像是对现在智能手机在交互逻辑的延伸,而未来应该属于那些更轻、更隐形、甚至形态尚未被定义的AI智能终端。

那么,AI智能眼镜究竟是不是真正的“Next Big Thing”?

我回答是Yes,AI智能眼镜可以是“Next Big Thing”,但“Next Big Thing”,并不一定要定格在那副架在你鼻梁上的眼镜本身。

这就像汽车产业的核心竞争力正在从传统的底盘“马力”向中控“算力”发生的根本性转移。定义下一个时代的真正内核,并非“眼镜”这一特定形态,而是它背后是基于AI大模型的、对环境与语境深度理解的无感智能。眼镜,只是当前技术条件下,尝试实现这一愿景的、最具象且最为广泛的方案之一。它可能是阶段性答案,却未必是终极形态。真正的“Next Big Thing”,是那个无论通过眼镜、胸针,甚至是别针这样能够随时随地、自然地融入我们生活的AI智能载体。

因此,AI智能眼镜的竞赛,实质上是关于“谁能为这个未来的智能层,构建出最不可或缺的入口与界面”。它的成败,将不取决于硬件供应链端的镜片这类载体,而取决于它背后的AI,能否真正理解我们,并以我们感知不到的方式,让世界变得更易用、更高效、更生动。

而当下AI智能眼镜的火热,是因为它正处在一个关键的历史交汇点上——它既是AI从虚拟界面走向物理世界的具身载体,又是人类从“低头”转向“抬头”的交互门户。当强大的AI引擎与沉浸式的视觉界面结合,它确实可能催生出全新的交互模式、内容形态与服务平台,从而在消费电子领域掀起一轮新的浪潮。

从这个角度看,它完全可能成为继智能手机之后,又一个定义时代的“现象级产品”,并且最终的赢家,一定是在AI上有着深厚储备实力的选手。当然,这需要时间。AI眼镜作为一个新兴品类,其自身仍面临一些共性的技术瓶颈与体验桎梏。这也引出一个根本性问题:

手机为何难以被替代?

这个问题的核心在于,AI眼镜目前所提供的信息提示、简单交互、第一视角拍照这类核心功能,尚未构成用户的“高频刚需”。而手机作为当下功能集成与生态完善极高的超级终端,在屏幕交互、应用生态、续航和隐私控制上依然拥有压倒性优势。眼镜则更多是作为一种“辅助屏”或“交互新界面”而存在,而非取代。

此外,从用户角度出发,他们并不需要把所有算力都“戴在头上”,体验对的关键是“服务”是否及时、准确、流畅。因此将复杂的模型运算交给云端或电脑这类算力更强的协同设备,眼镜本身作为轻量化的输入/输出终端,只需处理最必要的实时传感与显示,这或许才是解决续航与发热矛盾、并提升AI能力上限的一条最优解。

总而言之

,除了供应链层面的硬件供给,AI智能眼镜的竞争,本质上是AI硬实力的全面竞争。无论产品如何定位,最终的用户体验都取决于其AI能力的强弱。可以说,这场竞争的核心就是AI能力的比拼,这将决定谁能够真正定义这个赛道。

纵观整个行业,真正具备强大自研AI模型能力的公司屈指可数,只有将AI与硬件深度整合,才能够打造出颠覆性的体验。反之,如果缺乏自研大模型作为技术护城河,产品就极易被模仿,这样的入局无异于“凑热闹、当炮灰”。

因此消费者在选择时,一个关键的评判标准在于:产品背后是否拥有自研且持续迭代的AI大模型。即便不是最新版本,一个优秀的大模型在与恰当硬件结合后,依然能释放出巨大潜力。

当终端形态加速分化,真正的护城河不是押注某一个硬件,而是拥有能随时“附身”任何设备的AI能力。没有大模型能力支撑的企业,每一次载体更迭都是一次生死考验,每一次换赛道都像是被迫重开一局;而对于那些手握AI“灵魂”的玩家,换壳只是换套衣服,这或许就是AI时代最本质的分野。