首发 | 对话理想穿戴机器人:一家「汽车公司」为什么要造AI眼镜

发布时间:2025-12-04 09:15  浏览量:6

2025年1月,理想汽车内部正式成立了穿戴机器人部门,理想AI眼镜Livis是这个部门量产的第一代产品。

在理想的产品版图中,AI终端被清晰地划分为四大形态:跑在路上的汽车机器人、会思考的空间智能体、自动服务的充电机器人,以及戴在头上的穿戴机器人。

理想汽车基座模型负责人陈伟解释了他们对AI终端的理解——“我们对本体的设计,不管是面向眼镜,还是面向未来的车内产品,我们需要考虑的一个问题是这个机器人现在有大脑、心脏、神经系统,以及本体,组合成了一个机器人。”

12月3日,理想AI眼镜Livis正式发布——这款重量仅36克、续航达18.8小时的AI眼镜,就是被理想团队称为本体的产品之一。

将最常用的工具赋予“眼睛”、“大脑”和“心脏”,在原有产品形态上进一步智能化,最终演化为一个机器人。理想AI眼镜Livis,作为穿戴机器人的第一个落地产品,承载的似乎是这种从消费电子到AI终端的转变。

在特斯拉推出擎天柱,小鹏推出人形机器人IRON后,理想对“具身智能”进行了新一轮的概念阐述。

实际上,我过去已经尝试过很多智能AI眼镜了,它们中的大部分都已经落灰了。

究其原因:体验还是其次,主要是不够好戴。

智能AI眼镜这个产品没那么复杂。尤其是这种和舒适度强相关的,做好佩戴,就成功了一大半。理想这次确实从“做好戴的AI眼镜”开始展开。理想AI眼镜Livis要做的是:好的开车墨镜、好相机、好耳机、好眼镜、长续航、好助手、好系统、好镜片。

考虑到理想过去的产品设计确实有一套,所以我算是比较期待这个产品。

在理想AI眼镜Livis上市之前,理想穿戴机器人业务相关的两位高管(理想汽车高级副总裁范皓宇和理想汽车基座模型负责人陈伟)和少数媒体做了一些沟通。他们谈到了理想AI眼镜Livis的产品定义理念,理想对于AI终端的看法,以及未来如何转型成为一家AI公司。

首先,为什么第一个穿戴机器人选择了AI眼镜?

范皓宇强调,这绝对不是理想的第一个AI终端开山之作。智能眼镜,作为一个终端产品,只是了理想在AI终端上的自然延伸。“我们目前做的车本身就是面向人工智能最重要的产品。”

范皓宇回忆了去年的一个场景:“我们跟合作伙伴一起做原型,有一次我把手机掉在门口的座位上,走过去和别人聊天,找不到手机了。理想同学告诉我说手机在门口的座位上。”这个场景让团队意识到,眼镜是最接近人类第一视角的终端,它能看到你看到的,记录你记录的,同时又足够轻便,可以全天候佩戴。

更重要的是,理想认为自己已经具备了做好这款产品的核心能力。“理想到底能够为眼镜带来什么东西?可以带来我们的操作系统、语义模型、端到端的软硬一体的能力,能够让产品更好。”范皓宇说。

具体到理想AI眼镜Livis的硬件层面。理想团队创造了全球最轻的36克镜架,采用瑞士EMS艾曼斯原厂的医疗级超轻材料TR90,基于5万+中国人头型数据优化镜腿间距、前倾角、转轴外翻等细节,让佩戴舒适度达到全天候标准。

理想AI眼镜Livis的相机功能设计围绕“快”(0.7秒闪电抓拍)、“真”(第一视角拍摄画质)和“美”(人像质感算法)三个核心要素,使其成为一个轻便、随身、且具备专业捕捉能力的AI记录终端。

系统层面,理想自研和内嵌了Livis OS嵌入式操作系统。这个系统最大的特点是“always on”——不关机策略,让眼镜随时待命。范皓宇透露,恒玄的芯片在眼镜上是第一次使用,眼镜基线由理想团队和恒玄一起开发。

在AI大模型层面,自研的MindGPT-4o多模态大模型,配合WearLink Realtime Audio通信,实现了300毫秒唤醒、800毫秒端到端响应。“我们内部无论是面向理想同学的Agent,还是面向自动驾驶,我们都在做VLA的工作。”

从现在很多智能眼镜的产品来看,现在眼镜还是智能手机的延伸和附属。但理想给两者之间塞入了一个三者——范皓宇说,眼镜、车和智能手机这三个终端的关系非常清晰。

“一个是长期佩戴,一个是长期揣兜,还有一个是触摸记录。当这三个东西汇在一起的时候,可以打造一个比较符合用户预期的自然体验。”

从体验上看,理想AI眼镜Livis最独特的价值,除去能够真正的长时间、舒适的佩戴,很大程度上体现在它与理想汽车、理想同学App的深度联动上。这种联动不是简单的功能叠加,而更像是围绕用户场景的精心设计。

一个体验案例是车控:比如在户外场景,无需拿出手机,只需喊“理想同学”就能搞定车辆各项设备控制、车辆信息查询。在炎热的夏天,可以在上车前就远程开启空调;在寒冷的冬天,提前打开方向盘加热;搬运大件物品时,优雅地开启尾门;任何时候,动动嘴就能控制车内的冰箱、充电口。

更有意思的是车机联动。当佩戴眼镜上车时,轻触眼镜触控板即可完成与车机连接,后续上车自动连接,全程无感。连接后,导航和AD播报会从眼镜发声,不影响后排家人娱乐或休息,实现“头枕音响”的效果。

范皓宇还举了一个连贯响应的案例,“到车里面以后,我们会把眼镜唤醒抑制掉,你在说‘理想同学’的时候,车机会响应,但当我说你帮我拍视频的时候,车没有这个能力,于是它自然唤醒眼镜,眼镜开始拍摄。所以你不要想太多,你说就好了,因为这些设备都是我们体系内的。”

为了配合理想AI眼镜的发布,理想同学App进行了全面改版,从原来的单一入口变成了五个tab——给智能眼镜留了一个位置,同时对未来的Agent也进行了布局。

理想想要强调的是:真正的围绕AI来做好的产品,理想不是只想做一个消费电子。

“如果你只是聚焦在座椅再暖一点、空间再大一点,腿部再放个储物空间,就会陷入低维内卷。”范皓宇联系到了汽车圈的内卷,“但如果以新的产品视角的去看待的时候,大家会觉得视野打开了,原来可以这么玩。”

关于新的产品视角,他也举了一个案例——通过唤醒理想同学召唤理想汽车,“它问我说是楼下A座吗?我说是的,当他开到和我差不多的距离,他已经能看到我,我也看到他了,我说让他开到我身边来,当我说完这句话的时候,这个车就过来了。这是以前不会存在的感受,这样会升维打开格局。”

理想AI眼镜Livis也能完成类似询问“理想同学,前面是什么”之类的多模态识别功能。这也是服务好“理想同学”用户的一部分。

陈伟从大模型的角度解释了AI的价值。理想内部构建了VLA(Vision-Language-Action)框架来支撑所有的AI能力,无论是面向理想同学的Agent,还是面向自动驾驶——都是如一。

“VLA解决了怎么能够真正做出一个智能体,能够自主解决问题,为目标而服务,最终完成任务。”陈伟说,“自主性使得我们能够给它一个问题之后就不管它,异步完成后,给我交付一个结果,变成非常简单的人和AI协作的关系。以前它没办法自主解决问题,只能辅助解决问题,人得一直陪着AI,或者它只能解决阶段性的问题。”

他特别强调了语言(L)在VLA中的重要性:“我们认为未来的物理世界的智能体,以自动驾驶为例,它大部分时间是相对快思考的,但是面向复杂场景、困难问题的时候,这个过程中需要要有思考的能力,这个思考能力是需要语言L的引入才能实现的。一旦有了思考能力以后,他就有了基础的思考方法和经验,才能做到跨任务和场景的迁移。”

这种思考能力在理想同学的深度研究功能中得到了体现。用户可以在眼镜端通过语音发起研究任务,理想同学会主动拆解任务进行深度研究,20分钟左右完成。完成后眼镜端会语音提醒,手机端可以查看完整报告。更重要的是,深度研究可以结合用户的记忆,比如“结合之前拍的那段讲思维工具的内容,深度研究一下AI时代笔记产品的赢点在哪里”陈伟认为,这种能力让AI从通用答案进化为贴合用户上下文的专属洞察。

在理想同学App的全新改版中,首页保留了智能问答、研究员、记事本等经典功能,但新增了回忆、车控、眼镜三大专区。其中,“回忆”功能尤为值得关注——它融合照片、视频与文本,将碎片化的记录串联成立体的时光故事。

而理想对记忆系统的独特设计,是技术的统一框架。

与OpenAI的ChatGPT只把文本做记忆不同,理想把文本、录音转译以及照片,都结构化做成统一的记忆框架。“当你下一次沟通的时候,比如说我周末可能会聊是上次玩是什么情况,它都会记下来,因为这种结构化记忆也是我们率先推出的。”范皓宇说。

陈伟补充道:“我们内部的记忆就两件事,时间线为主,但会逐渐抽出很多用户个体,以时间线和用户为中心构建我们的记忆体系。”这种双轴记忆——既有时间线,又有以人为中心的理解——让AI能够真正做到“越用越懂你”。

理想的产品团队认为,AI带来的最大价值是升维——让产品跳出功能堆砌的怪圈,回归到为用户提供“自如而简”的体验。这种思路在理想的产品开发中体现为“既要、又要、也要”——既要符合公司战略,又要有用户价值,也要技术上可实现。

放在理想AI眼镜Livis上也很好理解。核心挑战是如何在36克的重量下实现18.8小时续航,同时保证800毫秒的快速响应;如何做好佩戴和光学体验,包括和蔡司这样的专业选手合作;重构ISP、与芯片厂商恒玄联合开发眼镜基线、采用双电池三电芯方案、铺设超过2177平方毫米的石墨散热片。

范皓宇坦言:“中间好几次都会觉得做不到,甚至有时候想哥(李想)也会觉得到底行不行啊。”

最终,这款AI终端——理想AI眼镜Livis呈现在了大家面前。