直击讯飞AI眼镜发布会
发布时间:2026-06-03 19:59 浏览量:2
最近AI行业又有大事发生,科大讯飞发布了自己的首款AI眼镜。
最近打算买AI眼镜的朋友可能得注意下,我在发布会现场深度体验了下,讯飞这款AI眼镜和目前市面上的主流产品都“不太一样”,看完我的深度体验,可能你的选择会变。
讯飞AI眼镜有哪些不一样的地方呢?
首先,就是非常轻,佩戴舒适感好很多,今年我体验过非常多不同品牌的AI眼镜,有一个感受越来越强烈:
一副好的AI眼镜,前提是它得是一副好眼镜。
大家都宣传自己轻,但是很多厂商为了塞进更大的电池、更亮的屏幕、更多的传感器,把眼镜做到了50克、60克甚至更重。
戴上去半小时鼻梁就酸涩,有沉坠感,而且有些厂商用的光波导镜片会让眼镜发乌,跟墨镜一样,在室内感觉暗沉沉的,买回来新鲜几天,很快你就不想戴了。
一个你都不愿意戴的设备,功能再强有什么用?
讯飞显然想明白了这件事。整机只有40克,已经和常规的板材眼镜重量差不多了。
但"轻"只是结果,怎么做到轻才是本事。
我拆解了一下讯飞在轻量化上的用料,镜片用的是全球首创的全贴合树脂波导片,单片仅2.6克,厚度1.2毫米,视觉上也比较透,镜腿外壳用的是一种新型低密度尼龙材料,密度只有0.89g/cm³,比水还轻。
关键是,戴着看起来不遮脸,很多AI眼镜做的太粗犷了,戴上去感觉整张脸都被眼镜遮住了,讯飞这款镜腿最宽处12.5毫米,最窄处6.1毫米。你闭着眼摸,跟一副普通眼镜几乎没有区别。
但轻只是佩戴舒适的一半。还有关键的另一半:"贴合"。
很多AI眼镜的问题不是重,是重量分布不均——前框太沉往下坠,镜腿夹头,鼻托硌鼻梁。戴半天脸上能压出两道红印子。
讯飞在人因工程上下了功夫。针对亚洲人和欧美人鼻梁高度的差异,专门设计了分区鼻托,毫米级适配不同鼻型。
而且支持600度以内近视、200度以内散光的镜片定制,近视用户可以直接配度数。镜腿的外扩角控制在93到100度之间——这是经过大量人体数据测算出来的,配合均衡配重设计,让整副眼镜的重量均匀分散在鼻梁和双耳三个支撑点上,不会出现某一个点被压得特别狠的情况。
我在发布会现场戴了大概两个小时,感觉舒适性确实相当不错。
整体造型也很克制,沉稳优雅,经典眼镜形态,商务场合不突兀,日常佩戴不违和。也是很经典的设计了。
当然,AI眼镜,最关键的,还得是AI能力。
你可能会说,AI眼镜这条赛道现在热得发烫,大大小小的厂商都在往里挤。印象中讯飞积累最深的是语音技术,能做好一款AI眼镜吗?
我只能说,这个理解完全搞反了。
讯飞最大的优势,恰恰是这么多年沉淀下来的"语音识别+语音合成+翻译大模型+降噪算法+多模态理解"全链条自研能力。
这副眼镜,本质上是讯飞25年技术积累的物理化身。
AI眼镜的本质不是"显示设备",而是"离人嘴巴和耳朵最近的AI入口"。
它最关键的能力恰恰是处理声音。
讯飞在语音技术里摸爬滚打了25年,其实一直在等一个载体。过去我们用手机,得掏出来、解锁、打开APP,交互链路长得像老太婆的裹脚布;后来有了智能耳机,虽然离耳朵近了,但它是个"瞎子"——听得见世界,看不见世界。
而AI眼镜呢?
麦克风离嘴3厘米,摄像头是第一视角,扬声器贴着耳朵,显示屏挨着眼球。
它既能听,又能看,还能说,还能展示。
这就是语音AI的"天选之镜"。
讯飞过去做翻译机、录音笔、车载语音、教育硬件——全是在用单功能设备释放单点技术。
翻译机释放翻译能力,录音笔释放转写能力,每个产品只用到了讯飞弹药库里的一发子弹。
AI眼镜是第一次,把所有子弹装进同一把枪。
从"单兵武器"直接升级到"高达"。
所以讯飞做AI眼镜,不是"一家语音公司去做硬件",是"25年语音技术终于等到了最合适的硬件形态"。
所以讯飞AI眼镜的几个核心能力,才是这次我体验之后觉得真正能真正拉开差距的地方。
第一个:唇动识别降噪。
这是讯飞首创的核心技术。发布会现场做了一个很直观的演示——三个工作人员同时上台,一个说英语,一个说西班牙语,一个说阿拉伯语,三种语言同时说。
先用普通模式收音,大屏幕上投出来的翻译结果就是一锅粥——三种语言混在一起,重叠、错位,完全没法用。
说实话,这就是目前大部分AI眼镜在真实嘈杂环境下的真实表现。
然后开启唇动识别降噪。摄像头捕捉目标说话人的唇部运动,骨传导麦克风加5颗气导麦克风协同工作,实现"看谁翻译谁"。
看向说英语的A,镜片上只显示A的翻译;转头看向说阿拉伯语的C,瞬间切换到C的翻译,语种自动识别。识别准确度90%,嘈杂环境下准确率提升50%以上。
我体验了一下这个功能,说实话很震撼。因为它需要视觉AI、声学算法、语音识别三条技术线同时拉满,还得在40克的硬件里实时跑起来。
这三条线讯飞每一条都自研了十年以上,需要很深厚的积累。
第二个:端到端语音同传大模型
翻译,是AI眼镜最常用的功能。讯飞AI眼镜能做到122种语言实时互译,中英首响快至2秒,覆盖17大行业专业词库。
关键是什么?
讯飞自己就是那个大模型的源头。很多人不知道,国内大量处理语音的产品,底层调的都是讯飞的接口。开放平台842万开发者,日均调用50亿次。行业祖师爷在这儿呢。
而且讯飞的星火大模型跑在自研的国产算力平台上,25年积累的数据飞轮——5万所学校、680个区县医疗、6500万套车载前装——这些场景积累的语音数据量,不是砸钱就能复制的。
第三个是对我吸引力最大的:提词器功能
我作为一个视频博主,几乎每天都要录制口播类的内容。
但是你知道,博主自己想搭一个好用的提词系统有多费劲吗?
首先,要大几千买一套提词设备,要和相机系统配合,必须固定场景,每次录制的时候还得把稿子同步到专用提词器软件里,因为提词器是半透玻璃反射,所以文字必须提前用专用软件作镜像反转,软件还得交会员费......
然后一切准备好之后,还要拿个翻页器手动滚词,也有软件能提供语音识别,根据口播进度自动翻页,但是真难用啊,我换过三套提词设备,我只能说,各有各的局限,而且你得和翻页器配合好,要练习很久,不然眼神会非常怪。
关键后面外拍要动相机,那拆卸和复原简直就是灾难,提词器位置差一点都不行,会严重影响相机成像,每次想到外拍都得搞这一套,我就力竭了,不想拍了......
所以,更新慢,真的不是我懒啊,都赖这些儍设备。
这次试了讯飞AI眼镜的提词器功能,绝对是自媒体人的提效神器。
它直接把提词器做到了镜片上,而且讯飞做语音这么多年,智能跟随可以非常准确识别你说话的进度,比那些小软件做的好太多了,现场体验了下,我那些老古董提词器回去就让他们退休。
不只是拍视频,比如你要做一场演讲,或者给客户做一个重要的汇报,都可以把稿子放进去,上台之后内容就会显示在你眼前的镜片上,你说到哪里,它就滚到哪里,你正常看着观众说话,余光就能看到下一段要讲什么。
关键是台下的人完全无感,你还能趁机和观众搞搞眼神交流,互动啥的,呈现的效果是非常不一样的。
对着稿子念,总是让人感觉水平不行,或者是准备不足,这下就全部解决了,我强烈建议车企老板们开发布会的时候备一个,不然在发布会现场照着提词器念太尴尬了。
讯飞的Micro LED光机亮度能达到百万nit级别,在室外场景下也能看清楚,所以像是户外路演,主持人,经常要开会的管理者,只要你是靠说话吃饭的,那么AI眼镜就能让你吃得更香。
说完技术,聊聊这副眼镜到底改变了什么。
很多人把讯飞AI眼镜理解成"一台戴在脸上的翻译机"。
我只能说,格局小了。
通过它的超级AI助理Loomy,讯飞AI眼镜实现了"感知→理解→执行"的完整闭环。这个在实际生活中的体验是完全不同的。
比如你出国参展,看到一张英文海报、一个路标,以前怎么办?
掏手机、打开翻译APP、对着拍照、等结果。现在直接说一句"小飞小飞,拍照翻译",眼镜自动拍照、识别、翻译,结果直接显示在镜片上。
全程手不用动,眼睛不用离开视线。和手机时代的信息获取方式完全变了。
不只是能看。开会的时候,直接可以用眼镜做会议记录——实时录音转写,还能拍照记录PPT和白板,会后一键生成图文并茂的会议纪要。
语音文字加拍摄图片加翻译文本,统一呈现,自动排版,高亮关键内容。以前会后花一小时整理笔记的活,现在自动搞定。
而且它还能直接跨端调度手机APP——帮你发微信通知、导航、甚至完成支付。
搭配云端部署的AstronClaw和桌面AI助手Loomy,一句话就能让它帮你整理待办、生成文档、发送邮件。
这改变了什么?改变了"人找信息"到"信息找人"的范式。
以前你需要掏手机、打开APP、搜索、复制粘贴,每一步都是摩擦力,每一步都在打断你的工作流。现在一句话,AI替你完成全链条。
从行业的角度看,讯飞用这副眼镜证明了一件事——AI眼镜的核心竞争力不是硬件参数,而是"谁的AI能力链条最完整"。
40克的重量是入场券,但唇动降噪加同传大模型加跨端执行,才是真正的护城河。
最后聊聊这场发布会里,真正让我觉得"这产品不一样"的地方。
现场网络环境不稳定,收声条件复杂,周围几百号人——这对产品的鲁棒性是个巨大的挑战,但是讯飞直接实机演示。
三个人同时用三种语言说话,现场测降噪。真的拨通电话给海外同事,现场测通话翻译——对方说的是西班牙语,眼镜实时双语字幕显示,中文回复自动翻译成西语播放给对方。通话结束后一句指令,AI自动生成通话摘要——时间、地点、事件,条条列出。
掏出一张英文海报,现场测视觉翻译,拍照识别翻译,任务执行得非常顺畅。
更亮眼的是超级AI助理Loomy的完整工作流演示。
现场演示了一个完整的商务场景链条:先让Loomy根据展会单页搜索信息、整合出合作方案;然后让Loomy查找展会负责人邮箱、整理出行注意事项并保存为文档;最后让Loomy把活动规划和出行文档打包成邮件,直接发送给相关负责人。
从信息采集到方案生成,从文档整理到邮件发送,全程没掏手机,没动手指。
一句话一个环节,这恐怕真的要改变职场人的工作方式了。
别小瞧这个演示,这意味着讯飞AI眼镜已经成为了一个能够胜任复杂场景、解决实际问题的成熟终端。——这不只是一台翻译机,这是一个完整的AI工作流系统。
讯飞做AI眼镜,不是在做一副眼镜,是在给25年的技术积累找一张脸。——它是技术溢出的产物,不是战略跟风的产物。
当AI从手机屏幕里走出来,贴到你的脸上、耳朵旁、眼睛前的时候,意味着AI第一次拥有了和你一样的视角、一样的听觉、一样的实时在场感,这的确有种未来已来的感觉,我觉得值得一试。目前已经开放了1元预约体验通道,对AI眼镜感兴趣、或者工作中有翻译/提词/会议记录需求的朋友,建议先约一个体验看看,亲手试过才知道它到底适不适合你。