有人提前五年,预判了 OpenAI 的预判

发布时间:2026-01-16 12:04  浏览量:4

在上个月的一次访谈里,Sam Altman 说现在用手机的感觉,就像走在纽约时代广场。

到处是闪烁的霓虹灯、此起彼伏的通知、各种东西在抢你的注意力。你很难在这种环境里获得平静。

而他想做的设备是什么感觉呢?是坐在湖边小木屋里的那种宁静。

这个比喻我觉得很准。某种程度上,手机确实更像是上一代技术的载体。

问题不是手机不好,而是手机这个形态天然就会让你不断去看屏幕、不断被打断。

每一个 App 都在想办法多留住你几分钟,久而久之,手机就变成了一个注意力黑洞。

AI 如果只能待在手机 App 里,其实也逃不开这个问题。

你想用 ChatGPT,得先解锁手机,再找到 App,再点开,再打字或者按住说话。这个链条挺长的。

而且一旦打开手机,微信消息、朋友圈、各种通知就都冒出来了,你很难专注在原本想做的事情上。

所以 OpenAI 做硬件这件事,我觉得肯定不是心血来潮,而是他们在认真思考一个问题:AI 应该以什么样的姿态进入日常生活?

是继续待在手机里,和几百个 App 挤在一起抢你的注意力?还是换一种形态,用更自然的方式陪在你身边?

今天的大多数设备,默认假设是我必须不断打断你,才能证明我有价值。通知、红点、弹窗、信息流,本质上都是在争夺注意力。

而一旦设备的价值和注意力绑定,它就必然会越来越吵。

Sam 的判断是,这不是产品经理的问题,是技术阶段的问题。

在过去,计算机不够聪明,只能被动响应指令,于是我们只能通过屏幕、按钮、列表、确认框,一步一步操作它。

这种前提下,设备只能不断问你:现在要不要点一下?要不要看一下?

但随着 AI 越来越聪明,越来越值得信任,它就不需要时时刻刻跳出来刷存在感。

全新的 AI 硬件应该可以帮我们过滤掉 90% 不重要的东西,然后只在真正需要我们参与的时候才出现。

有点意思。不管最后能不能成,我觉得 OpenAI 瞄准的确实是一个跨时代的问题。

OpenAI 这个新项目代号叫 Sweetpea,翻译过来就是甜豌豆。

根据供应链的消息,这是一款音频设备,形态有点像耳机,但又不完全是传统耳机。

主体是一个金属的卵石形状充电盒,里面有两颗可拆卸的胶囊状组件,佩戴的时候挂在耳朵后面,不是塞进耳朵里的那种。

为什么是耳机这个形态,而不是眼镜、手环或者其他什么东西?

先从一个我熟悉的产品说起:讯飞 AI 会议耳机。这个产品最近一直在用。确实非常方便。

今年 CES 上,还拿到了微软的人工智能创新奖,算是得到了国际市场的认可。

很多人不知道,讯飞 AI 会议耳机其实是国内一家叫未来智能的 AI 硬件创业公司做的。入耳式、开放式都有,佩戴体验很不错。

他们的耳机思路和 OpenAI 不太一样。OpenAI 想做的是一个通用的 AI 伴侣,什么场景都能用。

而未来智能选择只做办公这一个场景,把体验往深里打。

我举几个例子你就理解了。

在职场的人免不了开会。像我这周去深圳出差,出租车上还一直在开会。说实话,免不了走神。社会人嘛,总有很多会议必须得开,但也很难全情的参与。

去年我把自己的 AirPods 换成讯飞 AI 会议耳机后,感觉就会方便很多。至少没有心理压力了。

因为开完会后,我可以直接在手机软件 viaim 上快速查看这场会的摘要总结,以及待办事项等等。

如果对某个细节有疑惑,也能直接和 viaim AI 沟通,深度追问。

我感觉耳机真的是一个天然的录音设备。

你可能会问,如果线下开会呢?不可能戴着耳机吧。是的,不可能。

但讯飞 AI 耳机的设计也很好,直接在耳机充电盒上按下按钮就能录音,不需要一定得戴上耳机。

大家想想,是不是这年头,每个人口袋里都随身放着一个耳机盒。最近录音卡片也很火,我也用。

但确实有时候会忘记拿录音卡片,把它一直贴到手机后面又影响手感。

所以,把耳机当成智能录音设备,这个创意确实挺妙的。

其实你仔细想想,AI 耳机能做的事情比我们想象的多。录音转写、会议总结、实时翻译、语音助手,这些功能加在一起,已经覆盖了很多办公场景。

前段时间我买了一副 AI 眼镜,戴了两天觉得不舒服,又卖了。

说实话,现在的 AI 眼镜还不太成熟。但如果不考虑屏幕显示的话,眼镜能做的事情,耳机其实都能做。

而且耳机戴起来没什么负担,这个优势挺明显的。

刚刚查资料,搜到一篇未来智能公司创始人马啸的访谈。里面有个观点非常深刻:耳机是大模型最天然的“耳朵”。

我觉得人家说的蛮好的。结合他的观点,说下我个人对耳机这个赛道的理解。

首先,耳机是一个人们已经习惯经常佩戴的品类。你想想看,通勤、健身、工作,很多人耳机就一直挂着。

AirPods 这几年卖得那么好,本质上是因为它足够轻、足够方便,让人愿意一直戴着。

OpenAI 如果做耳机,不需要教育用户接受一个全新的行为习惯,这个门槛就低了很多。

其次,耳机天然适合语音交互。AI 最强的能力是什么?是理解语言、生成语言。

一个贴在耳边的设备,可以随时听你说话,也可以随时在你耳边回应。这比盯着屏幕打字自然多了。

而且耳机有一个好处,它不占用你的眼睛和双手。你可以一边走路一边和 AI 聊天,一边做饭一边让它帮你查东西。

第三点可能更现实:技术门槛相对低。AI 眼镜要解决显示、光学、续航一大堆问题,苹果的 Vision Pro 做到那个程度了,市场依然没打开。

但耳机不一样,技术成熟度高得多,供应链也是现成的。

还有一点我觉得挺关键的。

耳机这个形态,社会接受度高。你戴个耳机走在街上,没人会多看你一眼。但你要是戴个 AR 眼镜,或者胸口别个什么 AI 徽章,总会有点奇怪。

Google Glass 当年失败,很大一部分原因就是社交上让人不舒服,别人不知道你是不是在偷偷录像。

AI 时代,耳机可能不再只是手机的配件,而是会成为下一代人机交互的关键入口。

过去我们总觉得,硅谷是创新的原点,包括这次 LLM,虽然国内做的不错,但确实重要的创新都来自硅谷。

但在 AI 硬件这件事上,情况好像有点不一样。

查了下,未来智能这家创业公司从 2021 年就开始做 AI 会议耳机了。比 OpenAI 早了五年时间。不得不佩服这个判断力。

刚我提到的那篇采访,强烈推荐大家读读。文章中提到了很多耳机层面的认知和判断。

比如他说硬件不是互联网软件。软件可以先做一个亮点,其它短板慢慢补。硬件是木桶效应,最短那块板,直接决定生死。

所以,未来智能的产品没有选择通用场景,直接明确告诉用户:这是一个会议“助理”,帮你解决最实际的办公痛点,做你的 AI work mate。

产品定位上,他们不抢 Bose 的降噪心智,不抢索尼的音质心智。

而是围绕办公会议这个场景,把录音、转写、总结、待办、翻译这些功能,一件一件做好,解决用户的现实需求。

甚至在充电盒上,都做成单手推开就能录音。

这个采访看的我非常过瘾。

04 我的感触

iPod 之父法德尔说过一句话:只有真正的问题、正确的时机和创新技术的组合,才能创造爆发性的机会。

真正的问题是什么?是我们被手机绑架了,每天在各种 App 里消耗大量时间和注意力,烦又无可奈何。这个痛点存在很久了,但一直没有好的解决方案。

正确的时机是什么?是 AI 终于变得足够聪明了。过去的语音助手,你问它今天天气怎么样还行,稍微复杂一点的事情就搞不定。

但现在的大模型不一样,它真的能理解你在说什么,能帮你处理很多事情。

创新技术是什么?就是把这个足够聪明的 AI,装进一个你愿意随身携带的设备里。不是手机,不是电脑,而是一个更轻、更自然、更不打扰你的东西。

这三件事凑到一起,AI 耳机这个赛道应该就成立了。

OpenAI 在做,未来智能在做,CES 上一堆公司都在做。

大家选择了不同的路径,有的做通用助手,有的深耕垂直场景,但本质上都在回答同一个问题:AI 应该以什么样的方式进入我们的日常生活?

我不知道最后谁能跑出来,这个赛道的坑肯定还有很多。但有一点我觉得挺确定的:手机不会消失,但会有新的设备来分担它的一部分功能。

也许几年之后,我们出门的标配就是手机加一副 AI 耳机。手机负责那些必须用屏幕的事情,耳机负责那些用语音更自然的事情。两者互补,而不是替代。