生成式AI下一步:硬件爆发,眼镜为王?
发布时间:2024-12-25 04:44 浏览量:2
设计/肖琴
再过几天,我们将迎来新的一年,2025年。
过去一年里,我们持续见证了一系列变革的发生:股市、楼市政策调控发力,人工智能等新质生产力茁壮生长,中国经济回升向好势头持续增强。面对新的时间开启,我们对未来有着更多的憧憬和期待。九派新闻“九派智库”和光谷实验室“稻香湖智库”推出“猜想2025”年终策划,关注它们的发展趋势,希望在新的一年里给公众提供专业意见。
回顾2024,生成式AI产业成为全球创新、投资和应用的热点领域。Sora引领了视频生成的新潮流,多模态世界模型的研究备受关注。更具革命性的推理模型o1横空出世,使得基座大语言模型不再一枝独秀。
2025年,生成式AI究竟会有怎样的发展?
我们邀请到华中科技大学教授、国家实验室首席战略研究科学家房超,硅基智能创始人、CEO司马华鹏,深蓝互联创始人、CEO王得金共同发起“生成式AI将向何处去”的讨论。
以下是本期节目内容摘录,由于篇幅较长,特拆成两篇发布,这是第一篇:
明年很可能会是一个眼镜大战
房超(华中科技大学教授、国家实验室首席战略研究科学家):现在已经有sola 等一些新产品,大家的态度分两种,一种认为很多东西打破了认知,一种认为没什么稀奇的。
司马华鹏(硅基智能创始人、CEO): 12月5日开始的直播我基本上一场没看,第二天早上我会关注一下相关报道,最近人工智能之类的新闻开始降温,大家不是特别 care AI 新闻和一些变化。sora最开始的发布到现在,快一年了,之前是卖家秀,现在是买家秀,大家也在期待至少有一个 gpt4.5或者 gpt5,现在看出不来新版本。大模型走到了一个应用为王的阶段,底层有新的升级变化才有可能带来下一次飞跃,模型差距我觉得会越来越接近于天花板,大家回到商业本质做商业落地会变得更加主流。
房超(华中科技大学教授、国家实验室首席战略研究科学家):12天的连播播到现在还没有播到你的心趴上。(笑)
司马华鹏(硅基智能创始人、CEO):对(笑)。
王得金(深蓝互联创始人、CEO): 确实。到现在为止,GPT3.5到4、4o都是文科生水平。open AI伊利亚和奥特曼之间发生过价值观矛盾,伊利亚更强调安全性、可靠性,奥斯曼强调商业化落地。奥特曼现在面临scheme law 这条路要不要继续往下走,因为需要烧更多的钱,训练一次要烧掉上亿美金,它必须要迭代出一些惊艳的通用市场能力,或是展现一些资方商业落地的能力。奥特曼跟巨头比,烧钱的能力比不过,商业化关键战略应该是模式验证,必须要落在各种智能体上。
这里立一个 flag ,我认为从现在开始到2025年,以这次12天每天一个小智能体的发布为契机,后面它会发布一系列不同应用场景的智能。它可能会发一个智能体框架。这个框架,一方面可能会为AGI 故事做准备,另一方面为生成式AI做技术支撑。
OpenAI和苹果手机做了结合,是不是生成式AI的落地?
我的理解是,经验不一定在某一个领域、一个任务上做闭环。它本质应该是 AI增长,跟苹果的战略结合,更多是双方商业上的考量。线上大模型的saas化付费,ai as a service,提供服务的商业模式,经过这段时间验证,所耗费的资源,如电费、冷却水等等是非常庞大的,但它的商业落地能力不被大家看好,它就急需把资源、能源都能够分摊到各种终端,像以前互联网或者移动互联网的商业模式变现那样,把很多硬件和软件都集成到一起,来维护苹果生态。
现在手机已经达到了一个很好的智能化水平了,与生成式AI的结合是否能够给我们带来新的生产力?我认为是有疑问的。
司马华鹏(硅基智能创始人、CEO): 苹果这个体系应该是一直在引领着全世界交互变革。从最早的图形界面到后来的触屏体系。一个是 PC 互联网,一个是移动互联网。包括乔布斯最后的时间里打磨了 siri ,siri 在整个苹果体系里,是一个非常重要的发明,但很可惜,他去世之后这个事情基本上停滞了,今天把 apple 接入大模型,等于是停了十几年的 siri 的又一次版本升级。如果说乔布斯还能再多活十年的话,我们应该很早就能看到类似的产品。乔布斯的遗志由大量创业公司帮他实现了。我也用了很多大模型,国内的在一些深度理解上面、深度思考认知与国外比还是有差距的。当然差距没有我们最开始那么大,现在还在缩小。
我觉得我们还是很期待,类似于智能眼镜、智能耳机。一些新的把 siri 路线再往下走的智能硬件能够继续发展,我觉得明年会是一个眼镜大战,这个有可能是非常好的引爆点。
房超(华中科技大学教授、国家实验室首席战略研究科学家):至少咱们三个都是戴眼镜的,可以先尝试一下。
王得金(深蓝互联创始人、CEO): 对,我还是很期待的,在“现实”的基础上,加上它本身的自然对话。这个才是真正的 AR 增强现实,以前认为是视觉增强。它有点像我们快思考、慢思考之外多一个外挂。这个外挂对于大脑来说是非常重要的插件,载体一旦形成,很多应用会爆发。比如社交,很多工作场景都会被眼镜所代替,比如三个人是不同国家的,过去有语言障碍,现在可能真的就变成大家很自然的去交流了。就像凯文凯利在上海外滩讲过 global workforce(全球的劳动力)
房超(华中科技大学教授、国家实验室首席战略研究科学家):让我想起了古巴比伦的古巴比伦人巴贝尔塔计划,要盖一个通天塔,直通天神,结果他让大家所有人说不同的语言,通天塔盖不成。现在有这个,通天塔就可以盖成了。
司马华鹏(硅基智能创始人、CEO): 对,美国对 AI 如火如荼地推进,我曾经在一次演讲里说,他们在造上帝,我们在找落地。这是中美差别,美国有一种思潮,他们认为这是重返伊甸园的手段,AI 可以帮助人类能够找回到原来很多的失落的东西。他们那儿已经上升到信仰了,我们这边都在寻找商业模式。
图/cfp
互联网上的优质数据已经学完了
房超(华中科技大学教授、国家实验室首席战略研究科学家):通过装备赋能,AI 还是大有可为,咱们不能直接说OpenAI 今年不行,或者激动人心,可能要从技术上和它的应用场景来看。生成式AI还有一个时髦的问题是,幻觉。有人说大模型基本消除了幻觉。
司马华鹏(硅基智能创始人、CEO): 首先我们得先承认它是有幻觉这件事,我一直认为 AI 的幻觉是好事。因为人类的幻觉也很严重。
房超(华中科技大学教授、国家实验室首席战略研究科学家):非常赞同。我经常说,怎么机器一出个幻觉,咱们就要拍死,人出现幻觉就没事。
司马华鹏(硅基智能创始人、CEO):好像是一个很消极的词汇。现在它为什么一上来能够干掉艺术家?我们以为它能干掉蓝领工人,现在干掉的都是写歌的,唱歌的,画画的,拍电影的。幻觉其实是非常重要的,大模型的能力就是自涌现出来的一些创造力,我们今天只不过没办法理解它,它超出了一些控制,所以称之为幻觉。
我之前看过一个视频,他们把当时水门事件的官员拉出来质询,他说的所有话、所回忆的每个场景都跟现实不一样,从头到尾都在说谎,但通过脑电图测试没有说谎。人类一本正经胡说八道,也是很厉害的。所以我觉得AI 的幻觉,没必要先打一个负面标签。这很可能是AI 自我意识特性上很重要的点。
当然,技术确实能够消除幻觉的核心,因为它本身接近于检索。在确定性和不确定性上,我觉得还是要基于应用场景来谈,我们做了 AI 陪伴,幻觉有时候是比较浪漫的,也有时候比较出人意料。人类的想象力是主观能动性,而 AI 的想象力呢?虽然不好说是不是主观能动性,但很多时候是我们不可知的,到底是主观能动,还是因为对事情认识不全。
很多的技术在消除幻觉,有一些场景,又在利用他的幻觉,利用自涌现的能力产生创造力。
房超(华中科技大学教授、国家实验室首席战略研究科学家):机器产生的幻觉跟人类的想象力结合,出来的效果往往更好的,人是具有想象力的,我们看见一个插头有两个口,我们会把它想象成一个笑点。AI 给我们提供了一个想象力素材,我们在发挥想象力,最后一起腾飞。有一种路线是,transformal 大模型结合深度神经网络,而这个网络能够仿真生物的神经单元。
王得金(深蓝互联创始人、CEO):逻辑上就是努力建构人脑结构,人脑结构是由上百万亿、上百亿神经元构成的,工作模式比较多,比如有快思考、慢思考、联想,这个能力运用在好的方面就是创造力或者技术。应用在不好的地方,就是不自知的说话,其实是一个特性,一个 feature,不一定好,也不一定不好。
房超(华中科技大学教授、国家实验室首席战略研究科学家):生成式AI 创业公司的预训练是基于transforma架构进行的,包括数据的输入方式、生成方式,预训练成本很贵。如果追求低成本,那相应的模型就要减小,数据量就要减小,我们能不能走出一条不一样的路。
王得金(深蓝互联创始人、CEO):中国肯定要走经济型的大模型训练。2023年之后,我们受到了一些客观环境的限制,包括一些算力等等,国内的想法就是美国负责上帝,咱负责落地,在这个情况下,大模型基础的 principle ,一些公理级别的东西,就是2017年的一个 paper 奠定的,至今没有非常多的理论层面的创新。
4o 、4o-mini ,可能用一个比别人小很多的模型参数就达到了效果,可能跟几千亿的参数差不多,中国更擅长用 MOE 混合架构,把它分解成更多小模型。我们工程师的辛勤汗水换了很多更昂贵的板卡。
司马华鹏(硅基智能创始人、CEO):对,我觉得目前预训练阶段已经结束了,优质数据已经学完了,整个互联网上的数据只能把它教到一个本科生的水平。伊利亚提出大力发展合成数据,他也提出底层transformer 架构优化版本,国内像 RWKV 其实是在升级底层架构,微软最新出的一些模型,每三个月知识密度会往上升一级。现在回头看GPT发布也就整整两年,真的就是日新月异。
这期间推出的新产品,也非常震撼,我们自己在很多领域快速迭代,快速 move ,不管遇到数据问题,还是底层架构问题,包括未来会遇到算力和电力问题,这些都属于发展过程中的比较正常的问题。我们投了足够多的资本、足够多的优秀人才,现在全世界,主要是中美,最优秀的人才都全部投入到这个事情上了。非常酷。
OpenAI两年时间里保持领先,已经很困难了,很多新模型出来都在挑战它,各家各领风骚数十天,现在处在战国时代,还没到大一统的时候。
拿钱砸出来的初心和原发性的驱动力是不一样的
房超(华中科技大学教授、国家实验室首席战略研究科学家):有一个很有意思的现象,4o发布到现在,OpenAI没有特别大的动作,相应地,我国的生成式AI创业公司“六小龙”也没有推出一些新的产品和这个大的动作。别人不动,我也按兵不动。
司马华鹏(硅基智能创始人、CEO):这个事很有趣,光明顶六大门派的心思不太一样。
房超(华中科技大学教授、国家实验室首席战略研究科学家):一个很好的比喻。
司马华鹏(硅基智能创始人、CEO):对(笑),可能最后会出个张无忌,创业跟初心有关,中美有很多创业公司,他们做了很酷的一些创新,只是没有被关注。“六小龙”到今天还没有办法把生意转正,都在一些比较痛苦的状态,拿钱砸出来的初心和最终基于自发性、原发性的想做事情的差别还是很大的,互联网的一句话很火:凡夫修行为果,菩萨修行为因。我是比较看重因的,我接触到很多国内、国外的团队,有些就真的是信仰级的。
现在聚光灯都给了那些大公司,六大门派大家会感觉到有一些枯燥,他们也没什么新东西出来。唯一能吸引大家的可能是朱啸虎跟老杨同志的私人恩怨,上升到一个吵架的状态。
房超(华中科技大学教授、国家实验室首席战略研究科学家): 能当电视剧来看了。
司马华鹏(硅基智能创始人、CEO): (笑)对。我觉得是一个很有趣的时代,很多浮在冰面以下的创业公司,未来会成为主角,它带来的变革一定不是大家所看到的那些。占据舞台中央的,可能是从边缘进来的,像 kimi 当时就抓住了两三周的时间,快速崛起,今天成为一个领先者。
房超(华中科技大学教授、国家实验室首席战略研究科学家): 咱们对标海外,还有一个波斯总坛,国内很难为梦想窒息,这涉及到体系化的因素。
王得金(深蓝互联创始人、CEO):国内资金面临着两难选择。他如果拿这笔钱去砸一个 API 或者非常亮眼的功能,背后的资方比他有钱。能砸的话,他自己就去砸,没有你什么事就收购了,如果你不去做这件事,就要努力地做出一招鲜,获得战略有利地位,玩商业模式创新。波斯总坛面临的问题是解决一些信念信仰、价值观差异,团队对下一步怎么走。
房超(华中科技大学教授、国家实验室首席战略研究科学家):我们再来聊聊人工智能的软硬件问题。如果把大模型跟移动互联网浪潮对比,互联网就是软件和硬件几乎同时出现,比如电脑、智能手机,自然就能够增长。现在大模型软件有了没有硬件,它是否需要新的硬件?和大模型匹配的硬件是什么?
司马华鹏(硅基智能创始人、CEO): AI 本质上是第四次工业革命的一套逻辑,一个非常典型新物种升级,硅基智能一直把它叫做硅基生命或硅基劳动力,AI 就是地球上创造出来的新物种。它是全方位的爆发。大家知道中国玩具出口量是非常大的,如果都实现陪伴智能化,就是非常可怕的市场,包括眼镜、机器人手臂之类的,非常酷,巨头也拦不住,能拦的只是流量。而它们不在主流的互联网公司雷达范围内。
房超(华中科技大学教授、国家实验室首席战略研究科学家): 我平常讲课经常举一个例子,欧美传统的机器人实力比较强,机械化、自动化,信息化开展的比较早,但很多东西缺乏智能化的大脑。现在把智能化的大脑放进去,就可以产生很多意想不到的效果,我们国家可能是反的,现在智能化大脑发展很好,想的是脑子到底往什么上面装,这两种方式都会诞生出很多新硬件。以后有没有我们现在想不到的新的硬件可以跟大模型结合?
王得金(深蓝互联创始人、CEO):首先关于硬件,我认为稳定的一体化形态已经产生了。 PC时代是移动互联网,AI 时代,英伟达的市值已经充分证明了。这场仗打到最后它一定是来自于一个我们认为非常边缘的角度,不妨畅想一下。未来应该是一个任何形式的设备,我跟它交流,它就会给我一个非常好的体验。
房超(华中科技大学教授、国家实验室首席战略研究科学家):我想起一个非常有名的电影《手机》,手机早在智能化时代之前,很早就让大家认识到,它变成了生活中现在不可替代的一种东西,它可以记录人的行踪,人的秘密,大模型以后也是这样,也可能眼镜就是不能替代的东西。