Z系Db的端侧-0120
发布时间:2025-01-21 07:41 浏览量:1
今天有件大事 就是下午的时候DB除了全量的语音模型的通用版本 但是这还不是最终版 最终版会融合模型B一起在27 28号左右全量更新 主要是TO C的 让上到70 80的老人 下到3 4岁刚牙牙学语完的孩子 每个老百姓确确实实的用到 体验到大模型 切身实地的感受到大模型的变化 什么叫做ai情绪价值 才能真的改变认知 意识到人工智能的时代真正的到来了 而不仅仅只是望着大洋彼岸的chatgpt 用对标和YY的想法去做投资和理解AI
但是我感觉目前远远没有达到爆火的程度 我在这里预期 到了春节期间 不断的营销+别的app导流和春节活动流量的加持之后 一定会爆火 火到出圈 随便翻个朋友圈都能看到一大堆的程度(但愿是如此)
同时今天还发了deepseek的R1的强化学习time test推理模型 真实的标致着国产模型的在后发制人的情况下 弯道超车的奇点即将来临
今天网上有个纪要写的挺好的 估计也是我之前聊过的某个专家 里面提到了 Z之后的模型的规划 比如说 每个月都会有一些新的模型能力出来 每个月都有新的版本发出 迭代会非常快 一月底可能会有“海草”的模型发布 大概2~2月中旬也会有强化学习的模型出来
全年的主线是各种不同模态的模型沿着一个清晰的时间线做跟新迭代 重点将放在融合多模态的文本、语音、图像等模型上 并在 25 年底推出一些世界多模态模型
我一直聊的都是Z的算力 模型的规划 今天来聊一聊Z系端侧的内容
今天看到有个卖方评论还是期待视屏模型 而我不一样 我更看好语音 to C模型 主要是我知道端到端的交互 语音的作用很大 能说话的场合真的会懒得打字(打字才是反人类的设计 wx那个语音转文字真的太不好用了)
而且它实际上跟传统的app并不冲突 有个模型出身的朋友说:视频交互之前商T也做了,demo很惊艳,但是不会有人一直拿着手机搞的,还是得和眼镜和端侧产品结合,语音模型这种个人AGENT占用的是用户屏幕关闭的时间,和短视频APP的使用场景不冲突,一个是和内容手机内容交互,一个是和真实世界交互,也是不同场景,不会相互替代。
这步旗 我觉得比起什么大模型搞编程 工作 推理强化 高明太多了 用户真的不会天天花时间在前面这些东西上面
大模型和AGENT最终会融入生活 人还是跟平常一样生活 而生活的入口变成了端侧 听见东西(耳机 眼镜 指环 手机的麦克风) 讲话(耳机 眼镜 指环 手机的麦克风) 看见东西(眼镜的摄像头和显示屏)也就是Z这边将来会提倡的 voice IU的概念 你可以几乎不用打开手机 让大模型和AGNET帮你完成的大部分的事情
所以我非常看好将来端侧产品的爆发 几乎就是一个0-100的大行业的诞生 其中包括现在最早的产品ai玩具 比如显眼包 之后的ai眼镜 ai指环 ai手机 甚至将来的ai机器人 一个个跨时代爆款和ai时代生活必需品慢慢诞生的过程
为什么看好ai玩具呢 主要是现在DB的大部分用户 有30%以上都是未成年人 大家如果有孩子 作为家长 其实是非常希望 有一个东西能陪伴孩子 能杀时间的同时 最好还能给孩子正确的三观培养 还有学到一些东西 就好比DB这个app 但是家长看到孩子天天拿着手机 尤其是没多大的孩子总是不放心的(万一沉迷一些擦边的内容就不好了)
所以作为手机的替代 如果你是一个家长 你很容易能接受孩子用一个ai玩具 ai学习机 或者综合的一个ai陪伴的端侧产品去取代 但是又不希望这个功能是阉割和无趣的(比如真的就纯学习的app )这是我看好这一块的其中一个原因(而且过往有成功的案例 比如小天C手表 就是取代手机的成功案例)
我们就从架构层面来拆解一下Z的端侧团队
一般分为上中下层 简单来说 就是分为销售团队 产品研发团队 和技术团队
目前端侧的产品都是销售团队找产品研发团队去落地一些ideas 或者产品层找他们去推广一些产品 然后最后是落实到技术团队去做交付和方案的架构
其中产品研发团队 分为RTC团队和人工智能团队(TTS+ARS)
两个团队各有一些产品团队 分别带了一些具体的产品做执行 目前两个团队可能是有竞争关系的
其中RTC团队主导的方案是现阶段铺流量 每年硬性卖多少个产品 多少亿的token数 第一步还是铺流量 不以赚钱和变现为核心
另外一个团队比较考虑一些变现的问题 比如说 商业模式会倾向于在玩具或者端侧的产品中植入广告 因为Z最大的优势就是广告业务 Z本身就是一个广告的聚合商 非常容易找到标品的广告客户 再把广告的流量导入到玩具或者终端上 打个比方说:比如你问他一个问题 冬天太冷了穿什么合适 它可能就会说XX品牌的羽绒服很好啊(但是这块对成年人或者商用客户问题不大 但是对未成年客户可能有些风险 目前还在商业模式阶段)这个团队的负责人L总以前是BU音响这边出来的 也主导了DB的第一代耳机的量产(目前反馈不算太好 所以现在二代耳机需要改进的地方就非常多)这个团队合作比较紧密的供应商主要是捷锂和蓝X 还有喜犁 主要是白牌模式 白牌的缺点就是没人给你开发 都是统一模式 需要自己的力量去制定方案 所以第一代耳机效果就是差强人意 当然这也跟Z系基本很少接触硬件有关 基本都没有做的太好的案例 教育有(但是zc导致最终不太好)
所以现在玩具主导的团队主要是RTC团队 他们的供应商 目前就是端侧四小龙 主要就是移Y 广HT 乐X 润X这几个
最早Z的团队很多人都是GHT出身的 最早显眼宝的东西是内部互赠的试水赠品 去找GHT合作 GHT因为这个单子实在太小了 就几千个 就没看上 完美错过 最后给LX接下来了
今天看到GHT活蹦乱跳的 还要搞什么发布会 估计也就是后悔了 没想到这个Z这个布局将来的产品阵列和野心有那么大 现在属于掉头后 非常配合的阶段
包括二代耳机和眼镜的团队 去深圳拜访供应商 还是优先拜访 DIJI LUX GHT 歌E这些 所以如果GHT乖乖听话 好好配合Z系的端侧产品 将来的预期还是很好的 包络眼镜 二代耳机 指环 手机 甚至将来的机器人 都可能会占据一席之地的份额(当然这些产品都没落地 还都在内部showcase的阶段 还是多个方案赛马目前 )
所以我们还是回来说说现在要发的端侧产品玩具的方案
这个方案经历过大厂看不上 小厂觉得不够高端的一系列阻碍之后 机缘巧合之下移Y的工程师团队莫名其妙接下了单子 差不多是连董事长都不知道的程度 之后找了半天公司高层 后知后觉的 竟然成为了Z的端侧玩具主要供应商
Z目前找到主要供应商就是移Y(差不多是爆单的状态 移Y甚至不好意思只能插单给Z 据我所知 订单大概有200W~300W个左右 大多数都是toB的产品 主要是销售团队签的B端用户 比如某奶茶公司 某医药公司 某服装公司) 还和移Y签了大概4个月的限制协议(估计RX也签了类似的东西 ) 大概的内容就是 4个月内的token-收益share 都由移Y来收益(比如会搞个二维码在产品背后 你要充值token扫这个码就接入移Y然后充值 移Y肯定可以得到token的抽成)
而新进的供应商的比如GHT 可能都是现阶段只能卖模组和解决方案为主
那我们来拆分一下 这个模组 目前可以理解为一个整个pcba的板 其中包含物联网模组 比如问移动买的4Gsim卡 MCU+SOC的芯片 这不是什么高端货 目前4G蜂窝模组 差不多ASP在40~60元RMb左右 如果以后能升级到5G版本 甚至端侧高端版本(比如用高通芯片啥的)那就是几百块钱以上的ASP了(目前玩具还是试水阶段 不会一口气做高端产品)
所以四小龙可以理解为 移Y可以自己做蜂窝模组(物联网的)LX主要是做芯片 模组总成外购组装(主要是wifi版本 在家用)GHT也可以自己做蜂窝模组 RX的话可能也是外购为主
Z的算力主要是云端算力 即使是我们市场比较热的 ai玩具 ai眼睛 甚至以后的指环 耳机 基本都是才用云端算力为主 而不是端侧算力(所以才会存在token流量包这个东西)
我下面有提到端侧的基础是一个月1块钱 这个怎么来的呢 第一批显眼包的内部测试数据用户使用时长达每天3-4个小时 所以1块钱的推理费用其实就是 假设用户每天用3~4个小时 连续30天用 差不多就是一块钱的推理费用(所以12块钱包第一年 但是你第一年就用完了 就必须买流量包)
商业模式来说目前有三种主要的:
第一种 我举个例子来说 有个奶茶品牌找到了Z 问想要做一个ai玩具的产品 那技术团队做的主要是这个品牌形象和你想要的一个人设的模型的设定和蒸馏(就好比你在DB里面那个奥特曼啊 奶龙那些虚拟形象类似的)大概收取的费用 大概ARS+RTC+TTS的包 差不多是20块钱 推理token本身大概12块钱(就是一个月满打满算1元推理成本 所以目前这类蒸馏模型的模型不会太大 大概1~3B左右 回复速度也不会太快 太大算力成本太高了-但是不排除用户有需求 我完全可以全流量给你搞-前提就是你出得起钱 类似于日本那个几万块RMb的LOVOT) 所以差不多是32块钱左右来自Z 然后比如移Y做模组 大概是50块钱好了 最终的产品就是大概80~90块钱 做了一个核心蜂窝模组 然后我厂家也好 端侧公司也好 我找个毛绒玩具厂 花个几块钱套个外壳 差不多就是最终的玩具的样子了 这个玩具交付到B端客户这边 客户可能售价299 399 甚至499 这个就是客户自己定价了 多出来的钱除去我说的这些成本客户就是自己赚钱 当然如果token不够用 就必须买 那就必须找签约的token收益厂商充值 比如YY和RX 就是这个商业模式
第二种 端侧厂商你自己去找配合IP公司或者B端的商业公司呗 这块Z是非常大方的 打个比方来说 YY和RX都是集成方案供应商 我去找个了一个类似于奥特曼 皮卡丘的IP厂商 我们一起做一个集成方案(这个方案可能是便宜的50~60ASP的 也有可能高端的比如5G的 150~160ASP的 甚至海外高通芯片那种几百块甚至上千的 都有可能)
我以50~60ASP为例 Z就收取那个32块钱 最终这个皮卡丘玩具 我就放在电商平台卖499 599好了 多出来的利润扣除这些成本 100多块钱 多出来399 499就是端侧集成厂商和IP自己谈分成(比如ip方50% 端侧方案上YY和RJ也是50%-这只是举个例子 实际都要看厂商怎么配合)
第三种 就是B端或者IP方直接找到了Z 一般这是通过千C进行的 大部分情况和第二种相似 但是Z因为是通过千C导流给Z的 所以会收取一个营销费用 大概是40~60块钱 然后还是把这些B端或者IP厂商介绍给自己比较核心的端侧集成厂商做方案 也愿意让利给端侧集成厂商
所以我看好端侧集成厂商 四小龙 他们如果努力好好看 赚的利润远不止模组那些东西
而且现在玩具之所以asp比较低 主要是Z还是以试试看的态度去推广 认为第一批玩具产品 用户粘性大概也就是3~4个月左右 不想做太高端的产品和完整的模型去蒸馏 这成本太高 基本就是亏本买卖
所以现在的端侧玩具预期就是 如果这波玩具产品的真的引爆了市场 加之Z的自己的语音模型的进化大超预期
之后完全是可能出更高ASP的IP产品 或者卖几千块钱 甚至上万块钱的IP玩具的 甚至搞不好就搞出一个自由IP 但是非常像小天C手表那种小孩子爆品的存在
大家估计也看到了volot了 这破玩意一句话都不会说 都卖个5 6WRMB…..竟然还供不应求 所以千万不要小看情感陪伴和小孩子玩具的市场 预期空间是非常大的
据我个人不负责意淫预计 差不多3月份 可能是春季大会就会公布这个玩具产品和后续ip和产品阵列 之后4 5月可能公布眼镜产品 6月份会发布手机的发布会(产品会更晚一点)6月份主要是卡hw和苹G的发布会
最后补充一下 我看到身边的朋友有在玩DY的小火人
这个也是新功能 相当于线上的AI电子宠物 我看到我好多朋友都在养这个玩意(尤其大多数还是漂亮妹妹)
如果这个东西以后结合端侧落地是不是空间会更大呢?
所以还是看好四块内容 我写过无数遍了
还是全面看好国产Z链在春节全面爆发
主要四大块(还是要找应用炒对标 我是真的看不懂 算了 千万别问我)
1 算力算力算力!!!
2 租赁算力+AIDC
3 端侧兄弟.yytx.lxkj.rxkj.ght