AI眼镜进入视觉感知升级期,思特威SC1220IOT瞄准1200万像素CIS

发布时间:2026-06-03 16:07  浏览量:3

2026年6月3日上午,第十六届松山湖中国IC创新高峰论坛在东莞市松山湖凯悦酒店举行。在“中国创芯”主题推介环节,思特威(上海)电子科技股份有限公司高级销售总监宗翔带来了《SC1220IOT:面向AI眼镜的1200万像素CMOS图像传感器》的主题演讲,重点介绍了思特威面向AI眼镜应用推出的第二代图像传感器产品SC1220IOT。

如果说AI眼镜的第一入口是语音,第二入口是显示,那么真正让AI眼镜具备“感知世界”能力的,是图像传感器。

在没有摄像头的AI眼镜中,AI更多停留在语音助手、音频交互和信息查询层面;而一旦加入摄像头,眼镜就具备了第一视角记录、识物、翻译、拍摄、场景理解和空间感知的基础能力。换言之,CIS不再只是传统意义上的成像器件,而正在成为AI眼镜连接现实世界的视觉入口。

这也是思特威此次推出SC1220IOT的产业背景。宗翔在演讲中表示,思特威从AI眼镜刚开始出现时就已在相关方向布局,目前已经形成完整产品阵列。SC1220IOT是思特威针对AI眼镜专门推出的第二代产品,定位于面向AI眼镜摄像头应用的1200万像素CMOS图像传感器。

从市场端看,AI眼镜正在从概念验证走向规模化落地。根据思特威演讲资料,2026年全球AI眼镜预计出货量为2000万台,市场总规模达到56亿美元,五年复合增长率为47%。中国市场的增长更为明显,2025年实际出货量为246万台,同比增长87.1%,2026年预期出货量达到491.5万台。

宗翔认为,全球市场整体数量较大,但增长逐渐放缓;国内市场当前基数仍小,但增长率和市场预期更高,这为国产芯片公司提供了机会。尤其在国内市场,AI眼镜新品形态迭代更快,从音频、拍摄到AI/AR融合,不同厂商正在围绕消费、办公、翻译、运动、教育和行业场景进行密集探索。

从产品形态看,AI眼镜正在分为带屏幕和不带屏幕两类。不带屏幕的AI眼镜更接近纯语音AI交互终端,强调音频内容、语音助手和无线连接;带屏幕的AI眼镜则在语音和视觉交互基础上加入轻量化信息显示,具备多模态AI助理属性。无论哪种形态,只要涉及第一视角拍摄、识别、翻译、环境理解和空间感知,都离不开CIS。

思特威在资料中指出,2026年第一季度,中国AI智能眼镜销量为19万台,同比增长超过300%,销量主要来自Rokid、阿里千问、理想Livis、小米以及影目等品牌,其中AI拍摄以及AI/AR类眼镜占据大部分份额。海外市场方面,2026年第一季度AI智能眼镜销量为202万台,同比增长超过130%,增长主要来自Meta眼镜以及华强北白牌产品,Even、Rokid等国内品牌出海也贡献了部分销量。

这些数据说明,AI眼镜的摄像头能力正在成为产品分化的重要维度。过去,眼镜摄像头更多被理解为拍照和录像工具;但在AI眼镜中,它的意义已经扩展到持续感知、语义理解、环境识别和人机交互。对CIS厂商来说,这意味着产品不能只沿用手机或安防传感器思路,而必须围绕可穿戴场景重新定义。

宗翔在演讲中对AI眼镜CIS规格演进做了判断。短期来看,2024年至2026年,AI眼镜主流配置仍是一颗RGB摄像头,像素规格以1200万像素为主;中期到2027年至2029年,可能演进为1至2颗RGB摄像头,像素规格提升至1200万至3200万像素,并可能引入一颗近红外摄像头或6DoF传感器增强空间感知;长期到2030年以后,规格可能进一步提升至1至2颗3200万至5000万像素RGB摄像头,并配合6DoF、眼球追踪和iToF等能力。

这一趋势背后,是AI眼镜应用边界的不断扩大。当前AI眼镜主要承担拍摄、翻译、识物、会议记录等任务;未来如果进入支付、眼球追踪、空间定位、场景建模和更复杂的人机交互,对内侧近红外摄像头、虹膜识别、6DoF传感器和更多视觉输入的需求会逐渐增强。

宗翔还提到,眼镜支付可能成为未来值得关注的场景。如果眼镜真正走进千家万户,成为类似手机一样的必备设备,那么虹膜识别和眼球追踪可能成为重要的身份识别与交互方式。这也意味着,AI眼镜的CIS将不仅面向外部世界成像,也可能面向用户自身进行身份识别、健康感知和交互判断。

从技术方向看,思特威将AI眼镜CIS发展趋势总结为五个方面:全局快门技术、低功耗和小型化、边缘AI集成、HDR和低光对焦性能,以及基于场景的定制。

全局快门技术主要解决动态交互中的运动模糊和畸变问题。在XR/AI眼镜场景中,用户头部旋转、手势操作、身体移动都可能导致图像模糊。如果虚拟内容需要与真实世界准确叠加,图像传感器就必须具备更快读出速度和更稳定的动态成像能力。

低功耗和小型化则是AI眼镜产品化的底层要求。眼镜整机空间极小,电池容量有限,摄像头又可能承担常开或高频唤醒任务。如果CIS功耗过高,不仅会缩短续航,还会增加发热和结构设计压力。因此,Stacked BSI、低功耗电路设计和更小封装,成为AI眼镜CIS的重要方向。

边缘AI集成意味着CIS正在从“被动成像”向“主动感知和决策”过渡。通过内置ISP、预处理能力甚至NPU,图像传感器可以在前端完成部分图像优化、场景识别或数据筛选,从而减少主控负担,提升系统响应速度。对AI眼镜而言,这种预成像计算架构有助于快速响应用户意图、物体识别和场景识别。

HDR、低光和对焦性能,则决定AI眼镜能否在复杂光照环境下稳定工作。AI眼镜不像手机拍照那样由用户主动构图,而更多是在走路、通勤、室内外切换、强光逆光和夜间场景中持续捕捉信息。CIS必须在明暗区域保留足够细节,避免过曝、欠曝和纹理丢失,同时为AI算法提供稳定高质量的原始数据。

最后是基于场景的定制。宗翔认为,AI眼镜不仅面向C端消费场景,也会进入医疗、教育、工业、商业等2B应用。因此,CIS不仅是一个成像设备,也可以成为特定场景解决方案的核心感知入口。不同场景对功耗、分辨率、帧率、动态范围、封装和算法接口的需求并不相同,这要求CIS厂商具备更强的产品定义能力和快速迭代能力。

在这一背景下,SC1220IOT的定位更加清晰。根据思特威介绍,SC1220IOT是一颗SmartClarity-XL Stacked BSI图像传感器,面向AI眼镜摄像头应用,规格为1200万像素,支持4000×3000@60fps,尺寸为1/3.57英寸,像素尺寸为1.0微米,采用MIPI接口。

这颗产品的核心优势包括五点:低功耗常开模式Always-On,最低功耗可达1mW;超小封装尺寸;高帧率视频,支持最高12MP@60fps;高动态范围,支持ColGain HDR;低噪声,读取噪声低至0.8e⁻。

与第一代产品相比,SC1220IOT将帧率提升到60fps。宗翔表示,AI眼镜既需要低功耗,也会在部分场景中提出更高性能要求,因此思特威把芯片性能上限进一步拉高。对于AI拍摄和AI/AR类眼镜来说,更高帧率不仅意味着更流畅的视频,也有助于动态识别、运动场景捕捉和后续算法处理。

低功耗常开模式是SC1220IOT最重要的能力之一。AI眼镜与手机拍照不同,它不一定等用户打开相机后才工作,而可能需要在低功耗状态下保持环境感知、唤醒、识别或快速拍摄能力。如果CIS可以在Always-On模式下实现低至1mW的功耗,就可以在不显著牺牲续航的情况下,支持更自然的随身感知体验。

高动态范围同样关键。SC1220IOT采用ColGain HDR单帧方案,强调原生硬件级单帧合成。相较依赖多帧合成HDR的方案,单帧HDR不需要复杂的多帧对齐与合成,运算功耗更低,也可以从物理上减少运动伪影。在用户行走、头部转动或快速切换光照环境时,这种能力有助于提供更清晰、流畅的视觉感知体验。

暗光性能则来自SFCPixel-2技术。根据思特威资料,该技术强调高感光与低噪声结合,在弱光环境下信噪比表现更优。这对于AI眼镜非常重要,因为用户不会只在理想光照下使用眼镜。室内、夜间、背光、阴影、商场、地铁、街道等复杂场景,都要求CIS在低光条件下仍能提供高质量图像,否则会影响识别、翻译和场景理解的准确性。

小封装也是SC1220IOT面向AI眼镜的关键设计。根据PPT信息,其封装尺寸约为5.48mm×3.97mm。与常规影像传感器尺寸相比,小型化封装可以降低光学模组和整机结构设计难度,更适配AI眼镜对轻量化和无感佩戴的要求,也为电池、主控、音频、Wi-Fi和其他传感器释放更多内部空间。

思特威还在资料中将SC1220IOT与索尼IMX681进行对比。SC1220IOT强调低功耗常开、55nm Stacked BSI先进堆叠式像素架构、超微型化封装、ColGain HDR单帧方案和SFCPixel-2低噪声暗光能力;IMX681则以全局快门技术和传统工业级成像方案为主要特点。思特威认为,SC1220IOT更契合AI眼镜“常开”、轻量化、低功耗和动态场景感知需求。

需要注意的是,这并不意味着AI眼镜只需要一种CIS路线。不同产品形态对CIS的要求不同。运动拍摄眼镜可能追求更高像素和更强视频性能;轻量化AI眼镜可能更重视低功耗和小尺寸;AR/VR设备可能需要全局快门、近红外和多摄像头协同;工业和医疗场景则可能更强调可靠性和特定光谱能力。思特威的策略,是围绕不同应用建立更细分的产品组合,而不是用一颗传感器覆盖所有需求。

从公司基础看,思特威成立于2011年,是一家专注于CMOS图像传感器芯片研发、设计和销售的科创板上市公司,股票代码688213。公司总部位于上海,在多个城市及国家设有研发中心,员工总数超过1500人,授权专利数量超过550项。其产品已经覆盖安防监控、机器视觉、智能车载电子、智能手机、笔记本电脑、平板、工业自动化、智能家居、无人机、人形与服务机器人、AI眼镜/AR/VR、医疗影像等多个场景。

在市场表现方面,思特威已经从传统安防CIS拓展到手机和车载等更大市场。根据PPT中引用的TSR数据,2024年,思特威以46.9%的市场份额蝉联全球安防CIS市场第一,出货量同比增长16%;在全球手机CIS市场排名第5,出货量同比增长103%;在全球车载CIS市场排名第4,出货量同比增长71%。

这种多场景布局,对思特威切入AI眼镜具有现实意义。AI眼镜并不是单一消费电子场景,它融合了安防的低照度与长期运行需求、手机的成像质量需求、车载与机器视觉的动态识别需求,以及IoT设备的低功耗和小型化需求。思特威过去在多个细分市场积累的成像技术,正在被重新组合到AI眼镜这一新终端形态中。

从产品矩阵看,思特威拥有传统系列、高阶成像与物联网系列、全性能升级系列、星光级夜视系列、智能手机系列、笔记本电脑与平板系列、车规级车载系列、全局快门与工业线阵系列、医疗系列等定向应用产品组合。宗翔提到,思特威对市场响应较快,每年会推出约40颗芯片,强调围绕不同场景快速迭代。

对于AI眼镜产业而言,SC1220IOT的意义并不只是提供一颗1200万像素摄像头芯片,而是说明CIS正在从通用拍摄器件变成可穿戴AI终端的场景化感知芯片。它必须在低功耗、常开、帧率、动态范围、低噪声、小尺寸和算法适配之间找到平衡。

AI眼镜如果只强调“拍得清”,很容易被手机和运动相机替代;如果能够在低功耗状态下持续感知、快速唤醒、准确识别、适应复杂光线,并与端侧AI和云端模型形成闭环,才有机会成为真正不同于手机的新型入口。CIS在其中承担的,正是让AI眼镜“看见世界”的基础能力。

随着AI眼镜进入规模化落地窗口,芯片竞争将从单一主控扩散到完整感知链路。主控芯片决定算力,音频芯片决定交互,显示芯片决定信息呈现,Wi-Fi芯片决定连接,而CIS决定视觉输入质量。没有高质量视觉输入,后端AI再强,也很难完成准确识别和自然交互。

因此,思特威SC1220IOT的推出,代表了国产CIS厂商对AI眼镜赛道的一次主动定义:不是把现有手机或安防传感器简单移植到眼镜上,而是围绕AI眼镜“轻量佩戴、低功耗常开、全天候感知和复杂场景识别”的需求重新设计产品。

AI眼镜下一阶段的竞争,可能不再只是“有没有摄像头”,而是摄像头能否真正服务于AI。对于思特威来说,SC1220IOT瞄准的正是这个变化:让AI眼镜不仅能拍照,更能在各种光线和动态环境中持续获得高质量视觉数据,从而支撑识别、翻译、记录、交互和未来更复杂的空间感知应用。

换句话说,AI眼镜能否成为下一代随身智能终端,不只取决于大模型能否回答问题,也取决于它能否稳定、清晰、低功耗地“看见”用户眼前的世界。SC1220IOT的价值,正是在这个视觉入口上,给出了国产CMOS图像传感器的一种工程化答案。