AI眼镜进入视觉感知升级期，思特威SC1220IOT瞄准1200万像素CIS

发布时间：2026-06-03 16:07 浏览量：62

2026年6月3日上午，第十六届松山湖中国IC创新高峰论坛在东莞市松山湖凯悦酒店举行。在“中国创芯”主题推介环节，思特威（上海）电子科技股份有限公司高级销售总监宗翔带来了《SC1220IOT：面向AI眼镜的1200万像素CMOS图像传感器》的主题演讲，重点介绍了思特威面向AI眼镜应用推出的第二代图像传感器产品SC1220IOT。

如果说AI眼镜的第一入口是语音，第二入口是显示，那么真正让AI眼镜具备“感知世界”能力的，是图像传感器。

在没有摄像头的AI眼镜中，AI更多停留在语音助手、音频交互和信息查询层面；而一旦加入摄像头，眼镜就具备了第一视角记录、识物、翻译、拍摄、场景理解和空间感知的基础能力。换言之，CIS不再只是传统意义上的成像器件，而正在成为AI眼镜连接现实世界的视觉入口。

这也是思特威此次推出SC1220IOT的产业背景。宗翔在演讲中表示，思特威从AI眼镜刚开始出现时就已在相关方向布局，目前已经形成完整产品阵列。SC1220IOT是思特威针对AI眼镜专门推出的第二代产品，定位于面向AI眼镜摄像头应用的1200万像素CMOS图像传感器。

从市场端看，AI眼镜正在从概念验证走向规模化落地。根据思特威演讲资料，2026年全球AI眼镜预计出货量为2000万台，市场总规模达到56亿美元，五年复合增长率为47%。中国市场的增长更为明显，2025年实际出货量为246万台，同比增长87.1%，2026年预期出货量达到491.5万台。

宗翔认为，全球市场整体数量较大，但增长逐渐放缓；国内市场当前基数仍小，但增长率和市场预期更高，这为国产芯片公司提供了机会。尤其在国内市场，AI眼镜新品形态迭代更快，从音频、拍摄到AI/AR融合，不同厂商正在围绕消费、办公、翻译、运动、教育和行业场景进行密集探索。

从产品形态看，AI眼镜正在分为带屏幕和不带屏幕两类。不带屏幕的AI眼镜更接近纯语音AI交互终端，强调音频内容、语音助手和无线连接；带屏幕的AI眼镜则在语音和视觉交互基础上加入轻量化信息显示，具备多模态AI助理属性。无论哪种形态，只要涉及第一视角拍摄、识别、翻译、环境理解和空间感知，都离不开CIS。

思特威在资料中指出，2026年第一季度，中国AI智能眼镜销量为19万台，同比增长超过300%，销量主要来自Rokid、阿里千问、理想Livis、小米以及影目等品牌，其中AI拍摄以及AI/AR类眼镜占据大部分份额。海外市场方面，2026年第一季度AI智能眼镜销量为202万台，同比增长超过130%，增长主要来自Meta眼镜以及华强北白牌产品，Even、Rokid等国内品牌出海也贡献了部分销量。

这些数据说明，AI眼镜的摄像头能力正在成为产品分化的重要维度。过去，眼镜摄像头更多被理解为拍照和录像工具；但在AI眼镜中，它的意义已经扩展到持续感知、语义理解、环境识别和人机交互。对CIS厂商来说，这意味着产品不能只沿用手机或安防传感器思路，而必须围绕可穿戴场景重新定义。

宗翔在演讲中对AI眼镜CIS规格演进做了判断。短期来看，2024年至2026年，AI眼镜主流配置仍是一颗RGB摄像头，像素规格以1200万像素为主；中期到2027年至2029年，可能演进为1至2颗RGB摄像头，像素规格提升至1200万至3200万像素，并可能引入一颗近红外摄像头或6DoF传感器增强空间感知；长期到2030年以后，规格可能进一步提升至1至2颗3200万至5000万像素RGB摄像头，并配合6DoF、眼球追踪和iToF等能力。

这一趋势背后，是AI眼镜应用边界的不断扩大。当前AI眼镜主要承担拍摄、翻译、识物、会议记录等任务；未来如果进入支付、眼球追踪、空间定位、场景建模和更复杂的人机交互，对内侧近红外摄像头、虹膜识别、6DoF传感器和更多视觉输入的需求会逐渐增强。

宗翔还提到，眼镜支付可能成为未来值得关注的场景。如果眼镜真正走进千家万户，成为类似手机一样的必备设备，那么虹膜识别和眼球追踪可能成为重要的身份识别与交互方式。这也意味着，AI眼镜的CIS将不仅面向外部世界成像，也可能面向用户自身进行身份识别、健康感知和交互判断。

从技术方向看，思特威将AI眼镜CIS发展趋势总结为五个方面：全局快门技术、低功耗和小型化、边缘AI集成、HDR和低光对焦性能，以及基于场景的定制。

全局快门技术主要解决动态交互中的运动模糊和畸变问题。在XR/AI眼镜场景中，用户头部旋转、手势操作、身体移动都可能导致图像模糊。如果虚拟内容需要与真实世界准确叠加，图像传感器就必须具备更快读出速度和更稳定的动态成像能力。

低功耗和小型化则是AI眼镜产品化的底层要求。眼镜整机空间极小，电池容量有限，摄像头又可能承担常开或高频唤醒任务。如果CIS功耗过高，不仅会缩短续航，还会增加发热和结构设计压力。因此，Stacked BSI、低功耗电路设计和更小封装，成为AI眼镜CIS的重要方向。

边缘AI集成意味着CIS正在从“被动成像”向“主动感知和决策”过渡。通过内置ISP、预处理能力甚至NPU，图像传感器可以在前端完成部分图像优化、场景识别或数据筛选，从而减少主控负担，提升系统响应速度。对AI眼镜而言，这种预成像计算架构有助于快速响应用户意图、物体识别和场景识别。

HDR、低光和对焦性能，则决定AI眼镜能否在复杂光照环境下稳定工作。AI眼镜不像手机拍照那样由用户主动构图，而更多是在走路、通勤、室内外切换、强光逆光和夜间场景中持续捕捉信息。CIS必须在明暗区域保留足够细节，避免过曝、欠曝和纹理丢失，同时为AI算法提供稳定高质量的原始数据。

最后是基于场景的定制。宗翔认为，AI眼镜不仅面向C端消费场景，也会进入医疗、教育、工业、商业等2B应用。因此，CIS不仅是一个成像设备，也可以成为特定场景解决方案的核心感知入口。不同场景对功耗、分辨率、帧率、动态范围、封装和算法接口的需求并不相同，这要求CIS厂商具备更强的产品定义能力和快速迭代能力。

在这一背景下，SC1220IOT的定位更加清晰。根据思特威介绍，SC1220IOT是一颗SmartClarity-XL Stacked BSI图像传感器，面向AI眼镜摄像头应用，规格为1200万像素，支持4000×3000@60fps，尺寸为1/3.57英寸，像素尺寸为1.0微米，采用MIPI接口。

这颗产品的核心优势包括五点：低功耗常开模式Always-On，最低功耗可达1mW；超小封装尺寸；高帧率视频，支持最高12MP@60fps；高动态范围，支持ColGain HDR；低噪声，读取噪声低至0.8e⁻。

与第一代产品相比，SC1220IOT将帧率提升到60fps。宗翔表示，AI眼镜既需要低功耗，也会在部分场景中提出更高性能要求，因此思特威把芯片性能上限进一步拉高。对于AI拍摄和AI/AR类眼镜来说，更高帧率不仅意味着更流畅的视频，也有助于动态识别、运动场景捕捉和后续算法处理。

低功耗常开模式是SC1220IOT最重要的能力之一。AI眼镜与手机拍照不同，它不一定等用户打开相机后才工作，而可能需要在低功耗状态下保持环境感知、唤醒、识别或快速拍摄能力。如果CIS可以在Always-On模式下实现低至1mW的功耗，就可以在不显著牺牲续航的情况下，支持更自然的随身感知体验。

高动态范围同样关键。SC1220IOT采用ColGain HDR单帧方案，强调原生硬件级单帧合成。相较依赖多帧合成HDR的方案，单帧HDR不需要复杂的多帧对齐与合成，运算功耗更低，也可以从物理上减少运动伪影。在用户行走、头部转动或快速切换光照环境时，这种能力有助于提供更清晰、流畅的视觉感知体验。

暗光性能则来自SFCPixel-2技术。根据思特威资料，该技术强调高感光与低噪声结合，在弱光环境下信噪比表现更优。这对于AI眼镜非常重要，因为用户不会只在理想光照下使用眼镜。室内、夜间、背光、阴影、商场、地铁、街道等复杂场景，都要求CIS在低光条件下仍能提供高质量图像，否则会影响识别、翻译和场景理解的准确性。

小封装也是SC1220IOT面向AI眼镜的关键设计。根据PPT信息，其封装尺寸约为5.48mm×3.97mm。与常规影像传感器尺寸相比，小型化封装可以降低光学模组和整机结构设计难度，更适配AI眼镜对轻量化和无感佩戴的要求，也为电池、主控、音频、Wi-Fi和其他传感器释放更多内部空间。

思特威还在资料中将SC1220IOT与索尼IMX681进行对比。SC1220IOT强调低功耗常开、55nm Stacked BSI先进堆叠式像素架构、超微型化封装、ColGain HDR单帧方案和SFCPixel-2低噪声暗光能力；IMX681则以全局快门技术和传统工业级成像方案为主要特点。思特威认为，SC1220IOT更契合AI眼镜“常开”、轻量化、低功耗和动态场景感知需求。

需要注意的是，这并不意味着AI眼镜只需要一种CIS路线。不同产品形态对CIS的要求不同。运动拍摄眼镜可能追求更高像素和更强视频性能；轻量化AI眼镜可能更重视低功耗和小尺寸；AR/VR设备可能需要全局快门、近红外和多摄像头协同；工业和医疗场景则可能更强调可靠性和特定光谱能力。思特威的策略，是围绕不同应用建立更细分的产品组合，而不是用一颗传感器覆盖所有需求。

从公司基础看，思特威成立于2011年，是一家专注于CMOS图像传感器芯片研发、设计和销售的科创板上市公司，股票代码688213。公司总部位于上海，在多个城市及国家设有研发中心，员工总数超过1500人，授权专利数量超过550项。其产品已经覆盖安防监控、机器视觉、智能车载电子、智能手机、笔记本电脑、平板、工业自动化、智能家居、无人机、人形与服务机器人、AI眼镜/AR/VR、医疗影像等多个场景。

在市场表现方面，思特威已经从传统安防CIS拓展到手机和车载等更大市场。根据PPT中引用的TSR数据，2024年，思特威以46.9%的市场份额蝉联全球安防CIS市场第一，出货量同比增长16%；在全球手机CIS市场排名第5，出货量同比增长103%；在全球车载CIS市场排名第4，出货量同比增长71%。

这种多场景布局，对思特威切入AI眼镜具有现实意义。AI眼镜并不是单一消费电子场景，它融合了安防的低照度与长期运行需求、手机的成像质量需求、车载与机器视觉的动态识别需求，以及IoT设备的低功耗和小型化需求。思特威过去在多个细分市场积累的成像技术，正在被重新组合到AI眼镜这一新终端形态中。

从产品矩阵看，思特威拥有传统系列、高阶成像与物联网系列、全性能升级系列、星光级夜视系列、智能手机系列、笔记本电脑与平板系列、车规级车载系列、全局快门与工业线阵系列、医疗系列等定向应用产品组合。宗翔提到，思特威对市场响应较快，每年会推出约40颗芯片，强调围绕不同场景快速迭代。

对于AI眼镜产业而言，SC1220IOT的意义并不只是提供一颗1200万像素摄像头芯片，而是说明CIS正在从通用拍摄器件变成可穿戴AI终端的场景化感知芯片。它必须在低功耗、常开、帧率、动态范围、低噪声、小尺寸和算法适配之间找到平衡。

AI眼镜如果只强调“拍得清”，很容易被手机和运动相机替代；如果能够在低功耗状态下持续感知、快速唤醒、准确识别、适应复杂光线，并与端侧AI和云端模型形成闭环，才有机会成为真正不同于手机的新型入口。CIS在其中承担的，正是让AI眼镜“看见世界”的基础能力。

随着AI眼镜进入规模化落地窗口，芯片竞争将从单一主控扩散到完整感知链路。主控芯片决定算力，音频芯片决定交互，显示芯片决定信息呈现，Wi-Fi芯片决定连接，而CIS决定视觉输入质量。没有高质量视觉输入，后端AI再强，也很难完成准确识别和自然交互。

因此，思特威SC1220IOT的推出，代表了国产CIS厂商对AI眼镜赛道的一次主动定义：不是把现有手机或安防传感器简单移植到眼镜上，而是围绕AI眼镜“轻量佩戴、低功耗常开、全天候感知和复杂场景识别”的需求重新设计产品。

AI眼镜下一阶段的竞争，可能不再只是“有没有摄像头”，而是摄像头能否真正服务于AI。对于思特威来说，SC1220IOT瞄准的正是这个变化：让AI眼镜不仅能拍照，更能在各种光线和动态环境中持续获得高质量视觉数据，从而支撑识别、翻译、记录、交互和未来更复杂的空间感知应用。

换句话说，AI眼镜能否成为下一代随身智能终端，不只取决于大模型能否回答问题，也取决于它能否稳定、清晰、低功耗地“看见”用户眼前的世界。SC1220IOT的价值，正是在这个视觉入口上，给出了国产CMOS图像传感器的一种工程化答案。

标签：眼镜 cis 视觉低功耗 sc1220iot

AI眼镜进入视觉感知升级期，思特威SC1220IOT瞄准1200万像素CIS

相似文章

资讯分类

热门资讯

热门标签

热门产品