今年已经是TWS耳机出现的第十个年头,从最初普通的无线耳机,到骨传导、开放式形态的创新,再到AI技术加持的翻译耳机。如今更硬核的来了,在耳机上增加摄像头,为其赋予从未有的拍照或视觉感知功能。

图片来自网络,非商业用途
耳机带摄像头有必要吗?截至目前至少9家公司爆出在造带摄像头的耳机,苹果、谷歌、OpenAI、Meta巨头集体入局。最近光帆科技发布号称「全球首款搭载摄像头的AI耳机」,再次把热度推向新高峰。这种新形态的耳机,正在市场上掀起一场热议风暴。
TWS耳机的持续演进
TWS耳机演进的这十年,大致划分为普通TWS耳机、AI耳机、带摄像头耳机。

TWS耳机浪潮最初开始于2016年,当时有线耳机已盛行近百年,为了摆脱有线束缚,人们利用BLE低功耗蓝牙和音频编解码技术实现无线音频传输。
手机巨头苹果取消3.5mm耳机孔,并推出第一代无线耳机AirPods,彻底将TWS耳机市场引爆。
2022年底ChatGPT大模型石破天惊地问世,在国内外掀起来一股大模型的浪潮。大模型强大的生成式AI能力,迅速点燃了将其接入耳机硬件终端的竞赛。
2024年华为、字节跳动、科大讯飞等公司接连发布AI耳机。字节跳动推出的首款AI耳机Ola Friend,接入了自己研发的豆包大模型。华为FreeBuds Pro 3内置“小艺”语音助手并接入了盘古大模型。

图片来自网络,非商业用途
后来上海的掌禅科技站在大模型的肩膀上,研发出了NebulaBuds 翻译耳机APP,获多款耳机广泛采用,普通TWS耳机秒变AI翻译耳机。
从普通TWS耳机向AI耳机演进,仍主要依靠语音识别。在形态上耳机向骨传导、开放式方向创新。但在交互方式上,耳机在近些年发展周期里缺乏颠覆性创新。
直到2024年5月,Meta爆出开发配备摄像头的AI耳机,市场上才首次出现语音+视觉双重交互的耳机。普通TWS耳机解决了用户摆脱有线束缚的需求,AI耳机解决了实时翻译、提高音质的需求,它们都已经成功通过了市场的验证,获得消费者的青睐和认可。
9大公司“逐鹿”带摄像头的耳机
我爱音频网整理发现,截至目前已经有9大公司在造带摄像头的AI耳机,其中4家甚至已向市场推出真实可用的产品。
在这之中有三家中国公司,光帆科技、深圳睿宝智能(VibeLens)、牧之音科技(Mozin)较海外大厂率先搞定带摄像头的耳机,展现了中国企业从概念跟进到产品落地的快速。这些公司发布的带摄像头的耳机,在摄像头核心定位、功能、目标场景上有所差异。

光帆科技和牧之音科技(Mozin)在同一天都发布了带摄像头的耳机。其中,光帆Lightwear带摄像头的AI耳机创新性地加入视觉摄像头、GPS定位、多功能指纹模组,并与智能手表联动。
在表格的对比中,我们可以看出摄像头核心定位上,仅光帆科技一家公司将耳机上摄像头用作AI环境感知。发布会上,光帆科技创始人董红光也同样强调,“摄像头只做感知,不做拍照用。”
耳机带摄像头并不是一个全新概念,早在2024年5月Meta就被爆出在开发配备摄像头的AI耳机,想要用于识别物体和翻译外语,命名为「Camera Buds」。

图片来自网络,非商业用途
不过Meta公司的高管担心将隐蔽摄像头集成在耳机上,可能引发像谷歌眼镜当年类似的隐私担忧,仍在反复推敲产品设计和体验,导致产品一直没面世。
苹果传出2026年要推出带摄像头的AirPods,但所走的路径有所不同,它是为了耳机与Vision Pro联动,增强Vision Pro的空间音频体验。

图片来自网络,非商业用途
今年OpenAI也流出一款搭载摄像头的TWS耳机概念设计图,造型像树杈,在耳柄处设计向外凸起的摄像头。这种设计,可以让摄像头跟用户的自然视线接近。

图片来自网络,非商业用途
Google X实验室也正在孵化一款AI蓝牙耳机 Iyo One,它能听能看能翻译,为了装下更大的电池,以圆形设计,比普通带摄像头的耳机体型更大一些。

图片来自网络,非商业用途
三星也在研发带摄像头的耳机,但目前产品效果图还没有流传出来。
字节也集体入局探索带摄像头的耳机,它采用入耳式设计,摄像头的位置在耳塞主体与耳柄的衔接处,没有凸起来,看起来相对更自然。据说字节带摄像头AI耳机,由歌尔股份代工,产品已基本定型了,将亮相罗永浩30号十字路口的“科技春晚”。

图片来自网络,非商业用途
但在这些大厂反复推敲带摄像头的耳机产品设计、体验、环境感知难题的时候,韩国的Wisezone公司率先实现了从概念猜想到产品落地,其推出的ZONE HSS1支持实时翻译、语音记事、手势拍照等功能。

图片来自网络,非商业用途
紧接着深圳睿宝智能(VibeLens)也快速跟进,将带摄像头的耳机实现落地,推出集成摄像机、耳机和录音功能为一体的AI耳机,即MusicCam,引起市场的广泛关注。

图片来自网络,非商业用途
消费者真的需要在耳机上加摄像头?
TWS耳机行业同质化严重,低端机型绝大部分采用公版方案。谷歌任意耳机秒变AI同声传译的方案推出后,实时翻译/转写功能将不再能支撑TWS耳机的差异化。
2025年在耳机上加摄像头,成为各大厂商探索TWS耳机差异化的重要方向。大厂们扎堆造带摄像头的耳机时,一个问题被反复追问:消费者真的需要在耳机上加摄像头吗?
从众筹平台的数据看,市场最先接受那些将摄像头用于拍照、录制视频的TWS耳机。MusicCam这个将摄像机、耳机、录音三合一的耳机,在kickstarter众筹平台上获超过2300名支持者,完成众筹资金高达53万美金,原目标只是5000美金,结果最终的众筹资金超过目标预期100倍。

图片来自网络,非商业用途
以往在潜水、骑行等户外活动或者旅游时,用户想要记录下一些珍贵的画面,都需要掏出手机,手动打开相机,一大通操作才能完成。而MusicCam这类耳机,把摄像头当做拍摄用,它们切实解决用户在户外运动、旅行时解放双手的拍摄需求。
而将摄像头作为视觉感知使用,这一技术路径引起的争议相对较多。光帆科技是第一家将摄像头作为感知,并成功推出真实可用的带摄像头AI耳机的公司。众多投资机构看好这一方向,宁德时代、韶音、歌尔等产业龙头都投了光帆科技,该公司刚创立3个月就完成了两轮累计1.3亿人民币的融资。
光帆Lightwear开创性地将摄像头当做感知使用,实时识别和理解用户周围环境,官方称解决了餐厅推荐、机票预定、车位查找等部分场景问题。但有人鼓掌,也有人吐槽这款产品外观设计粗糙、功能定义混乱、产品体验过于形式。
一产品经理犀利点评道,「谁会拿耳机买东西比价?拿耳机订机票酒店、看餐厅评价?」可见光帆Lightwear在产品体验上仍需要持续打磨,但从技术路径上看,市场是需要摄像头作为视觉感知的。

图片来自网络,非商业用途
耳机在过去很长的一段时间都是依靠语音交互的,那时语音已经能完全满足用户对音乐播放、唤醒语音助手的需求。但在AI时代下,用户的需求转向主动式AI,它们更需要AI主动理解周围的环境,并提前帮用户解决问题。
视觉是人类信息的第一大来源,它占比了约70%~80%的信息处理量,这是听觉的四到六倍。对于用户的一些模糊需求,仅靠语音指令,耳机无法理解上下文与环境背景。当用户说出“这个看起来不错”时,没有视觉感知的耳机只能陷入“一头雾水”的尴尬。而摄像头带来的视觉交互,可以精准执行这种模糊指令。
更重要的是,视觉感知让耳机实现了从“被动响应”到“主动理解”的跨越。比如,在餐厅门口主动推荐菜品、在停车场记录车位信息、在下厨时实时指导操作步骤。这种主动式服务能力,让耳机不再是需要唤醒才工作的“工具”,而是真正帮用户解决工作和生活问题的“个人助理”。
我爱音频网总结
带摄像头的耳机趋势已在市场徐徐展开,Meta、苹果、谷歌、三星、字节跳动、光帆科技、Mozin、VibeLens等九大公司集体入局。在耳机主动式AI未到来之前,市场似乎先认可了将摄像头作为拍摄用的耳机。光帆科技Lightwear耳机,创新性地将摄像头作为感知使用,但产品体验仍需打磨。此外,这种耳机在隐私方面也需要进一步为用户优化。作为消费者,你觉得耳机需要加上摄像头吗?
文中部分图片来自于网络采集,仅作说明使用,非商业用途。








