


计算机视觉作为人工智能的一项基础技术应用,应用场景多样,市场潜力巨大。计算机视觉与传感器密切相关。只有通过传感器对环境信息的采集,才能实现数据的存储、处理以及后续的推理判断和执行。近日,意法半导体(ST)召开了在线媒体交流会。与会嘉宾在介绍人工智能时代传感器的技术发展和市场应用时指出,计算机视觉将加速全局快门传感器的应用。
计算机视觉在四种场景中的应用
计算机视觉是人工智能领域的一个重要分支。提取有意义的信息、处理该数据并采取行动。目前,计算机视觉在生产生活中有很多实际应用。例如,智能手机中的面部识别技术已广泛应用于屏幕解锁和电子支付。
据意法半导体亚太区影像事业部技术营销经理林国志介绍楼宇自控传感器,计算机视觉的应用场景大致可以分为四类:第一类是深度传感,主要用于人脸识别、3D扫描等场景。这类应用场景大致使用两个全局快门传感器构建一套双目相机系统,或者使用一个全局快门传感器构建一个结构光相机系统。
第二个是生物识别技术,主要是采集人体各个部位的信息,用于身份识别。除了人脸识别,还包括手势检测、指纹识别、虹膜识别。
再次,增强现实、虚拟现实和混合现实应用场景,包括 6DoF(六自由度跟踪)和 SLAM(同时定位和地图构建)。 6DoF主要针对头部的行为。当用户佩戴VR头显设备时,将获得6D感知能力。当用户需要掌握自己房间的情况时,可以通过SLAM发挥作用。此外,可以使用 VR/AR 设备执行生物特征识别,例如手势检测或手势跟踪。在这种情况下,设备可以通过用户的手势识别行为的目的。比如用户在演讲时,可以通过手势自动翻到下一页或者返回首页,或者通过手势实现鼠标点击和双击。
最后一类应用场景是机器人和工业控制,比如无人机和扫地机器人。为了避免在使用过程中相互碰撞,这些设备需要具备物体检测和场景分析能力。在这些应用场景中,传感器可以发挥关键作用。
全局快门和卷帘快门各有优势
由于计算机视觉的应用场景与通用相机不同,它不关注静止图像的捕捉和色彩渲染,所以智能手机设备中日常使用的卷帘快门传感器比如监控摄像头不适合。据林国志介绍,从拍摄角度来看,图像传感器可分为全局快门和滚动快门两种。
人们日常接触的大多数摄像头都使用卷帘快门传感器,例如智能手机的主摄像头和自拍摄像头、安装在建筑物中的监控摄像头以及使用卷帘快门技术的数码相机。因为这些应用场景都需要采集彩色图像,所以需要相当高的分辨率。卷帘快门专为捕捉静态图像和视频拍摄而设计,需要非常高的分辨率和色彩处理能力。
问题是计算机视觉中的卷帘快门传感器逐行捕获图像,而整个图像只有一帧。如果被摄体是车辆等快速移动的物体,则图像可能会失真,无法显示被摄体的原始形态,导致机器无法判断不同图像中的车辆是否为同一车辆,并且因此不能用于计算机视觉处理。
全局快门的原理不同。它的拍摄时间很短。只要被摄体不是快速移动的物体,成像效果就非常准确,因此更适合计算机视觉。随着计算机视觉在人工智能领域的快速普及,也将推动全局快门传感器的发展。
意法半导体亚太区影像事业部技术市场高级经理张成义表示,目前全球快门传感器在消费电子和汽车领域的应用非常强劲。消费类电子产品中最典型的应用是人脸识别,已应用于智能门锁、门禁、电子支付等领域。汽车领域的主要应用场景是驾驶员监控和乘客监控。此外,全局快门传感器在机器人、地图绘制、AR/VR 等领域的发展势头强劲。
在谈及全局快门是否会完全取代卷帘快门传感器时,张成义认为两者各有优势。滚动快门在拍摄静态照片或视频时,像素更小,分辨率更高,在手机主摄像头等设备中更具优势,但在计算机视觉等运动图像识别方面,全局快门更具优势。卷帘快门的点尺寸约为 1.1 微米或更小,而全局快门通常在 2.2 微米以上。仅就网点大小而言,两者代表不同的应用领域。基于此也可以看出,全局快门传感器的技术发展趋势是不断缩小像素尺寸,不断增加绘图点数,优化功耗。
目前,意法半导体已推出两款产品,分别是40万像素和150万像素的全球快门图像传感器,分别用于消费和工业用途。这些产品在940nm处具有最高的量子效率,拍摄性能强劲;方形传感器的分辨率与镜头优化匹配,适用于旋转拍摄场景;拍摄时间极短,降低系统功耗,在降低系统功耗的同时保证准确成像。
作者丨陈炳新
编辑丨连晓东
美国编辑丨玛丽亚