日前,从主打原创人工智能算法与视频深度学习技术的千视通获悉,其最新的行人再识别跨镜追踪技术(Re-ID)在国家超算中心长沙中心完成了精度测试,测试结果刷新了目前已知的业内最高纪录。
作为一家以Re-ID视频结构化技术和应用为核心的计算机视觉科技公司,千视通团队在Market 1501、DukeMTMC-reID、CUHK03这三个衡量Re-ID技术最通用的数据集测试中,获得了巨大突破。这些数据集中有两项核心指标评判标准:首位命中率(Rank-1 Accuracy)以及平均精度均值(Mean Average Precision,缩写mAP,它反映检索的人在底库中的所有图片排在结果队列前面的程度)。
千视通目前在Market 1501上的首位命中率(Rank-1 Accuracy)已经达到97.1%,超越人眼识别能力(94%),领先头部厂家,并刷新了今年4月公布的96.6%的世界纪录。同时在CUHK03,Duke MTMC-reID两个数据集上也刷新了之前业内最高纪录,达到了行业state of the art的技术水平,特别是在CUHK03数据集上,Rank 1指标提高了10.7%。
Market 1501:由清华大学提供 ,使用了6个摄像头(5高清和1低清),镜头之间有部份重叠,当中有 1501个人的身份,共有32668个标物框/行人图片。
千视通在最新的测试报告中显示,该数据集中首位命中率高达97.1%(篮框代表正确目标,红框代表误报或不清晰目标)。
(千视通Market1501 部分测试结果)
Duke MTMC-reID:格式基本上跟 Market 1501一样,共有1404个人的身份,并 36411个标物框/行人图片。DukeMTMC其实不止有Re-ID用的训练及测试素材,它本来是用于视频之间的(真正)多摄像头多轨迹动态追踪。用来训练或测试 Re-ID,只是它的其中一个功能。千视通在Duke MTMC-reID数据集中测试的mAP结果78.9%,刷新之前榜单第一的78.4%,而Rank1成绩为89.1%,超过之前第一名88.7%。
(千视通Duke MTMC-ReID 部分测试结果)
CUHK03: 是香港中文大学所提供的。它前身有CUHK01 和CUHK02,因为这两个数据库不够作深度学习训练,所以采集了更多数据生成 CUHK03。这个数据库有1360个人的身份,并有 13164张图片,同样由6个摄像头所拍摄。千视通在该数据集中测试的mAP结果为74.8%,远远超过原先排行第一的67.4%数据,而Rank1更是达到78.7%,比之前榜首的68%提升了足足10.7%。
(千视通CUHK03 部分测试结果)
以上数据由国家超级计算长沙中心,以及长沙市公安局刑事侦查支队视频侦查大队测试验证。
自研技术创新,千视通Re-ID算法有效提高可识别率
Re-identification,简称Re-ID,即行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。作为人脸识别技术的重要补充,其发展内核便是在不同视频中,在无法获取清晰人脸特征信息前提下,机器通过穿着、发型、体态等信息将同一个人识别出来,增强数据的时空连接性。可广泛应用于智能视频监控、智能安保等领域。
举个例子,我们所熟悉的哈利·波特作品,在《阿兹卡班囚徒》中想象出一种叫做活点地图 (Marauder’s Map)的魔法道具,展开地图,除了显示基本地图信息外,还能实时观看某个指定人物的行动轨迹。
回到现实世界,我们现在可以在摄像头的部署环境中,通过上传特定人物的照片,同时检测多个不同位置的摄像头数据,精准找出所有摄像头抓拍到的目标人物图像,并生成他/她的行动时空轨迹,达到跨镜追踪的目的。
由于多个摄像头下拍摄行人的角度、光线等条件不同,图像中的行人很难被判断为同一个人。所以就要找到行人上的局部不变的部分,比如:衣服颜色,衣服纹理,手提包,背包等。同时行人兼具刚性和柔性的特性 ,外观易受穿着、尺度、遮挡、姿态和视角等影响,行人再识别是一个既具研究价值同时又极富挑战性的课题,为了提升Re-ID的可识别率,千视通做了多方面的算法优化,致力于加速Re-ID的应用落地。
考虑讯息全面:一般算法只考虑了全局、多粒度及水平汇集讯息,而水平汇集讯息主要用于把图片对齐。在实际的情况下,摄像头的角度多变,同时人行是非刚体,所以,垂直方向也理应同时考虑。对于此种情况,千视通在网络设计上开发了自研的垂直汇集及其关联的算法层,用以更好的适应以上情况。
强化特征空间的可分辨性: 千视通的 ReID 算法,针对损失函数进行改良,并提出了新的方案,能一方面增大类间距离并同时最细化类内距离。这代表能提高所计算出的高维特征向量的唯一性,并能有效的提高可识别率。
千视通卡视联动技战法,Re-ID+人脸识别助力高效办案
提到计算机视觉领域的大规模应用,大家首先想到的是人脸识别,其实Re-ID作为新兴研究方向在最近几年受到的关注程度是非常高的。千视通发现,目前人脸识别技术在安防行业落地较多,的确是发展所向,但在很多实际场景中,人脸识别技术作用并不突出。
受限于视频监控探头的安装高度及密度,在实际运行过程中,它们更多拍到的是行人的头顶、后脑勺或者侧脸。其次,即便拍到人脸,摄像头拍摄的像素可能不高,尤其是远景摄像头里面人脸截出来很可能都没有32x32的像素。所以人脸识别在实际的重识别应用中很可能有限,无法看清。
于是,千视通基于多年实战经验,提出一种卡视联动技战法,结合人脸识别和跨镜追踪(Re-ID)各自的特点及优势,以少量的人脸卡口加大量的普通监控探头的部署,既可锁定嫌疑人身份,又能重现嫌疑人轨迹,这种创新的综合型技战法可以较大概率对监控范围进行覆盖,具有极强的实战价值,对安防行业具有颠覆性意义。
让AI算法落地,不断寻找业务场景
技术发展永远都是一条向上的道路,对于Re-ID技术的精进上,千视通不断投入大量资源进行相关技术研究、攻克。但无论是数据排名如何刷新、赶超世界水准,都绕不开一个最重要的议题:让AI算法落地。作为国内第一家发布视频搜索产品的
计算机视觉科技公司,千视通七年里一直在最前线深耕,在业务场景里发现行业痛点并不断打磨算法和产品,获得了300+客户单位的认可。
千视通相信,AI技术的发展要与场景应用密切结合,用最好的服务去发挥AI算法的价值,推动各行各业迈入更高效的时代去赋能。随着场景愈加丰富与成熟,千视通的技术也在迅速往前超。
由一项技术的突破,衍生到规模化的运作,为一个行业带来更极致的降本增效,人工智能,让城市更加安全、便捷、智慧,是千视通一直秉承的伟大使命!