近日,佳都科技(600728)凭借着领先的视觉深度学习技术,在计算机视觉识别领域的顶级赛事WebVision竞赛中位列前五,跻身国际第一阵营。
据了解,WebVision竞赛是2017年成立的新的大规模图像识别任务权威挑战赛事,由CVPR(IEEE Conference on Computer Vision and Pattern Recognition的缩写,即IEEE国际计算机视觉与模式识别会议)组织、Google协办。Webvision 2019数据集包括5000类,1600万张图片,数据量庞大,训练识别难度大幅增加。今年共吸引到全球154只参赛队伍参赛,涵盖众多顶尖科技公司和知名高校,佳都科技以77.92的优异成绩入选前五,仅次于阿里、商汤、华为、百度。
图片来源:WebVision 官网
人工智能“世界杯”,WebVision逐步接棒
人工智能由“深度学习”技术所驱动,尽管目前看来,深度学习技术表现非常出色,但其需要大量的标注数据来支持。多年来,ImageNet数据集已被视为评估大规模计算机视觉算法的基准,ImageNet的数据集是人工标注和平衡的干净数据,但其花费的人力成本是巨大的:通过近五万人,耗时两年多时间,标注数百万张图片数据。
而WebVision用于计算机的训练数据都是从互联网通过以词搜图的搜索引擎爬取,并未经过人工标注或筛选,数据包含大量噪声——图片与其标签或类别不符的“脏”数据,且不同类别之间的数据量差异之大可达三十倍。这极大增加了使用深度学习算法训练模型的难度,对深度学习算法的提升有更大的帮助,却更加贴近于实际应用。商业、金融、医疗等领域拥有海量但缺乏专业人士标注或标注不统一的数据,对人工智能技术的落地尤为关键。
“非人工标注”数据的获取成本要低很多,可是对深度学习算法的要求却非常高,传统的“有监督”学习已经不适用,而半监督学习(Semi-Supervised Learning)则成为主流。ImageNet的既定数据库已经很难使深度学习算法获得突破性进展,因此,人工智能“世界杯”ImageNet挑战赛退役,由WebVision接棒。图像识别比赛不再停留在处理“实验室”干净样本数据中,而是开始挑战极度不平衡且有噪声的互联网图像识别,真正走向实际应用场景。
本次竞赛,佳都科技采用类半监督学习方式,利用噪声数据直接训练粗模型,基于粗模型对训练数据分配权重,再利用加权的数据训练精模型,逐步引入噪声提升模型的泛化性。训练模型采用数据融合、标签平滑、零gamma初始化、混合训练等策略提升训练精度,并且,采用残差网络及其变种作为基线网络。
具有佳都特色的“自主研发+协同创新”的研发体系,正在发挥威力
佳都科技是专业的人工智能企业,专注于计算机视觉领域,人脸识别静态识别率高达99.9%。实际商业应用才是图像识别技术商业化落地的关键,佳都科技人脸识别技术已形成一系列产品和解决方案,落地于轨道交通、公共安全、城市交通、A.I.创新应用多个航道,实现A.I.与主赛道业务的深度融合。
一直以来,佳都科技坚持“技术立身”的发展理念,聚焦计算机视觉、智能大数据等人工智能细分技术领域。目前,公司已经建立多个高水平的智能化技术研发机构,包括全球智能技术研究院、国家级企业技术中心以及多个省、市级技术中心,联合建设了物联网芯片与系统应用技术国家地方联合工程实验室、城市轨道交通系统安全与运维保障国家工程实验室等,并引进新加坡国家工程院院士李德纮等国际领军人才以及多名计算机视觉、智能大数据方面的技术专家。与此同时,公司在强化自主研发的基础上,灵活通过参控股和合作的方式进行研发,建立具有佳都特色的“自主研发+协同创新”的研发体系。近年来,公司陆续参股云从科技、千视通科技、佳都数据、睿帆科技等一批人工智能技术企业,并与中国科学院、清华大学、中山大学、西南交通大学、华南理工大学等知名院校建立专项技术研发合作,逐步形成技术生态圈。
2018年,佳都科技获得国家企业技术中心认定
佳都科技视觉深度学习技术在WebVision竞赛中获得前五,意味着公司在计算机视觉领域将实现新的突破,为视觉技术的提升以及智能交通、智慧城市等领域的深度应用打下扎实技术基础。未来,佳都科技将持续在人工智能科学技术研究领域加大投入,不断推进深度学习的技术突破和商业应用。