计算机视觉是人工智能在中国落地最顺利的技术。和语音相比,计算机视觉是一条更有技术深度,更多应用场景的好赛道。
从目前的落地进展来看,移动互联网/安防领跑,零售/物流跟进,医疗/无人驾驶的商业化有待成熟。
以商汤、旷视、依图为代表的AI头部企业战略出现向平台企业或软硬一体化企业发展的分化趋势,深兰、扩博等新计算机视觉公司也在机器人、零售等新领域快速崛起。
计算机视觉是变现最顺利的人工智能技术
计算机视觉是中国AI市场的最大组成部分。根据中国信通院2018年2月发布的报告数据,2017年,中国人工智能市场中计算机视觉占比37%,以80亿元的行业收入排名第一。
安防影像分析是目前计算机视觉最大的应用,据艾瑞咨询预测,2017年占比约67.9%。其他主要应用包括广告、互联网等。
从AI领域融资规模来看,根据CBInsight的统计,2016年中国计算机视觉公司融资总额占AI总体24%,远超出美国的7%。
落地速度出现分化,数据可得性,算法成熟度,服务的容错率是主要影响要素
最近几年机器视觉行业实现快速发展的背景是:2015年基于深度学习的计算机视觉算法在ImageNet数据库上的识别准确率首次超过人类,同年Google在开源自己的深度学习算法。
这些带动中美两国的科学家把计算机视觉算法运用到安防、金融、互联网、物流、零售、医疗、制造业等不同垂直行业。
但在实际的运用当中,由于数据可得性,算法成熟度,服务的容错率等因素的影响,落地的速度开始出现分化。移动互联网/安防领跑,零售/物流跟进,医疗/无人驾驶发展较慢。
金融领域:人脸识别在金融领域已出现多种解决方案,伴随识别准确率上升,远程开户已在互联网金融行业得到广泛应用,人脸支付、刷脸取款等开始被各大银行采用。
金融领域的计算机视觉应用面临如下挑战:
1)人脸与身份证信息的人脸比对技术壁垒相对较低,服务容易陷入同质化竞争;
2)无现金趋势影响刷脸取款等服务的普及,银行对更复杂的AI服务仍持较谨慎态度。
零售领域:AI在零售行业的应用不是简单的无人零售,而是需要利用AI技术改造零售流程,实现提高效率降低成本的目的。AI公司除了提供技术以外,可能需要提供包括一系列咨询战略方案在内的整体方案。
医疗领域:医疗数据碎片化严重,各种疾病需要的影像资料不同,数据标注需要有专业医师参与,成本高,进展慢。导致发展低于预期。
无人驾驶:无人驾驶涉及采集摄像头、雷达等多种数据,并根据多重数据进行车辆、物体、道路、行人等不同识别后进行决策。我们认为离实现通用无人驾驶还早,在限定场景下实现商用的机会较大。
技术发展趋势:
提高预测精度,降低数据标注成本随着技术的不断发展,计算机视觉能够识别信息的种类从最初的文字信息,到人脸,人的体态识别,以及各种不同的物体。
能够识别的精度也从最初的人1:1比对,到用于门禁系统等1:N比对,以及用在黑名单监控等场景的M:N动态监控。除了提高算法精度以外,提高数据标注的效率也是计算机视觉公司重要的课题之一。
Google、Microsoft等互联网公司相继推出了自动标注系统AutoML和CognitiveServices。
商汤科技、扩博智能等AI公司也通过运用半监督学习、迁移学习(transferlearning)、主动学习(activeLearning)等技术,提高数据标注的自动化程度,达到提高效率,降低成本的目的。
企业发展战略开始分化,商汤向左,旷视向右计算机视觉技术在中国的快速落地,吸引了以商汤、旷视、依图为代表的以算法为核心竞争力的AI初创公司,拥有强大数据采集及软件开发能力的互联网公司,海康、大华、宇视等深耕安防行业的公司,以及华为、平安等科技行业巨头。经过一年多的发展,各个公司根据自己资源禀赋的不同,企业战略出现了分化。
各类公司初始时在产业环节中各有偏好:初创企业在算法与模型训练上占优;互联网企业则拥有天然的数据优势;安防企业则凭借极强的工程能力加速安防项目落地。后起之秀如深兰则选择细分市场广泛落地。
从行业机会而言:互联网巨头利用自己强大的数据优势和丰富的内部应用场景,提升自身业务场景的增值服务,如阿里巴巴的淘宝拍立淘、腾讯优图在手机QQ与微信的应用、今日头条的短视频甄别等。
AI头部初创企业近年来融资动作频繁,受到资本市场的青睐,在资金方面暂无瓶颈,然而面临互联网巨头的挑战,商汤等初创企业或应依托已有的独立设计算法的能力,构建平台型解决方案,在研发能力与方案落地速度上取胜。
AI头部创业公司布局思路各异:在商汤、旷视、依图等头部企业看,各家战略思路差异明显。商汤致力于构造平台,专注底层基础应用,力图在完善平台后于其他领域快速落地。旷视则在致力于在安防、金融、零售、汽车、教育等广泛领域提供软硬件一体化的解决方案。依图则表现出对安防、医疗两大领域的专注深耕,依托产品化、工程化能力深入落地。
【商汤科技】
https://www.sensetime.com
商汤科技成立于2014年,主要业务是计算机视觉技术以及深度学习算法,是计算机视觉和深度学习领域的算法提供商。2018年9月初,软银中国的10亿美元投资,将商汤估值抬至60亿美元。
图1 商汤科技生态象限
商汤科技的核心团队由两大部分组成,一部分是来自各大名校的博士、硕士等顶尖行业人才,有150多位人工智能深度学习方向的博士,另一部分则是来自微软、谷歌等相关领域的从业者;核心技术上,主攻人脸识别、视频监控识别算法、增强现实、文字识别、自动驾驶识别算法、医疗影像识别算法几项技术;行业方面,专注于安防监控、金融、手机、移动互联网和深度学习芯片五大领域。
在具体的安防落地案例中,与公安系统合作居多。广州市某公安局使用商汤视图情报研判系统,用以图搜图的检索功能进行案发现场人脸截图与标准库照片比对,进行人员的身份查询,打击已发生的犯罪。2017年以来,视频侦查部门成功比中嫌疑人2000多人,抓获800多人,成功破案近百宗。
营收方面,商汤科技已经实现连续3年间业务年化增长超过400%,2017年已实现全面盈利,营收相比2016年增长420%。其目前的营收来源的四个方向:安防、汽车、手机以及新型业务,智能安防的收入占比最大,占整体营收的30%。此外,60%来自于智能汽车、手机移动互联网方面,剩下10%来自于新型业务。新型业务中,包括了遥感、机器人、视频等业务。
【旷视科技】
https://www.megvii.com
旷视科技成立于2011年,是一家专注于图像识别和深度学习的技术与产品研发的公司,以“Face++”被外界熟知。目前已经完成十几亿美元的融资,最新估值已达30亿美元。
图2 旷世科技生态象限
2014年下半年,旷视成立安防事业部,2015年,旷视决定大力进军安防。2016年从互联网金融切入开始场景落地,并逐渐扩大到安防、手机、新零售、机器人、行业物联等行业。
在金融安全领域,旷视科技已经完成了全球数亿人的远程实名制验证,其智能安防系列解决方案已在全国数十个个省市上线并被中国公安部列入重点技术推广目录。早在2015年,旷视科技就发布了一款面向To B市场的智能安防摄像机——MegEyeC1,该系列已经发展到了MegEye-C3S版本,MegEye-C3S可实现全帧率、全画幅的人脸实时检测与抓拍,单帧可实现100张以上人脸检测与抓拍,特别适用于人流密集的通道、出入口等场景,实现对人群中人脸信息的精准捕捉。
图3 端到端智能安防产品及解决方案架构
【云从科技】
http://www.cloudwalk.cn
云从科技成立于2015年,孵化于中科院重庆研究院,专注于计算机视觉与人工智能等技术的研发,具有国家队背景。其成立的目的是重点转化人脸识别技术、人群监测技术、警用图侦技术和交通识别技术等科研成果。目前三大业务线包括金融、安防及创新,产品覆盖银行、安防、民航等领域,是国内银行业人脸识别的第一大供应商。
图4 云从科技生态象限
在人脸识别应用方面,以银行业为例,国内有能力自建系统的银行为148家。截至2018年3月15日,已完成招标的银行为121家,其中,云从中标88家总行平台,市场占有率为72.7%。
今年3月,云从科技发布的“炬眼”智能识别相机,被称为是世界科技界的一项重大突破。“炬眼”智能人脸识别相机使用Intel架构,在摄像机本地完成全程识别,极速传输识别结果到后台,准确率高达99.8%以上,目前相关产品已在23个省上线实战。
【云天励飞】
http://www.intellif.com
云天厉飞成立于2014年8月,是一家专注于视觉人工智能领域的公司,致力于打造基于视觉芯片、深度学习和大数据技术的“视觉智能加速平台”,为平安城市、智慧商业、工业智造、无人系统、机器人等行业的千家企业提供视觉智能应用解决方案和开发平台。
图5 云天厉飞生态象限
2015年,云天励飞打造了一个基于前端抓拍和云端搜索的人像智能系统;2016年,成功为2016杭州g20峰会西湖核心区域提供动态人像识别安保服务;2017年1月,在云天励飞的帮助下,深圳市公安局在15个小时内就破获一起拐卖儿童案件。
基于云天【深目】人像智能平台,云天励飞目前在深圳市范围内已经部署了5000多路的在线智能前端设备,全部动态人像的数据量也接近150亿张。而云天【深目】动态人像智能平台已在北京、上海、广州、杭州、新疆等先后落地,并进入新加坡、马来西亚等国家。
【依图科技】
http://www.yitutech.com
依图科技成立于2012年,致力于人工智能的研发工作。其计算机视觉技术目前主要应用在安防、金融以及医疗领域三大领域。在安防领域,公司研发的“蜻蜓眼”人像大平台已服务全国上百个地市公安系统,是全国唯一拥有十亿级人像库比对能力的公司;在金融领域,截止2015年,招商银行 1500 多个网点接入了依图系统,刷脸取款技术已经应用于全国2万多台ATM机。
图6 依图科技生态象限
蜻蜓眼智能安防产品包括人像大平台、车辆大平台两大系列。其中人像大平台采用依图自主研发的人脸识别技术,可进行基于图片的静态人脸比对,和基于视频流、图片流的动态人像识别及比对。系统广泛支持x86、GPU架构;提供了完善,可定制的用户体系,授权机制,权限系统和监管能力;支持跨集群协同联动;针对不同应用场景,提供了一体机,便携式单兵工具等多种产品形态。
图7 依图科技蜻蜓眼人像大平台特点
【神目科技】
https://www.deepcam.cn
神目科技是一家计算机视觉公司,成立于2016年12月,是一家以客户为导向的公司,主要以人脸识别、姿态识别、物体识别等核心算法在安防、零售以及移动手机端落地服务。
图8 神目科技生态象限
目前落地比较好的是智能终端,比如手机端。而在安防领域,其人脸识别系统几乎每天可以协助公安人员抓捕一名嫌犯。在智慧零售方面以防止偷盗为主要目的,其市场目前分为国内和海外两块,产品在美国本土应用的店铺超过了2000家,包括知名的零售企业7-11,还有一些体育用品零售店等;在国内合作的零售店铺也已经达到了100多家,其中包括万科、万达、良品铺子连锁店等。
【深醒科技】
https://www.sensingtech.com.cn
深醒科技成立于2016年1月,是一家从事人工智能方向,集研发、生产和销售为一体的高科技公司,以人脸识别技术切入AI战场,目前专注在安防领域人脸识别方向。
图10 深醒科技生态象限
2017年12月,BBC 曾对深醒科技在贵阳公安局安装的“深醒动态人脸识别实时预警系统”进行了一次实地测试。BBC记者逃犯,试图逃离贵阳市。在照片被技术人员录入数据库中后,其所到之处,但凡有摄像头的地方,都会被抓拍到身影。
而其被抓拍到的面部画像、出现位置及时间都实时的出现在了贵阳公安局数控大厅的屏幕上。最终,这名记着仅逃跑了7分钟就被贵阳警察在火车站大厅中“抓获”。
深醒科技在人脸识别的技术方面不仅采用静态算法,同时采用动态识别技术,并且其红外人像识别技术突破了黑暗背景下的人脸识别难题,在阴天、夜晚等低光照条件下仍有较高的识别率。目前其主要客户包括新疆、青海、云、贵、川、黑龙江等省份的公安系统,中航工业、中石油、中铁等大型企业、部分国内商业大厦和商业银行。
【眼神科技】
http://www.eyecool.cn
眼神科技成立于2016年,是一家专注于生物识别技术开发和应用的公司。现已开发完毕并投入使用的生物识别技术包括指纹、人脸和虹膜识别技术,正在研发中的有指静脉识别技术。
图11 眼神科技生态象限
眼神科技的产品当前主要应用在金融、公安、社保、校园、社区等方面。在人脸识别技术方面,眼神已经将其大规模产品化并应用于几十家银行,其算法在LFW人脸识别大赛中准确率达到了99.71%。
目前,眼神科技已经在全国20多个机场和客运站上线了安全管控系统,能够实现动态人脸识别,人、证、票合一检验,重点人员的布控和预警,满足了治安管理、通行管理、报警、门禁等各方面需求。
眼神科技承担了贵州、山东等多地“天网工程”项目建设,通过智能人脸识别摄像机自动抓拍人脸,实时传入指定数据库,能够实现动态人脸识别,重点人员的布控和预警,黑名单识别,轨迹查询,频次分析,同行分析,陌生人检测,图像侦查等功能,同时支持智能报警。
【深瞐科技】
http://www.seemmo.com
深瞐科技成立于2012年,专注于人工智能、机器视觉等领域。其核心技术包括芯片、算法和大数据三大板块,基于FPGA 神经网络算法硬件加速,帧频18fps - 320fps,检测识别八大类目标与GPU相比功耗比提升4-8倍,拥有全球领先的车辆特征识别算法、人脸识别算法、视频结构化算法,大数据分析方面能够达到毫秒级的响应速度。
图12 深瞐科技生态象限
深瞐科技全球首家提出“车脸”识别概念并落地实现,2014年利用深度学习技术推出高精度“车脸”识别算法,对图片视频中的车辆进行精准识别并秒级分析车辆特征,现该算法的车辆识别准确率可达到95% - 99%,能够识别5000多种车型。
车辆识别方面可以实现在海量视频和图片中锁定并追踪涉案车辆,适用于刑侦、情报、反恐等领域。人脸识别方面则能够对静态人脸和动态人脸进行高质量的识别分析,可应用于公安人脸比对、商业人流大数据分析、司法边检身份识别等。
深瞐的客户主要有三大块:一个是安防上市大公司;二是是集成商,主要为他们提供软件服务;三是终端客户,为其提供服务器硬件、软件和算法。目前深瞐科技的营收主要来自安防大公司,其2017年营收3000多万元,来自大公司营收占比80%。
【速感科技】
http://www.qfeeltech.com
速感科技创立于2014年7月,是一家专注于计算机视觉技术的公司。以vSLAM(基于视觉的同时定位与构图)为核心技术,希望通过前端芯片上的算法集成系统来帮助机器实现视觉自主导航、精准跟随等功能。
图13 速感科技生态象限
目前速感科技的主要产品为面向智能设备的系统化视觉解决方案——ULBrain消费级嵌入式视觉相机模组、Inbox工业级SLAM导航定位控制器。ULBrain™视觉感知技术中的动态物体跟踪技术、实时人数统计、场景行为理解技术为智能安防系统的建设提供可行方案。
【智芯原动】
http://www.icetech-bj.com
智芯原动成立于2012年,专注于AI算法和算法芯片技术研究、智能化产品和解决方案开发交付以及智能云服务集成,主要聚焦AI技术在机器视觉领域的应用,曾为海思提供AI协处理器IP授权。
图14 智芯原动生态象限
国内首创AI算法芯片化技术,并构建了上游芯片生态链,为客户提供AI技术、智能硬件等端到端AI解决方案,实现算法、芯片、产品的一体化设计,并结合云端大数据形成完整的AI产业链系统。
其用于智慧社区的“慕颜1”人脸识别终端能够进行人、车防伪识别,支持Anti-Fake活体检测,其人脸识别算法的性能比行业标杆优化50%,检测速度优化到10-30ms,识别速度低于1秒,识别准确率达到99.9%。
旗下合资子公司深圳智汇芯专注于智慧安防,致力于开发车识别、人识别、客流计数和安防视频数据结构化等安防AI模组领域。其超星光人脸模组能在黑暗环境下准确实现人脸识别。
【宇泛智能】
http://www.uni-ubi.com
宇泛智能成立于2014年,基于人脸检测、人脸识别、性别分析、年龄分析、行人检测技术等人工智能技术研发相关产品。2015年10月推出智能前台“Uface”, Uface人脸识别终端通过连入开放平台、由开放平台以API或SDK形式为开发者提供人脸检测、人脸识别、人证比对技术及设备管理功能。
图15 宇泛智能生态象限
该产品识别速度据称可达0.01秒,且属于弱配合识别,即打卡时无需专门对准摄像头,从机器前经过就可以完成识别打卡。目前已在办公、社区、酒店等各类场景落地,包括门禁考勤、闸机控制单元、身份自证和人脸识别终端等。
通过总结我们可以发现,这些初创都有很强的背景,不论是团队背景还是技术能力,并且大多是以人工智能下的视觉处理技术为核心打造各自的算法体系和数据平台。虽然国内的AI企业众多,融资体量也非常大,但是主要的资金还是会流向头部初创,二八定律在这里同样适用。应用方面则是以“大安防”为主,各大公司的主要客户主要以To G和To B为主,其应用场景主要集中在公检法系统和金融体系中,而随着国内智慧城市项目陆续规划和落地,AI+安防的市场会逐渐扩大,但能在大浪中完美冲浪的不会太多。最后,关于AI的看法,在这里引用商汤科技创始人汤晓鸥的话,那就是不存在AI行业,只有AI+行业。
-
机器人
+关注
关注
211文章
28379浏览量
206914 -
计算机视觉
+关注
关注
8文章
1698浏览量
45974
原文标题:国内计算机视觉算法初创公司大盘点
文章出处:【微信号:GeWu-IOT,微信公众号:物联网资本论】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论