近年来,专注于机器视觉、自然语言处理和机器深度学习等领域的人工智能企业纷纷创立。国内外的互联网巨头也先后进入这条赛道。
灵至科技也是这场竞赛中的一员,从成立之初起,这家公司就专注于研究人工智能机器视觉解决方案。早在1998年,其核心团队就开始研究人工智能,并先后在人脸识别、物品识别、情绪识别、手势识别等领域取得优异成绩。2015年,灵至科技团队将算法研究转向边缘学习算法方向,并于次年正式成立公司。他们的目标是用人工智能构建未来世界,让人工智能进入到人们生活的各个方面。
但另一方面,今天的人工智能行业俨然已是一片竞争激烈的红海,机器视觉、自然语言识别、智能机器人、智能交互等细分领域都已经出现了许多发展得不错的初创企业。同时,创业者们还要面对来自BAT,甚至规模更大的国际企业的冲击。如何突破红海,是每个创业者都在思考的问题。
近日,灵至科技CEO张克军做客墨客星球,围绕当下的行业与技术问题,向我们分享了他的经验。
1
灵至科技主要是专注于研究机器视觉人工智能解决方案,不过在看你们的应用场景时,发现有智能门锁、智能家居机器人、驾驶员检测系统等等,应用的方向好像非常多,灵至科技是怎么选择,以及为什么会选这么多应用方向?
张克军:这实际上和我们公司的定位有关,看上去我们好像有很多应用方向,但实际上并非如此。我们公司的定位是人工智能机器视觉解决方案提供商,我们的核心产品是基于边缘学习算法的高效人工智能机器视觉解决方案。这个方案本身能应用的领域非常多,包括门锁、机器人、疲劳驾驶等等,但我们的核心点始终是集中在如何提供高效的解决方案。
2
不同应用场景之间,比如智能门锁、智能家居机器人、驾驶员检测系统等,对机器视觉技术的要求也会有所不同吗?灵至科技的技术是怎么适配不同场景的?
张克军:有不同的地方也有相同的地方,相同点是它们都是基于人工智能视觉处理,不同点是在不同应用方面会有一些细微的调整。灵至科技就是抓住了这些相同点,对不同点做细微调整,每个项目更改的部分不超过10%。我们的算法可以实现人脸识别、情绪识别、手势识别、物品识别等等应用,接下来只需要在相应的场景对算法进行调整就可以了。
3
在以前的采访你们说过,“边缘性算法将会是未来AI算法的主流趋势”,可以跟我们科普一下为什么吗?
张克军:边缘算法是一种只需要少量的样本就可以训练机器的算法,它的特点是不需要把数据上传云端,只在本地就能完成识别。我们公司认为,如果以后人工智能想要落地,想要更广泛地应用到人们的日常生活,边缘算法会是很大的趋势。原因有两点:第一,它的实时性非常好;第二,它可以更好地保护个人隐私。
从实时性来说,比如你要开智能门锁,如果还要用把数据上传到云端识别这种方式,那万一网络不好,不就不能开门了吗。驾驶员检测也是如此,假如你在地下车库或者隧道里面,很容易断网,这样就无法保证驾驶的安全性。哪怕将来5G、或者更高的技术出现,这种无线传播都会有各种问题存在。
从隐私问题上来说,我们在机场、火车站刷身份证的时候,数据会被上传到云端识别,但我们不需要担心隐私问题,因为这些数据都是交给公安部门。但在使用智能门锁、或者家用监控系统的时候,再把数据传到云端就不妥了。因为那样就相当于时刻会有一双眼睛盯着你在家里的一举一动,又或是窃取你的数据,从远端就能打开你家的门。
这些问题不管在国内还是国外都普遍存在,所以最近边缘算法越来越热,也越来越被业界所关注。
4
现在国内做机器视觉解决方案的企业很多,灵至科技的竞争优势是什么?你们如何说服客户用你们的产品?是否有具体的数据?
张克军:我们的优势体现在很多方面上,首先是我们技术的全面性。灵至科技是从1998年就开始做人工智能研究,所以涉及到的应用非常多,包括医疗、工程、民用、娱乐方面的识别,各方面我们都有设计。通过这些方面的技术积累,我们在做新方案的时候,思路会比别人更广。
其次是我们现在所关注的边缘算法,它在实时性和隐私性方面都提供了很多便利。而我们提供的方案,在价格上也更优惠,这也是我们的一个优势。举个例子,我们之前有一个浙江的客户,这位客户是要做幼儿园的面部识别考勤系统。这个幼儿园算上小朋友和老师,大概是500多人。他之前也找过其他企业,这些给他的方案有些起步价是30万,最高的还有100多万,这对于一个幼儿园来说是一笔很大的经费。但是用我们的边缘算法,只需要8万就可以了。
另外一点,就是边缘算法的实时性,也就是不需要联网这个特性。我们与公安部有合作一个项目,用来监控内蒙古草原。众所周知,内蒙古草原一望无际,信号也不好,如果有个逃犯出现在这里怎么办?这时候有一个离线版本的人工智能方案就很方便了。
除此之外,灵至科技在专业度上也有很大的优点。我们团队现在有将近50多个全职人员,管理层都来自世界五百强。我们一直认为,对客户的快速反应才是公司的生存之道,立足之本。当客户希望能有一个人工智能解决方案时,我们一般在两周之内就能给客户提出一个非常好的方案,有时候还能直接演示。这种快速反应,我觉得也是一个很大的竞争优势。
5
机器视觉的核心竞争点是什么?从事这个行业要如何打造行业壁垒?
张克军:我觉得更好的说法应该是人工智能的核心竞争点是什么。在我们做了多年的调查和研究之后,我们认为现在应该是属于“AI+产业”这样一个情况,就是说人工智能本身并没有形成产业,它必须要和现有的产业进行结合,才能爆发出生命力。如此一来,就有两点非常重要。
第一,是企业算法的能力。人工智能发展非常快,有些领域可能是一年、两年才会革新,但人工智能是两、三个月就会革新。算法更新非常快,很难有一家企业可以说自己的人工智能一直是最前列的。
第二,是企业的工程能力。不同产业对于人工智能的需求也是不一样的,以一个锁厂为例,锁厂要如何用人工智能?这中间的跨度很大,它包括了算法、场景优化、电子,还有整个模块的机械部分。对于一个锁厂来说,它能提供的接口就只有机械部分,所以作为一个人工智能产业,应该如何落地?灵至科技就是把自己定义为服务商,既然是服务商,那怎么给客户提供用得上的服务,就非常关键了。
所以我觉得如果想打造行业壁垒,就要做好这两点,然后要摆正心态。前面的两点,是要求企业要做好内部的基本功,不断更新、优化自己的核心算法,同时也要想好怎么和产业接口。至于摆正心态,就是要有一个服务为本的心态,这样企业才能越做越好,壁垒也会越来越强。
6
关于人脸识别锁,你们采用的是3D视觉技术,还是2D视觉技术?现在这个领域采用哪种技术比较属于主流?为什么?
张克军:我们用的是3D视觉技术,现在也是3D视觉技术比较主流。原因是门锁这部分,除了识别还有很多优点,比如活体检测,还有对角度、光线的适配,在这些方面3D视觉都要比2D视觉更优秀。
7
关于智能家居机器人,它有安防保障、管家服务、可以帮助照顾老人等多项功能,研究这种机器人,最大的难点是什么?
张克军:最大的难点是如何做好人机交互,我们认为将来智能家居机器人肯定会进入家庭场景,所以关键的一点就是对机器视觉的处理。我们的处理基本包括了物品识别、情绪识别、人脸识别、人的意图识别等等,这几种识别在我们的机器人里面已经实现了,都是为了加强机器人与人互动的能力。
当然做产品只做好技术也不够,性价比也很关键。现在很多机器人用的都是激光雷达,但激光雷达成本很高,最便宜的要几千块钱,贵的更是要上万。但是用机器视觉就不一样,只要几百块钱就可以了,所以我们觉得以后基于机器视觉的智能机器人,在未来应该会是很大的发展方向。
8
现在灵至科技的智能家居机器人的落地情况、或者说普及度怎么样?
张克军:目前我们在官网上放出来的是我们的顶级版本,是为了说明灵至科技现在的技术已经实现到什么程度了。而当我们真正落地和普及的时候,一般都是这个版本的简化版,或者是针对某些特定应用场景的版本。比如针对居家场景,我们就会提供一些缩减成本的简化版本。
9
如今国内人工智能企业都在竞相开源,您如何看待这种现象?灵至科技在这方面是否也有涉及?
张克军:开源的本质是希望让更多人去使用这个技术,然后继续推进技术发展。但推进一个技术的落地和发展,不一定要采用开源这种方式。如果你能提供一个稳定的、合适的方案,这也是一种殊途同归的方法。
对于灵至科技来说,我们更关心的是如何把机器视觉模块的成本降下来,我们目标是希望今年能把机器视觉模块,从算法到摄像头,一整套的成本能降到3美金。
10
以前我们采访过一些投资人,他们有这样一种观点:很多中国人工智能企业的团队都是海归,但其实全世界能培养出人工智能专业博士、人才的大学就几家,而大部分人才还没毕业就已经被谷歌、微软这类国际大企业“提前订购”了,所以现在一些中国人工智能的创业公司,真正能在技术方面做好的很少。对此您有什么看法?
张克军:人工智能是一个人才密集型的产业,这点是毋庸置疑的。但人才并非一生下来就是人才,也不是说你看了几本书你就是人才了。
中国有句古话,时势造英雄。一个人,是否能遇到一个可以让他发挥才能的平台,让他不停试错、不停迭代,远比他多读几本书或是学一个专业更重要。
我们团队也有很多海归,有很多博士,有从美国回来的人才,但我们也发现,并不是说一个博士或者一个硕士,就会比本科生要强。最关键的还是要看你的实践经验,以及你对技术的领会。
而且人工智能将来肯定会发展到人类生活的各个方面,但现在谷歌、微软这些大公司已经把各个方面都做好了吗?就目前来看,并不是这样。现在依然有很多空白领域,未来也是不可预知的,就算是大公司也会有许多不足,所以依然存在许多机会。
11
2019年的灵至科技的有什么发展规划、或者其他准备推出的新产品,可以透露一下吗?
张克军:2019年,我们的目标还是把人工智能往不同的方向继续推进,让它更好地落地,应用到更多领域。这同时也是我们的梦想,用人工智能构建一个更好的世界。根据2018年的情况来看,人工智能已经获得了很多人的认可,认识度也越来越高,这是个好现象。
对于灵至科技来说,我们要在接口部分做得越来越精,把我们现有的技术做得越来越好,我觉得这是2019年我们需要突破的点。在产品上面,我们会把人工智能模块应用到医疗机器人领域,比如消毒机器人,搬运机器人等等;汽车领域我们也会涉足,比如我们现在在做的疲劳驾驶监控,这些方面我们今年都会大跨步地往前推进。