“不要谈那些高大上的东西,不要对它赋予很大的期望,认为它是一个灵丹妙药,找一个高人来,马上就可以把这个人工智能遍地开花,这是不可能的”清华大学人工智能计算研究院邓志东在由财经承办的“2019中国制造论坛上”如是说道。
清华大学人工智能计算研究院邓志东
以下是邓志东的演讲实录:
第一问:新一代人工智能怎么理解它?还有它目前的主要进展是什么?
怎么去理解新一代人工智能,我觉得这很关键,因为现在我看大家都说人工智能,我们知道人工智能其实是有定义的。我们实际上是模拟、衍生和扩展人类智能行为的一种理论、方法、技术、系统,这么一个综合性的学科。
人工智能主要包括感知智能,还有认知智能。感知智能,简单说就是不需要思考的,一秒钟能够做出反应,对人类的直觉行为进行模拟,比如视觉、听觉、嗅觉、味觉。另外一个叫认知智能,像现在我们的记忆、推理、决策、思维、意识等等。
新一代人工智能的进展主要包括三句话:
第一句,大数据驱动的感知智能取得了突破性进展。从2012年以来,短短的六年时间掀起了新一轮的产业高潮,因为人工智能前面也有高潮,但是前面高潮都没有产业链进入。其次是真正有能力,但是这个能力是有限的,跟人类比较起来还有很多缺点。
第二句,以阿尔法狗为代表性的深度强化学习,在动态博弈类的决策问题上取得了超过人类水平的进展,但这属于认知智能的范畴,在工业化的应用上其实很少,也不要指望他在工业上马上能够应用。
第三句,在深层次对抗神经网络能够通过对抗的方式生成超逼真度、超真实感的数据上面,最近这两年也是取得了非常重要的进展。这三个其实概括起来对工业、产业、产品开发和产业发展,其实最重要的或者产业真正感兴趣的,就是大数据的人工智能,能够带来感知能力的提升。
第二问:AI能够做什么?尤其是能够给产业带来什么东西?
人工智能真正有产业价值的地方,实际上是大数据驱动的,或者大计算能力支撑下面的深度学习方法。AI真正能够给我们带来是直觉能力,或者通过学习的方法能够处理,这种能力自动从大数据里面提取出它这种特征,多重特征,底层特征、中层特征、高层特征、局部特征、全局特征,这也是AI真正的产业价值或者真正的知识价值,我们主要也是运用这方面的价值。
所以AI的产业价值就是能够带来感知能力,视觉、听觉还有直觉能力,包括我们的文本分类能力,简单说就是计算机视觉、语音识别、文本分类,包括机器翻译,端到端的,通过学习的,而不是以前通过人为设计特征这种方式的一种能力。
但是,它需要大数据,需要大计算能力。不能有小样本的举一反三的能力,识别结果是不可检视的,不能从认知理解上去对识别理解给予它可解释性,也没有鲁棒性,也没有记忆能力,甚至连常识处理不了,什么能力都没有,所以不要对人工智能寄予很大的期望。
现在人工智能是一个弱人工智能,是整个人工智能发展过程中一个非常初步的,但确实是能够带来产业价值的东西,他相对于人类的智能来说是非常初步的,大家可能对它寄予很大的期望。
第三问,怎么落地?怎么在制造业落地?
可能很多人认为,大家都在喊人工智能,真正具体做起来都知道,人工智能落地是如此地困难,就是因为我们现在对人工智能没有深刻或者本质的理解,所以现在人工智能能够做的事情是非常有限的。
现在人工智能主要包括四个维度,第一个维度大数据,第二个计算能力,第三个算法,第四个应用场景,其实现在最关键的是应用场景。
要选择一个特别细分的垂直应用领域,这个领域就是要针对特别具体的问题,我们不去谈人工智能做应用的时候,做产业化开发的时候,不要谈那些高大上的东西,不要对它赋予很大的期望,认为它是一个灵丹妙药,找一个高人来,马上就可以把这个人工智能遍地开花,这是不可能的。
人工智能要做就做很细微的事情,做一个点点滴滴的事情,非常小的,因为人工智能可以有两句话,现在所谓人工智能就是人工+智能,有多少人工就有多少智能,实际上它是把人工通过以标签的形式转移给机器,然后赋予它智能的,所以有多少人工就有多少智能。有多高水平的人工就有多高水平的智能,比如你要做标签,做医疗,比如说你做CT,甚至看早期肺癌,这种标签不是给普通人做,需要国际顶尖医生来做标签,这样他得到的水平就是国际顶级医生的水平,否则就是一个普通医生的水平。
所以如何在制造业里面落地呢?其实就是要选定一个特定的问题,非常具体的问题,这个问题需要具有信息化技术比较好,做数字化、网络化,能够源源不断产生大数据,然后对数据进行采集、积累、做清洗、标签,控制它的标签,对标签进行审核的能力。
要做数据,基本上80%以上的人力或精力要投入到特定问题、细分问题上做标签。举个例子,零部件外观质量的检查,以前都是靠人,比如说看陶瓷产品是成品还是废品,看外观能看出来它的瑕疵是什么,以前靠高技能的工人看,现在人工智能就在这上面有能力,因为它就是能够做计算机视觉的。
如果我们建立起大数据,建立一支团队就做这么一个细分的问题,然后我们建一支团队大量投入进去,做数据积累、数据标签,建立高质量的数据,这是很笨的方法。但就是得靠这种笨方法,深耕场景和数据,打磨人工智能产品。实际上事情就是这么做的,而不是一个高大上,一个万能的方法,一提出后,一撒到下面,所有就都成功了,这个根本没有,这只是在认知水平的智能才可能成功。
但现在这上面没有什么突破了,主要是在感知智能上面才有这样的突破。所以这个时候只能用笨的方法,选中一个笨的问题,建立一个团队,很多钱投进去,做到后面的时候,你会发现,越做越难。因为它的数据到后面,比如说正确率是99.999%,从5个9,增加到7个9,这么一点点的提高,需要的数据都是指数增长的,这就是我们所说的“长尾效应”。
所以,其实做到后面是特别难的,即使这么难,投入这么大的精力做数据,结果最后你发现还是做不到人的水平,我们是跟人比,比如说我们现在做人工智能,不管是产品也好,还是流程也好,还是服务体验也好,就是要做人类水平。我们现在看到很多新闻报道,里面都说超过人很多,比如人脸识别超过人很多,这是一个完备数据节,这是作为学术研究的。
真正到人工智能落地的时候,是一个开放环境,是没有完备大数据的,这个数据永远没有尽头,而且数据越做到后面越困难,因为它有长尾效应。在这种情况下,还不一定能做到人的水平,这是现在算法的缺陷。
在这种前提条件下,我们做数据工程,做大数据,包括尤其做大数据的标签,做高质量的大数据,去赋予它人的智能,把它转移过去,让它具有人的水平,在视听觉这种感知能力上接近人的水平,它就有产业价值。
在感知层次上,其实有些方面它是不可替代的。你看到视觉能力、听觉能力、语音识别、计算机视觉、外观检查,很多数据进去以后,它确实能够达到熟练师傅的水平,师傅看到这个是成品还是废品,他也能够看到是废品还是成品,就是到机器换人,他可以做到自动化的处理,不需要人去做这个事情,可以把人替换下去。
还有一部分是大数据洪流,不断涌现大数据,特别大的数据,这个数据人是处理不了的,必须要用机器来实现自动化,必须要用人工智能赋能,用这种方法做数据的自动化,或者是知识的数据化。
从数据流怎么去提取信息流,提取语义流,都需要人工来做。另外,从产线的角度,比如说我们单批生产设备,要机器人化、自动化,可以代替人,提高效率或质量,还有整个产线,整个车间的生产设备本身的自动化,也是靠人工智能来实现。
实际上我们做的智能制造,包括做新零售、新制造都是在信息物理空间进行的,一部分是虚拟的信息空间,一部分是实体空间或者物理空间。一部分是网络,比如说互联网,一部分是实体,比如说生产设备,或者是实体店,或者实体的分销商。一部分是虚的,一部分是实的,这两部分都需要人工智能的赋能,就可以实现智能化,提高生产效率,同时带来生产产品品质的提升。