【胡师】人工智能时代下的创业创新之路
人工智能经过这么多年的发展,前60年世界上的技术人员对人工智能做了很好的核心技术。而我们中国正在做的是做很多的应用创新、微创新、产品创新,但是我相信我们中国企业终究有一天能够在人工智能方面引领世界。——胡师
为进一步推动中国乃至全球科技创新,鼓励并扶持创新发明者,保障广大创新成果得到转化及应用,2017年3月17日在北京国家会议中心隆重举办XSUMMIT未来科技峰会(简称:XSUMMIT峰会)。第六届全球游戏大会暨XSUMMIT峰会的主题:“连接未来”,是科技创新与文化创意方面的年度国际“双创”盛典。本届XSUMMIT峰会议题围绕人工智能等前沿科技热点展开,邀请到多位极具声望与影响力的科技界大牛到场分享,共同展望未来。
科大讯飞轮值总裁、消费者BG总裁胡郁以“人工智能时代技术创新及产业化之路”为主题展开精彩分享,以下为演讲实录:
非常高兴有机会在这里跟大家分享一下关于人工智能最新的一些进展。我们今天如果用科大讯飞前两天在“两会”上刚刚跟克强总理汇报的实时转写技术就可以直接出字幕了。不过没关系,这肯定是一个进程。今天我跟大家分享的是关于人工智能最近这几年技术和产业发展的前沿,以及它将给我们生活带来什么样的变化。
其实讲到人工智能,可能很多人都知道去年是人工智能60周年。人工智能这个词在达特矛斯会一被提出来之后经历了几起几伏,但是从生命的角度理解它我们要追溯的更远一点,前段时间有人谈人工智能的奇点来临。大家知道我们宇宙如果按照现在的物理学家的学说,如果他们的理论是正确的,已经有130亿年的历史,就是130亿年的奇点大爆炸诞生了我们现在的宇宙,40亿年前,才产生了生命的原形。一直到300万年左右的时间,猿人才在地球上呈现,在这个之前,其实地球上有很多主宰者,包括恐龙,恐龙在地球上应该也有上千万年的发展历史。但是真正人类有智能是在七万到两万年前。人类的智慧出现以后,出现了一个新的世界,叫做精神世界,如果没有人类的出现,自然宇宙中是不会有精神世界和精神宇宙的,正是因为有了精神世界和精神宇宙,才有了宗教和神这些概念。但是,如果讲到人工智能它存在于哪一个宇宙中间呢?它其实存在1946年第一台数字计算机被发明以后的数字宇宙。关于数字宇宙的描述其实最近有本书叫《图灵的大教堂》,这本书里面详细描述了像哥德尔、图灵、冯诺依曼他们这些天才怎么样思考在师资宇宙里面人工智能可能产生的时间,但是他没有想到的是,在数字宇宙产生十年以后,就有人提出了人工智能的概念,就是这场着名的达特矛斯会议,经过60年的发展,这是2006年四个图灵奖得主,一个诺贝尔奖得主,一个信息论的创始人,去年最后一位他们中间的参与者去世,就是中间光头的那个。应该讲一个甲子过去了,人工智能正好也进入了新的时代。但是,如果和自然宇宙里面所产生的智能,就是和人类来比,整个数字宇宙的时间和数字宇宙产生智能的时间可以基本上忽略不计,因为今天数字宇宙也就产生才71年而已。在这个过程中,人工智能的发展其实也是几起几伏,经历过前期的兴奋,到中间的失望,到第五代日本个人计算机提出,再到提出智能计算机,而当时智能计算机负责人现在就主导了这个项目。
1999年科大讯飞创立,90年代是人工智能最黑暗的时候,那个时候要学人工智能的人出来连工作都找不到。但是,经历了互联网、移动互联网、大数据的一系列变更之后,人工智能突然在2006到2010年之间以惊人的发展速度重新回到大家的视野当中,而且就是靠深度神经网络。所以现在讲的第三次浪潮,很多人在猜测,第三次人工智能革命会不会像前两次一样昙花一现,但是事实证明,这次人工智能的革命已经不可阻挡。
但是,就像前几年大家对人工智能的感觉,人工智能每个公司可能在今天就像处在互联网泡沫的2000年。就像马云所说的,2000年左右在互联网泡沫的时候每个公司都讲自己是互联网厂商,但是当泡沫破灭以后,因为投资者已经不再相信互联网企业,所有企业都说我们跟互联网没关系。我推断有可能再过两年会不会出现同样的事情,不知道。但是,人工智能确实给大家的概念在学术界、企业界和普通的老百姓心里面是一个非常模糊的边界,人工智能到底什么,发展到什么阶段,将以什么样的方式突破?在过去三年当中,科大讯飞在很多的领域其实做了很多的阐述,我们也很高兴很多概念被大家所接受。
比如说,人工智能可能最初始的一个特点叫做运算智能。因为到最早的两台计算机被发明的时候就是因为人算的不够快、存的不够多,计算机才被发明了。所以,在运算方面,从计算机诞生那天开始,从人工智能诞生那天开始它就是超越人类的,只不过它的速度还在以摩尔定律在提高。我们刚才描述的这些问题都可以把它变化成一个运算智能的问题,只要计算机的速度够快,这类问题迟早会被解决。但是,如果看一看动物和人类所具有的一些能力,包括我们讲感知,比如视觉、听觉,以及它们之间的融合,以及人类的运动,就是我们可以抓住空间上一个飞来的篮球,但是不需要计算这个篮球的抛物线和位置坐标,也不需要计算这条手臂,他每个时刻所能达到应到的空间位置就可以抓住它。这些人类和动物所与生俱来的运动智能,以及感知智能与运动智能的交连,是机器一直相比存在较大的差距的地方。但是,在过去的十年当中,在深度神经网络快速发展过程当中我们可以看到它进步很快,包括自动驾驶汽车等一系列方面,人工智能展现出来在视觉和听觉方面超越人类的可能性。
但是,如果讲到真正的人工智能的挑战是什么呢?这是人类所独有的。人类跟机器、动物有着本质不一样的就是人类的思考。《人类简史》这本事很热,人类最本质的是语音和语言,人类变得聪明是因为人类的祖先发明了语言。这也是为什么在七万到两万年的时间内,在众多的猿人当中非洲的智人能够战胜其他的猿人,成为地球的主宰。因有了语言可以更好的描述世界,因为语言可以进行八卦,可以把人类组织起来,因为有了语言,我们可以有宗教。其实语言的背后是概念,是逻辑,是复杂的东西。所以说,从认知智能的角度来讲,语言的理解、知识的学习、逻辑的推理,这些东西才是核心。
基本上我们可以看到,如果按照这个脉络来看,我们可以清晰的知道哪些公司正在做什么,这些公司到底是人工智能最核心的部分,还是他们只是做了其中一个传感器。我想这个大的概念现在大家已经接受了,在过去的几年当中,包括艾瑞咨询,包括赛迪顾问,包括很多证券公司的分析报告他们其实已经接受了将人工智能领域区分成这几大类。同时,他们也接受了在人工智能认知智能中间最核心的是语音和语言。那么,在2014年科大讯飞提出“讯飞超脑”计划,就是要攻克感知智能和认知智能方面的突破。因为人的大脑区别于动物的,就是他的完善的大脑皮层,大脑皮层中的不同区域就是用来处理不同的感知和认知智能。那么,对应的“讯飞超脑”计划其中也有感知智能的部分,以及认知智能的部分,这些部分构成整个“讯飞超脑”的过程。
过去一段时间我们已经取得非常多阶段性的成果,包括在全球最高水平的英文语音合成大赛中连续11年我们荣获冠军,英文上我们也是唯一能够达到超过一般人翻译水平的4分,其中是满分,4分标准。其中两年组委会实在看不下去了,连续两年用印度人说的母语来评赛,我们还是第一。除此之外在自然语言理解方面,知识图谱构建的比赛是由美国国家标准知识研究院承办的评测,美国很多着名研究机构基本上都参加了,我们两个研究机构,科大讯飞人工智能研究院和科大讯飞加拿大约克大学认知智能研究中心包揽了前两名。
在去年有一个winograd测试,我们获得第一名,但是距离还差得很远。包括我在领导的中国人工智能项目也是在世界上最先进的,我们要做一个中国863高考机器人系统,150分的卷子数学可以考到110,语文可以考到90,但是地理和历史这样的科目反而很难。这在世界上却已经是最先进的了。基于这样的情况,科大讯飞推出在国际上领先的AI、UI的系统。
2010年科大讯飞的发布会上又发布了科大讯飞的智能语音云系统,经过这几年的发展,在去年一年的时间里面,连接的终端数从6亿增长到将近10亿,创业团队的数目从原来的7万增长到现在的30万,前段时间艾瑞咨询专门做了一个调查,把手机上前1000名的APP进行了分析,有95个用了讯飞的语音云,25个用了百度的。
人工智能将来会用在哪些领域呢?过去人工智能有的时候等于深度神经网络,或者人工智能等于大数据。其实人工智能能做的我觉得有两个方面。第一,人工智能将改变人和机器的自然交互,影响我们的日常生活。第二,在各行各业里面,人工智能将替代这些行业里面最稀缺的资源,优质的专家。人工智能在知识工程领域,已经能够在教育、医疗、司法等很多方面代替这个行业里面最稀缺的专家资源。
大家都知道我们的信息系统变化,从某个维度来看是我们跟机器之间交互的变化。在过去的60年当中,根据摩根史丹利的报告,大型机、小型机、个人电脑、互联网、移动互联网、物联网都有一个维度,它就是我们跟机器交互的水平。在机器比较蠢的时候人类必须是专家,你必须知道二进制的打码,就是在子弹上打孔怎么做,这也只有专家能做。有了电脑以后,会打字的人可以操作电脑了,有了Windows只要点点鼠标就可以,现在更方便,触摸就行了。但是,在将来其实这个不用说了。虽然过去几年我们一直在做这个项目,但是这几年包括Google、微软、亚马逊、苹果,包括国内的BAT也开始进来。语音交互将成为未来交互的重点。人类对外输出信息最快的方法是语言,而机器对外输出信息最快的方法是显示器,所以这就构成了语音交互在将来将成为我们跟机器之间交互最便捷的一个方式。
这些语音交互可以用在什么地方?可以用在转写,我们可以迅速的获得这些方面的知识。也可以用带翻译,解决人和人之间沟通的问题。讯飞的输入法现在已经超过4.3亿用户,每月用户活跃度超过1.2亿。讯飞和中国移动联合开发的灵犀是世界上活跃度最高的中文的智慧的系统,类似于Siri。我们还会进一步推动这个项目,因为在手机上还会有新的玩法。那么,在智慧家庭、在汽车、在很多方面,人工智能都将改变我们和机器交互的方式,这个毋庸置疑,问题是什么时候能够全面的将我们的时间从现在的低头一族和只是用手触摸转换到与机器更多的交互上来。
另外一个是更大的2B和2G的机会,我们在行业里面最缺乏的是什么?大家知道十年树木,百年树人,培养一个人才不容易,培养一个专家更难,人工智能还有一个在知识功能中可以通过学习应用专家的水平达到和接近一般专家的效果远远超过一般人。而这个培养的速度一旦它学完以后是不需要培养的,只要复制就可以。这也是人工智能在很多行业应用里面,跟行业大数据和行业专家知识结合的最具魅力的地方所在。
在教育领域,中国是世界上唯一一个能够用机器自动评价发音准确度的国家,中国也是世界上唯一一个能够用机器实现口语考试的国家。美国和日本都不是。大家发现全世界只考听力,为什么?因为听力的答案,选择题的答案机器可以改,如果用口语做答机器没法改,中国现在做到了。第三,中国是世界上唯一一个能够对你手写的卷面考试进行评测的国家,中国现在已经做到很多地方都可以这样做,这些全部都是科大讯飞提供的技术。而且我们的技术不仅在中国用,在新加坡、澳大利亚、日本,包括美国都已经在进行这些技术的推广。这背后就是“讯飞超脑”的感知和认知智能综合。在教育里面有这些技术我们可以替代很多最好的老师,这个老师可以专门为你批改作业,指出你哪些知识点不足。在广东分校我们给16个班级,第13、14名的班级,用了英语和数学的个人练习题,到学期结束的时候这两个班级在这两门课排到第3、4名。科大讯飞在全国几十个城市中间用人工智能系统帮助你证明你的身份,像克强总理说的不需要再证明你是你、你妈是你妈。后台数据的打通,已经可以从各种大数据和智能化中间帮你验证这一点事实。
在医疗领域,我们曾经跟卫计委的李斌主任会面,她希望我们做一个通过医疗资格考试的机器人。在公检法司我们将用人工智能来替代或者达到我们所需要的法官、律师、检察官的各方面职能。我们会在各个方面进行对这些专家人才的人工智能复制,但是有一点我们不会替代他们,我们只是会让人去集中在那些最富有创造性的事情上面。
今天大会的主题是游戏,其实在游戏里面尤其是手游里面的人工智能的运用,根据我们最新发现,语音交互已经成为手游社交一个必不可少的环节。因为大家的眼睛和手都很忙,这时候语音可以成为非常重要的切入点。在后代的音色定制,我们希望你们的NPC都有自己的声音,这也是非常好的一点。我相信将来有一天在游戏里面的NPC会像我们现在在网友里面各个真人玩家一样,也许他们有一天会让你感觉不出来,这天正在到来。
总结一下,人工智能可以做哪些事情?可以把人类的事情分成三个方面。第一件事情,像Alpha go完全信息公开的博弈系统,人工智能必将超越人类。在一些Information-Incomplete时代,人机协同共同促进新发展。这次Alpha go大家惊讶的是,再过十到十五年下围棋的问题对于机器来讲只是一个信息。但围棋对于现在人工智能的运算速度是一个Information-Incomplete的问题。但是,对于一些创造性的活动,我们叫art,这些方面是人类永远不会被机器替代,除非机器哪一天能够产生出灵魂或者是自我意识。但是,那是另外一个话题,我们今天在这里不做讨论。在Information-Free方面,人类绝对是主导,人类可以辅助我们。
所以,应该说人工智能经过这么多年的发展,前60年世界上的技术人员对人工智能做了很好的核心技术,原始核心技术系统创新。而我们中国正在做的是做很多的应用创新、微创新、产品创新,但是我相信在将来的60年,随着我们对脑科学、认知科学、神经科学以及人工智能本身数字宇宙的进一步规律的认识,我相信中国的很多研究机构和企业不仅仅能够在微创新、产品创新和应用创新上参与互动,我们中国企业终究有一天能够在人工智能方面引领世界。同时包括刚才讲的生命科学方面也会有中国企业的一席之地。我期待着在游戏方面我们可以做出更杰出的工作,谢谢大家!