科大讯飞刘辉:AI赋能,让一切皆有可能

发表时间:2019-02-02

1月30日,由与科大讯飞主办的以“渠道下沉,产业升级”为主题,以“科技创新”为核心,探讨新时期、新机遇下企业发展之路的2019贺岁产业创新论坛——合肥站隆重举行。

在论坛上,科大讯飞团委副书记、市场推广经理刘辉以《AI赋能,让一切皆有可能》为主题做了现场分享。刘辉表示,现在全社会都在探讨人工智能,从政府到社会到企业,方方面面,大家都在谈,热度非常高,已经逐渐上升为国家的战略。

2017年,国务院发布《新一代人工智能发展规划》,从整个国家的层面把这个事情安排下来。在2017年10月,习近平总书记又特别强调要加强推动互联网、大数据、人工智能与实体经济的深度融合。不仅在国内,像欧美等国发展人工智能非常鼓励,而且不设限。

他说IT的发展经历了6次大的浪潮,人机交互将引领产业变革。从上世纪60年代大型机时代到上世纪70年代小型机时代、上世纪80年代个人电脑时代、上世纪90年代桌面互联网时代,再到本世纪最初10年移动互联网时代,到现如今的万物互联时代。在无屏、移动、远场状态下,以语音为主,键盘、触摸等为辅的人机交互时代正在到来。现在大家用得很多的智能手表、手环、智能音箱都是在无屏移动源的状态下。

在刘辉看来,人工智能历经三次浪潮从1956年达特茅斯会议开始人工智能引起了全社会的注意,到经历两次黄金期,现在进入第三次的发展高潮。人工智能的核心技术发展主要有两个发展研究主线:一、以DNN为代表的神经网络的核心算法;二、脑科学和类脑科学的研究,针对人类大脑的运算机制。

他表示,AI+时代,人工智能改变的3要素:核心技术、行业专家、行业大数据。而在这个AI时代,应用才是硬道理。人工智能的应用主要表现在AI+教育、AI+医疗、AI+交通、AI+司法、AI+智能客户、AI+移动场景、AI+公益、AI+智慧媒体等领域。

最后,刘辉强调,现在社会上可能普遍有个观点认为,人工智能可能会无所不能,会非常强大,马上会替代我们的工作。但其实并不是,我们一直强调理性的人工智能,比人类更强大的不是AI,而是掌握了AI的人类。所以AI赋能可以创造无限的可能性。

以下是演讲全文(经过校对,略有删减):

大家下午好,非常感谢的邀请,有这样一个机会,和大家做一个这样的交流。今天我和大家分享的主要是科大讯飞这几年在人工智能领域的一些前沿探索以及一些主要的做法。

现在全社会都在探讨人工智能,从政府到社会到企业,方方面面,大家都在谈,热度非常高,已经逐渐上升为国家的战略。不仅在国内,像欧美等国发展人工智能,非常鼓励不设限。

在国内,2017年,国务院发布《新一代人工智能发展规划》,从整个国家的层面把这个事情安排下来。在2017年10月,习近平总书记又特别强调要加强推动互联网、大数据、人工智能与实体经济的深度融合。

而人工智能技术现在发展到了什么阶段?有哪些典型应用?下面我就以我们科大讯飞这几年做的工作为例,向大家阐述。

IT的发展经历了6次大的浪潮,人机交互将引领产业变革。从上世纪60年代大型机时代到上世纪70年代小型机时代、上世纪80年代个人电脑时代、上世纪90年代桌面互联网时代,再到本世纪最初10年移动互联网时代,到现如今的万物互联时代。在无屏、移动、远场状态下,以语音为主,键盘、触摸等为辅的人机交互时代正在到来。现在大家用得很多的智能手表、手环、智能音箱都是在无屏移动源的状态下。这里的核心技术“云交互”。

从人工智能的三次浪潮来看,经历了几次波动,从1956年达特茅斯会议开始人工智能引起了全社会的注意,到经历两次黄金期,现在进入第三次的发展高潮。

人工智能领域它的核心技术发展主要有两个主线,一个是以DNN为代表的神经网络的核心算法,另外一个是脑科学和类脑科学的研究,针对人类大脑的运算机制。这是2个主要研究方向。

现在人工智能三个发展阶段:运算智能——能存会算;感知智能——能听会说、能看会认;认知智能——能理解会思考。这也是由科大讯飞提出来,在业内已经有一个比较权威的认可。从运算智能,能说会算,到现在象棋大师认知智能转化的高阶阶段,现在正在从认知智能向感知智能转化的一个阶段,这里涉及到几个核心技术的发展:

1、语音合成技术。现在已经发展到哪个阶段?如果说自然语音是5分的状态,现在科大讯飞的技术已经可以做到4分,超过大部分普通人的发言水平。也是全球首次语音合成超过真人水平。我们在Blizzard Challenge比赛中得十三连冠。首个AI配音的央视节目是《创新中国》。

2、语音识别技术。识别主要是把语音识别成文字。现在这个转写识别准确率已经超过98%,讯飞听见在涉密场合下的离线识别已超95%。2018全国两会期间,人民日报新媒体中心在人民大会堂使用讯飞听见系统实时转写、翻译。

在方言识别方面,也取得了非常大的突破,覆盖22种方言,相对2016年提升50%以上,最高已经超过90%,当然和普通话识别还有一定的差距,普通化它是有一个全国统一的标准的,像全国的普通话测试也是由我们来做的。那么方言识别最大的难点就在于它的标准化,因为它的标准不同,可能隔一座山一条河,它的发音都不同,所以在机器人学习的方面,就会有很大的困难,但是我们在不断的研究和突破。

3、机器翻译技术。2018年4月17日,联合国国际电信联盟与科大讯飞在日内瓦总部签订机器翻译战略合作协议,我们也是国际上唯一一个做国际跨语种的翻译服务。这个是我们在C端的一个发力,主要是在翻译机方面,这开创了一个全新的匹配。也获得了获CES ASIA 2018“最佳人工智能产品奖”、博鳌亚洲论坛官方唯一指定翻译机。李克强总理购买翻译机送给保加利亚总理。目前,在市面上占据了70%的份额。我们现在的翻译水平大概已经达到了大学英语六级,六级15分的翻译测试,我们的机器可以做到13分,已经超过了90%的学生水平。2019年将达到专业八级水平。

4、图像识别技术,主要是医学影像领域。在医疗影像方面也已达到一个高水平阶段,2017年8月刷新LUNA世界纪录,肺结节检测领域最权威国际评测。

5、常识推理技术。这是认知智能的高阶,常识推理对机器来说还是非常大的挑战和困难,所以我们也在不断的加大研发和投入力度。2017年已达到66%的水平,2019年会有更大的突破。

在人机交互领域下一种可能,我们认为是语音 + 脑机接口的方式,是无频原厂的状态下,语音与脑机接口结合是一种最方便的方式。这里我们主要和MIT建立战略合作研究。

除此,人工智能学习可以通过学习顶尖专家的知识,可以达到一流专家的水平,超过90%的普通专业人士。那么这个速度可能比我们想象的来得更快,根据埃森哲报告显示2035年,人工智能可能会让12个发达国家的经济增长率翻一倍。简单重复的工作可能很快就被被机器所取代。

AI+时代,人工智能改变的3要素:核心技术、行业专家、行业大数据。而在这个AI时代,应用才是硬道理。科大讯飞从1999年到现在,已经做了20年,在这期间,我们也是在从技术到产业方向上面做了许多探索,涉及的领域也非常广。

人工智能的应用主要表现在AI+教育,是我们投入力度最大,使用群体最广泛的应用方向。这一块主要是和国家部委一起通过人工智能的进行因材施教的工作。目前,教学产品覆盖师生数8000万,15000所学校应用,68所全国百强校。

还有AI+医疗、AI+交通、AI+司法、AI+智能客户、AI+移动场景、AI+公益、AI+智慧媒体等应用领域。除了这些我们主要在进行重大投入和积极研发产品落地外,我们也在积极的践行社会责任,比如我们的教育公益,2018年已经走过了全国13个省市,我们的医疗也是进入了全国多个贫困县,给他们做一些远程的服务。输入法这边也在做方言保护,也同时在做方言识别的研究。所以我们想是让科技有情怀,让公益暖人心。

不仅是科大讯飞在做自己的研究,我们也把核心能力开放出来,基于科大讯飞AIUI开放平台,希望和全社会一起,打造我们人工智能的产业生态。目前,我们这个平台总应用产品数已经超过57万,第三方创业团队已经超过92万,日均使用次数47亿次。所以这个量级非常庞大,而且这个数据在不断的攀升。

人工智能时代不仅是科大讯飞的时代,更是千千万万的开发者和科学家的时代。现在社会上可能普遍有个观点认为,人工智能可能会无所不能,会非常强大,马上会替代我们的工作。但其实并不是,我们一直强调理性的人工智能,比人类更强大的不是AI,而是掌握了AI的人类。所以AI赋能可以创造无限的可能性。

希望通过科大讯飞的平台,和千万万的开发者和全社会,产业内的企业一起,让AI赋能社会,让一切皆有可能。