如今,无论是科学技术还是社会生产,无不越来越多的依赖数据来驱动。
正如以色列历史学家尤瓦尔·赫拉利所说,我们将进入一个数据宗教的时代。
如果说数据是数据密集型社会新的生产要素,那么人工智能就是新的生产方式。一场以大数据和人工智能为代表的智能革命正在悄然发生。
举例来说,在一次全世界多种机器翻译系统评比中,谷歌翻译领先第二名近5%,而这个差值在以往需要5-10年才能达到。谷歌之所以能做到,就是因为用了比其他研究所更多的数据。在自然语言处理领域,科学家都清楚数据的重要性,语音识别同样如此。
而为了让数字探索者拥有更成熟更丰富的训练环境,京东金融举办的对话语音识别大赛在国内首次开放数千小时的脱敏对话语音数据,并提供强大的GPU资源以保障算力,为广大的语音技术爱好者、企业开发者提供学习和交流的平台。
站在这个历史节点上,有的人浑然不知,有的人已在同高手过招。
在京东金融对话语音识别大赛进入如火如荼的决赛阶段时,京东金融News君面对面采访了该比赛的幕后出题团队。
这是个年轻的数据科学家团队,由来自中科院、清华、北大、北航以及海外留学人才组成,最小的只有24岁。
羞涩的科学家们摆拍了一张“大合照”
他们此前在视觉识别方面已经做了众多的技术突破,从猪脸识别、智能养殖到金融场景验证识别等。
而出题小组所开发的针对客服语音的智能质检,在过去短短的一年间,就从数据积累、算法实现到落地场景,并逐渐实现从感知到认知,给情感打分,推进全量质检。
以下内容为京东金融NEWS君与语音识别小组对话录:
NEWS君:现在语音识别赛事非常少,你们想要做这次大赛的初衷是什么?
语音识别小组:我们希望帮助该领域的从业者、爱好者接触真实的业务场景,以开放的心态做交流,促进语音识别技术的普及和发展。以产学研共享资源的方式通过竞技平台提升技术的实用性和普适性。
NEWS君:这么官方的话术?
语音识别小组:是真的。从事人工智能研究是很孤独的事情。虽然说AI技术发展很快,实际上大部分还是企业在把持核心技术,为什么呢?对于从业者、爱好者来说,最有优势的是他们自己的思想,但很多人缺少数据和算力的保障,因此较难有技术上质的突破。数据和算力成为了阻拦很多从业者、爱好者入门的门槛,和技术能力提升的瓶颈。
NEWS君:所以你们希望为这些孤独的算法科学家们建一个实战和沟通的平台?
语音识别小组:对。AI技术要素无非就是数据、算法和算力,要想实现技术突破缺一不可。虽然近几年语音识别技术发展较快,但由于对数据和算力的要求较高,因此入门的门槛也较高。
首先是数据异常稀缺。目前开源的语音数据集以英文语音数据集为主,而使用英文语音数据集训练出的模型,在国内的一些场景下适用性会存在问题。
近两年国内的一些研究机构和企业也开始开放中文语音数据集,但数据集时长有限,且多以录制的语音为主。可见,中文的语音数据集非常的稀缺,其中客服场景下的对话语音数据更甚。拥有客服对话语音数据的企业非常的少,一般需要达到一定规模的大企业才有能力提供。
此次京东金融首次开放5000小时的中文客服对话语音数据,成为国内对话语音中首次开放的、且时长最长的语音数据集。
此外,为了保障运算能力,我们为晋级决赛的参赛队伍提供强大的GPU资源,每组选手都可以使用一台独立的装载8块V100显卡的GPU物理机,我们此次提供的计算资源就价值上百万。
投入如此大的财力、物力的背后,是因为我们想打破数据和资源的限制,让更多的人有机会接触到产业界真实的业务场景和数据,为从业者、爱好者提供互相学习和交流的平台,促进语音识别领域的技术发展。
NEWS君:语音识别技术会给我们的工作生活带来什么呢?
语音识别小组:以客服为例。客服是个人力资源密集型业务,做客服通话质检实际上挺痛苦的,一张图片你看0.1秒就可以看完,但是10秒钟的声音就得听10秒,这是个耗时又费力的工作。所以以往的客服电话很难实现人力的全量质检,只能以抽检的方式进行。
现在,我们的语音识别能力能做到每天自动全量质检数万通客服电话,不仅使机器代替人工降低成本,而且极大地提高了质检效率。
此外,我们的客服通话语音识别准确率也已达到业内顶尖水平。虽然这个准确率和人机交互场景下的语音识别相比要低一些,但在人和人对话场景下已经是行业中一个较大的突破。
NEWS君:您刚才提到,客服场景下的对话识别难度更大一些,与人机交互语音识别相比难在哪里?
语音识别小组:这次大赛的赛题设定就是,真实客服场景下的对话语音识别,其难点在于,对话语音数据是人和人的真实环境下的对话数据,相比人机交互的语音数据和录制的语音数据,其内容更加随意,不确定性也更大,受到外界的影响因素也更多。
比如客服对话中有的用户会有很重的方言,或者周围环境比较嘈杂,对话内容是断断续续的,而且人和人在对话中情绪的交互会更多……这些因素都大大提升了客服对话场景下语音识别的难度,这也是此次比赛中给选手设定的挑战。
NEWS君:语音识别大赛已经进入决赛阶段了。大赛之后,你们有什么持续推动人工智能行业的计划吗?
语音识别小组:本次语音识别大赛只是个开始,JDD空间站最终要做的是,成为国内首个距离产业界最近的数字探索者社区。
社区将以数据为桥梁,技术为纽带,连接数字探索者和产业,不但为数字探索者打造实现自我价值的平台,同时也帮助合作伙伴发现优秀人才与前沿技术,助力企业提升数据和AI能力,让科技与商业应用快速融合,实现价值的最大化。
这样的目标其实在去年京东金融举办JDD全球数据探索者大会及大赛时,就已经得到了验证。去年大赛中关注最多的赛题“猪脸识别”引起了不小的轰动,也引领了一波新的技术和场景创新。借由此次赛题,京东金融自己也孵化了“智能养殖”的创新项目,尝试在传统养殖行业进行技术革新,把人工智能的领先技术落地到传统行业中。
在去年JDD猪脸识别大赛中以C位出道的忧郁小猪,代号:317.jpg
JDD空间站将围绕AI技术三要素:数据、算法和算力,建立一条AI生态链,打通这条生态链中的各个环节。平台不仅会持续举办AI方向最前沿的赛事,同时还会开放更多数据集和底层资源,供更多的开发者自由探索,去挖掘更多有价值的算法。
最后JDD会帮助开发者与顶层市场打通,作为服务变现的通道,桥接AI产业内的企业与人才,成为AI产业内的助推器,促进人工智能行业的发展。
NEWS君:出题团队有没有什么想对参赛者说的?
语音识别小组:不要压抑自己的天性,来参赛吧,人工智能没有想象中的那么遥远。
我们本次办赛的目的就是希望提供给大家互相学习和交流的机会,我们相信只要你愿意参与就一定会有收获。
(本文信息仅供参考,市场有风险,交易需谨慎,据此投资操作风险自担。)
---------------------------------------------
科记汇(微信公众号:kejihui007)记者平台,新锐TMT、金融新闻深度看。原创内容与上百家媒体共享。欢迎约访、投稿、合作。