首页>>科技 >>内容

讯飞超级大脑

发布时间:2023-09-16 12:26:29编辑:温柔的背包来源:

讯飞超级大脑

很多朋友对讯飞超级大脑不是很了解,每日小编刚好整理了这方面的知识,今天就来带大家一探究竟。

科大讯飞研究副总裁维斯博士规划及研究成果

科大讯飞维斯维斯博士,1999年肥东一中高中毕业生,现为中国科技大学工学博士,科大讯飞研究院副院长,科大讯飞首席科学家。2017年入选《麻省理工科技评论》全球青年科技创新人才中的“远见者”,代表深度学习和语音识别的创新精神。韦思学识渊博,思维敏捷,谦虚好学,富于表现力,幽默风趣,善于深入浅出地讲解理学的渊博知识。

科大讯飞研究院副院长,讯飞超脑项目及研究成果负责人,带领团队开发了新的语音识别框架。与传统的深度学习模型相比,它增加了一个“记忆块”模块来存储对判断当前语音帧有用的历史信息和未来信息,可以大大缩短响应时间。

近年来,科大讯飞是中国讨论最多的人工智能公司。然而,大多数人对讯飞的了解仅限于其语音技术。事实上,科大讯飞有一个更大的目标,——,打造“讯飞超级大脑”。讯飞超脑计划以“从听到说到理解再到思考”为目标,旨在实现基于仿人神经网络的认知智能引擎,预期结果是实现全球首个中文认知智能计算引擎。

卫思是“讯飞超脑”项目的主要负责人之一。1999年进入中科大电子工程与信息科学系,2008年获得中科大工学博士学位。从那年起,他一直在科大讯飞研究所工作。如今,科大讯飞研究院副院长韦思也是讯飞语音技术的核心人物。

基于讯飞超脑计划,科大讯飞正在以语音和语言为入口,开始一场“认知革命”。六年来,讯飞的语音识别技术准确率从60.2%提升到95%以上。

准确率提升的背后,是韦思领导的团队研发的语音识别新武器“——”,一种叫做“前馈序列记忆网络”(FSMN)的新框架。据韦思介绍,与传统的深度学习模型相比,前馈顺序记忆网络增加了一个“记忆块”模块,用于存储对判断当前语音帧有用的历史信息和未来信息,从而实现语音识别中的“端到端”建模。

结合其他技术点后,讯飞基于FSMN的语音识别框架在性能上有了很大提升。这种新的模式可以大大缩短响应时间,比如可以将原来的一周缩短到一天,提高培训效果。

FSMN确保了语音识别的准确性,但这还不够。一个总的趋势是,几乎所有做语音技术的人工智能公司,都会追求语音合成更高的自然度。至此,卫思领导团队实现了全新的基于深度学习的语音合成系统,进一步提升了合成语音的自然度和表现力。

在美国麻省理工学院、卡内基梅隆大学等国际知名科研机构参与的全球最高级别语音合成大赛暴雪挑战赛中,维斯团队研发的系统连续11年夺冠,7项指标均居世界第一,是所有参赛队伍中唯一超过自然人发音水平的系统。

当然,对于正在采取“平台赛道”扩张模式的讯飞来说,无论是哪条赛道,都离不开技术的积累,而卫思多年科研工作的成果也迎来了新的机遇。

例如,他创造性地提出了多种中英文语音评测算法,并带领团队取得了国际领先的成果。现在,他们已经能够将相关测评技术应用到普通话测试和教学中,英语口语测试系统在国内外首次达到人工测评员的水平。该技术的主要特点是实现了考试管理的信息化和考试手段的现代化。

在说话人语言识别的研究中,卫思提出了基于深度神经网络的语言识别算法,大大提高了语言识别的效果,成为业界所有语言识别系统的标准配置。

类似的案例还有很多,韦思的技术之旅也不再局限于语音:他带领团队提出了基于CNN的离线手写识别策略,在世界上首次实现了试卷扫描自动阅卷系统;在人工智能-认知智能领域,韦思带领团队在国际著名的常识推理竞赛Winograd Schema Challenge 2016中获得第一名。该任务是国际常识推理领域的一项新评估任务,被学术界普遍认为是取代图灵测试衡量机器智能水平的重要学术挑战.

如果说有什么东西驱使卫思不断创新,那一定是他对现有技术的“不满”。“虽然近年来深度神经网络的兴起大大提高了语音识别的性能,但我们不能迷信现有的技术,总有一天新技术会取代现有技术,”韦思曾在一篇博文中写道。

回顾语音识别的发展历史和讯飞语音识别系统的最新进展,他也发现技术突破总是艰难而缓慢的,重要的是坚持和保持思考。他也坚信“现在是一个伟大的时代。”

“那么,在这个伟大的时代,我们的旅程是什么?我觉得有一句话可以表达我自己或者讯飞研究院这么多年的思考,那就是:在中国,你可以改变世界”。韦思认为,在这10年里,中国原创能力的蓬勃发展已经显现,与全世界同台竞技,“我们没有怯场”。

展望未来10年,韦思和他的团队还有几个小目标:把讯飞研究院打造成世界知名的研究机构,培养一批世界一流的科学家,最终解决几个基础科学问题。未来10年、20年,我们终于可以触摸到智能的本质,解开智慧的奥秘。

以上知识分享希望能够帮助到大家!