首页>>科技 >>内容

阿里通义大模型发布新进展,“通义听悟”开放公测

发布时间:2023-11-07 08:24:10编辑:温柔的背包来源:

很多朋友对阿里通义大模型发布新进展,“通义听悟”开放公测不是很了解,每日小编刚好整理了这方面的知识,今天就来带大家一探究竟。

阿里通义大模型发布新进展,“通义听悟”开放公测

6月1日,“2023阿里云峰会粤港澳大湾区”在广州举行。峰会上,阿里云CTO周上台向业界宣布,阿里AI新品“依桐听吴”正式上线公测。依桐听力与依桐钱文大模型的理解和概括能力相连接,可以成为用户工作学习中强大的AI助手,帮助随时随地高效完成音视频内容的转录、检索、概括和整理,如大模型自动做笔记、访谈整理、PPT提取等。

在公测期间,用户可以获得超过100小时的免费转录时间。在过去的几个月里,中国发布了许多大型模型产品。阿里云也在4月7日向业界宣布,已经开发出大规模模型“依桐钱文”,并邀请用户进行公测体验。不到两个月,阿里云再次发布大模型迭代产品,产品进一步落地更专业的场景和应用。

(图1: 2023阿里云峰会CTO周发布大模型听讲摄影:电子发烧友网)阿里云CTO周说:“让我们改变方式,让音频和视频方便阅读、整理和分享。”他介绍,依桐听课是一款勤工俭学的AI助手,针对知识附加值高的音视频内容场景,如开会、上课、面试、培训、面试、直播、看视频、听播客等,并能通过大模型等最新AI技术快速提炼沉淀知识。

图2:阿里云丰富的应用领域,帮助提升办公效率(图:电子发烧友网)

根据现场演示,听力理解集成了十余项AI功能,可以全面提升从音视频到图形形式的知识转化效率。除了“好听力”,还能生成准确率很高的会议纪要,区分不同的发言人。这个AI助手“极其精明”。大模型可以把音视频分成章节并在一秒钟内形成总结,总结全文和每个演讲人的观点,整理重点和待办事项。

从大模型中一键提取PPT、针对多个音视频内容向AI提问、对具体段落进行总结等功能也将于近期上线。

一般意义听可以自动生成音频和视频的全文摘要、章节摘要和语音摘要。

此外,依桐听力据说还有一些细分场景的功能,比如用户打开Chrome插件,外语学习者和听障人士可以借助双语浮动标题栏随时随地观看带字幕的视频。

当时间表冲突时,听吴灿也成为专业人士的“会议身体替身”。默默加入AI可以记录会议,整理要点;转录结果可以作为字幕文件下载,方便新媒体从业者视频后期制作;听完理解后的问答复习,可以让记者、分析师、律师、HR等群体的采访效率更高。

依桐听歌Chrome插件将于近期向所有用户开放下载。另一个显著的优势是,听歌与阿里云盘连接时,云盘上的音视频内容可以一键转录。公测期间注册的用户还将获得阿里云盘上更多的存储空间,播放在线视频在云盘时可以自动贴字幕。这些是大模型新用户的好处。边肖在此推荐朋友们使用它,并在文章下方张贴您的体验反馈。依桐听歌支持一键导入阿里云音视频文件。

当然,中国还有其他公司正在制作一个大型的语音识别模型来生成单词。让我们来看看阿里云依桐听懂和这类产品的主要区别。图:阿里云CTO周

阿里云CTO周介绍,听力理解集成了阿里非常先进的语音和语言技术。内置阿里新一代工业级语音识别模型,识别准确率在多项权威中文数据集排名第一;自研语音语义的多模态说话人算法,可以区分10人以上的角色。接入“依桐千问”模型后,可以总结数万字的音视频内容,事实准确、要点完整国内领先,支持跨多个音视频内容的精准问答理解。

在史无前例的降价之后,阿里云再次送出了一个人人都能用的AI“大礼包”。此前,国内语音厂商AI音译定价达到每小时19.8元,而听音用户可以通过日常登录等多种任务获得免费音译时间。公测期间,阿里云官方微博、微信及各大平台社区还将大量发放20小时音译密码,用户获得的福利权益可累计,一年内有效,免费时长可高达100小时以上,市值数千元。

据了解,除了个人版,还有企业应用。此前,听听企业版已经在阿里集团广泛使用,帮助减少了大量会议的记录和整理工作,受到好评。同时,听力理解的能力也可以嵌入各种音视频平台,形成实时字幕、智能摘要等。典型的应用,比如钉钉flash,整合了听力理解。未来,听听还将在夸克APP、阿里云盘等端口提供服务。

虽然我们普通用户没有办法体验相关的海外版本,但是阿里云的AI模型可以在非常具体的办公场景下,利用人工智能来提高office的生产力。相信在不久的将来,国内互联网上会诞生新的超级应用APP产品。电子发烧友网有专业分析师跟进人工智能,紧跟行业带来第一手的资讯报告和分析。

以上知识分享希望能够帮助到大家!