首页>>科技 >>内容

人工智能生成歌词,利用人工智能识别歌曲风格,从而进行分类

发布时间:2023-10-23 22:20:16编辑:温柔的背包来源:

人工智能生成歌词,利用人工智能识别歌曲风格,从而进行分类

很多朋友对人工智能生成歌词,利用人工智能识别歌曲风格,从而进行分类不是很了解,每日小编刚好整理了这方面的知识,今天就来带大家一探究竟。

任何编辑过磁带或Spotify播放列表的人都知道,当他们在歌曲中传达某种情感时,他们就会成功。这也是Gracenote的音乐数据专家长期以来将世界上纷繁复杂的音乐按照情绪和情感进行分类的原因。

Gracenote团队实际上并没有一首接一首地听他们数据库里的几百首歌。而是教会了计算机识别情绪,用机器来听,用人工智能(AI)来判断一首歌的风格,从而判断它是梦幻的、性感的还是纯粹悲伤的。“机器学习是我们拥有的一个巨大的战略优势,”Gracenote总经理BrianHamilton在最近的一次采访中说。

据悉,Gracenote在10年前就开始了所谓的“语音情感分类”工作。随着时间的推移,传统算法越来越多地被先进的神经网络算法所取代,这项工作也发生了演变。这也成为音乐行业越来越依赖人工智能的最好例子之一。比如电脑怎么知道LadyGaga的Lovegame是一首性感的热歌?

首先,人工智能不知道你的感受。“我们不知道音乐作品会对个人听众产生什么影响,”Gracenote的研究副总裁在接受采访时说。相反,它试图将音乐家的创作意图视为一种内在的情感品质,并区分这些品质。换句话说:它想教会计算机识别哪些歌是悲伤的,而不是哪些歌会让听众感到悲伤,因为你的感受可能会因为个人经历而不同。

教计算机识别音乐中的情绪有点像心理治疗。首先,你得说出你的感受。Gracenote的音乐团队最初制定了一个分类标准,包括100多种气氛和情绪,然后将标准扩展到400多个类别。

有一些是性感、时尚等经典类别,但也有一些极其特定的类别,比如梦幻、苦乐参半的温柔、绝望的疯狂。不断添加新的类别,而其他类别则根据系统的性能进行微调。“这是一个更新的过程,”Gracenote的内容架构和探索总监Peterdi Maria解释道。“分类是不断发展和演变的。”

除了这一系列的情感,Gracenote还使用所谓的“训练集”进行机器学习。该公司的音乐专家挑选了大约4万首歌曲作为不同种类歌曲的样本。编译这个训练集本身就是一门艺术。迪玛利亚说:“我们需要确保提供正确的例子。”同时,榜样歌曲一定是这些情感的最好例证。他说,“有些歌风格有点模糊。”

目前的培训内容包括LadyGaga的Lovegame,是性感热歌的典范;电台司令的《金字塔颂》是忧伤风格的一个例子;碧昂斯的《梅瑟尔菲》是感性和亲密风格的典范。就像情绪本身一样,训练集需要不断更新以保持新鲜。迪玛利亚说:“艺术家们一直在创造新的音乐表达方式。我们需要确保系统听到了这些声音。”尤其是快速增长的音乐类型,如电音、嘻哈等,需要经常更新。

对于计算机来说,它可以将压缩的歌曲识别为一种音乐风格。一旦该系统在这些歌曲中得到训练,它将被应用于数百万首歌曲。但是电脑不会一首一首的听完播放列表上的所有歌曲。

相反,Gracenote的系统将每个音轨切割成700毫秒的片段,然后从任何这样的片段中提取大约170个不同的声学值,例如它们的音色。另外,有时候一首歌需要更长的片段来区分相似的风格。然后将这些值与现有数据进行比较,从而对每首歌曲进行分类。

结果不仅得到了情感风格,而且得到了每种情感风格的文件。与此同时,Gracenote的团队必须确保在常规基础上不出现任何错误。“混合是一件非常复杂的事情。”乐器、人声和各种效果叠加在一起,音乐本身也会根据在车载音响和流媒体中播放的不同进行优化:所以电脑能听的东西太多了,包括不属于音乐本身的东西。“它可以捕捉许多不同的东西,”他说。

在没有监督的情况下,Gracenote的系统可能会决定专注于压缩的部分,并将它们与情绪相匹配,而Cremer开玩笑说,系统可能会决定:“这些都是96kbps,所以这些歌曲属于悲伤风格。”按情感分类的世界音乐

Gracenote根据情绪对音乐进行分类,然后它会把数据传递给客户,客户通过各种方式使用。较小的媒体服务商通常会授权Gracenote获取他们的音乐数据,进行端到端的音乐排序和推荐。例如,媒体中心应用程序开发商Plex利用该公司的音乐推荐技术为客户提供个性化播放列表和被该公司称为“情感收音机”的服务。

Plex用户可以选择“苦乐参半的温柔”风格,然后等待听到MazzyStar的迷幻声音。

Gracenote还向业内一些最大的音乐服务运营商提供数据,包括苹果和Spotify。这些大公司通常不喜欢公开谈论他们如何使用Gracenote的数据。较大的流媒体服务公司倾向于使用自己的音乐推荐算法,但他们通常会使用Gracenote的情感数据来训练和改进这些算法,或者帮助策展人预选歌曲,然后编辑成播放列表。

这意味着粉丝可能会敏锐地意识到Gracenote在情感分类方面的工作,而其他人可能不会意识到该公司的人工智能技术如何帮助他们改善音乐体验。无论如何,Gracenote必须确保其数据得到适当的国际转码,尤其是当它即将在其他国家开展业务时。

该公司宣布,将开始在欧洲和拉丁美洲销售其音乐数据产品,包括情感分类标准和分类中使用的描述性和整洁的元数据。为了保证在这个转码过程中没有损失,公司聘请了国际编辑,他们不仅翻译了“感伤”这个词,还听了一些歌曲,找出在他们的文化背景下,哪种表达方式最有效。国际关注是双向的。

Gracenote还不断在世界各地寻找新的国际声音,以满足其培训集的需求。“我们的数据可以用于所有那些即将消失的声音,”他说。像Gracenote这样的公司,不仅依靠人类,还依靠人工智能、机器监控等技术;最终,我们将能够对世界上所有的音乐进行分类。在许多方面,教计算机识别悲伤的歌曲实际上可以帮助人们获得更好、更有意义的音乐体验。

如果仅仅依靠人类来分类,将会有数百万首歌曲无法分类,人们无法获得个性化的音乐列表。利用数据和技术解锁世界音乐是他工作中最激动人心的部分之一。克雷默说,“我在这里的原因是为了确保每个人都能接触到所有正确分类的音乐。”

以上知识分享希望能够帮助到大家!