首页>>科技 >>内容

人工智能算法工程师证书,人工智能的重要算法之一--LSTM算法

发布时间:2023-08-27 23:48:34编辑:温柔的背包来源:

很多朋友对人工智能算法工程师证书,人工智能的重要算法之一--LSTM算法不是很了解,每日小编刚好整理了这方面的知识,今天就来带大家一探究竟。

人工智能算法工程师证书,人工智能的重要算法之一--LSTM算法

长短期记忆神经网络LSTM是一种特殊的RNN,可以学习长期依赖性。

它是由Hochreiter和Schmidhuber (1997)提出的,在后来的工作中被很多人调整和推广(除了原作者,还有很多人对现代LSTM做出了贡献,不完全统计:费利克斯格斯(目前在谷歌的DeepMind工作)、弗雷德卡明斯、圣地亚哥费尔南德斯、费利克斯格斯(发明了LSTM遗忘门)、贾斯汀拜尔(自动进化)、金奎大威斯特拉、朱利安托格柳斯、福斯迪安戈麦斯、马泰奥加格利奥洛和亚历克斯格雷夫斯)

LSTM在大量的问题上取得了显著的成果,现在正被广泛应用。

LTSM的概念:长短-$ TERM记忆神经网络(LSTM)是一种时间递归神经网络,适用于处理和预测时间序列中具有相对较长间隔和延迟的重要事件。长期和短期记忆神经网络LSTM与其说是一个循环神经网络,不如说是其组件的增强版本。具体来说,就是用一个长时记忆的模块代替循环神经网络中隐含层的小圆,如下图所示。

LTSM的精髓:将自循环引入LSTM,生成一条长时间梯度连续流动的路径的巧妙思路,是最初LSTM模型的核心贡献。其中一个关键的扩展是使自循环的权重依赖于上下文,而不是固定的。通过选通这个自循环的权重(由另一个隐藏单元控制),可以动态改变累积的时间尺度。除了外部的RNN循环,LSTM循环网络还有内部的LSTM环流(自循环)。

LSTM通过精心设计避免了长期依赖的问题。请记住,长期信息是LSTM在实践中的默认行为,而不是需要付出高昂代价才能获得的能力。LSTM原理:LSTM与RNN不同,它在算法中增加了一个“处理器”,用来判断信息是否有用。这个处理器的结构叫做细胞。

一个牢房有三扇门,分别叫输入门、遗忘门、输出门。当一个消息进入LSTM网络时,可以根据规则判断它是否有用。只会留下符合算法认证的信息,不符合的信息会通过遗忘门被遗忘。

无非是一进两出的工作原理,却能解决神经网络长期以来在重复运算下的大问题。目前已经证明LSTM是解决长阶依赖问题的有效技术,而且这种技术非常通用,导致了很多可能的变化。研究人员根据LSTM提出了他们自己版本的变量,这使得LSTM能够处理不断变化的垂直问题。

LSTM深度分析:LSTM有能力通过一个精心设计的名为“门”的结构来删除或添加细胞状态的信息。门是一种让信息选择性通过的方式。它包含一个sigmoid神经网络层和一个逐点乘法运算。Sigmoid层输出一个介于0和1之间的数值,描述每个部分可以通过多少。0代表“不允许任何量通过”,1代表“允许任何量通过”!

LSTM有三个门(输入门、遗忘门和输出门)来保护和控制单元状态。标准LSTM: 1)决定丢弃信息:2)确定更新信息:3)更新细胞状态:4)输出信息:LSTM的变体:1)窥视孔连接:2)耦合遗忘门和输入门:3) GRU(门控递归单元):

LSTM应用场景:LSTM已经在很多科技领域得到应用。基于LSTM的系统可以学习翻译语言、控制机器人、图像分析、文档摘要、语音识别、图像识别、手写识别、控制聊天机器人、预测疾病、点击率和股票、合成音乐。

2015年,谷歌通过基于CTC培训的LSTM计划,大大提高了Android手机和其他设备的语音识别能力。百度也用CTC;苹果的iPhone用的是LSTM;在QucikType和Siri中;微软不仅使用LSTM进行语音识别,还使用这项技术生成虚拟对话图像和编写程序代码。

亚马逊Alexa通过双向LSTM与用户在家中交流,而谷歌更广泛地使用LSTM。可以生成图像字幕,自动回复邮件。它包含在新的智能助手Allo中,也显著提高了谷歌翻译的质量。目前,谷歌数据中心的很大一部分计算资源正在执行LSTM任务。

结论:长短期记忆网络LSTM是一种时间递归神经网络,适用于处理和预测时间序列中具有相对较长间隔和延迟的重要事件。LSTM在使用RNN方面是一个飞跃。LSTM算法广泛应用于人工智能的机器学习、语言翻译、机器人控制、图像分析、文档摘要、语音识别、图像识别、手写识别、机器人控制、疾病预测、点击率和股票、合成音乐等领域。

以上知识分享希望能够帮助到大家!