首页>>科技 >>内容

机器学习与深度学习,深度学习到底是什么

发布时间:2023-09-02 17:34:34编辑:温柔的背包来源:

机器学习与深度学习,深度学习到底是什么

很多朋友对机器学习与深度学习,深度学习到底是什么不是很了解,每日小编刚好整理了这方面的知识,今天就来带大家一探究竟。

人工智能和第四次工业革命一样,正在从学术界的占有变成一种可以改变世界的力量。特别是以深度学习取得的进步为标志。它让爬行了60年的人工智能一鸣惊人。我们正在一个新大陆着陆。人工智能和第四次工业革命一样,正在从学术界的占有变成一种可以改变世界的力量。特别是以深度学习取得的进步为标志。它让爬行了60年的人工智能一鸣惊人。

我们正在一个新大陆着陆。深度学习带来的这一重大技术革命,可能会颠覆过去20年互联网对技术的认知,实现技术体验的跨越式发展。那么,什么是深度学习呢?如何理解其重要性?先说概念和现象。我总结了一句话,学术上可能不严谨,但从我的理解角度来说,——深度学习是基于多层神经网络,以海量数据为输入,规则自学习的方法。这里有几个关键词:

第一个关键词叫做多层神经网络。基于深度学习的多层神经网络并不新鲜,在上世纪80年代甚至被认为是没有前途的,但近年来科学家不断优化多层神经网络的算法,取得了突破。

以前的很多算法都是线性的。而这个世界上大多数事物的特征都是复杂的,非线性的。例如,猫的图像包含颜色、形状、面部特征和光线等各种信息。深度学习的关键是通过多层非线性映射成功分离这些因素。那为什么深?多层神经网络比浅层有什么优势?

简单来说,你可以减少参数。因为它重用了中间层的计算单元。我们以认猫为例。它可以学习猫的分层特征:底层从原始像素开始,描绘局部边缘和线条;中间层结合各种边缘来描述不同类型的猫器官;顶层描述了整只猫的全局特征。

它需要超强的计算能力,同时又有大量的数据输入。特别是在信息表示和特征设计方面,过去严重依赖人力,严重影响了有效性和通用性。深度学习彻底颠覆了“人工特征”的范式,开启了“表征学习”——的数据驱动范式,从数据中提取特征,计算机发现规则,进行自我学习。

你可以理解,过去人们自己用经验。在深度学习中?经验以数据的形式存在。所以深度学习是一种在计算机上从数据生成模型的算法,也就是深度学习算法。问题来了。几年前谈大数据和各种算法和深度学习有什么区别?

以前算法模式数学上叫线性,X和Y的关系是对应的,是函数的映射。然而,这种算法在海量数据面前遇到了瓶颈。在国际著名的ImagineNet图像分类大赛中,传统算法无法降低识别错误率,但深度学习后大大降低。2010年,获奖系统只能正确标注72%的图片;到2012年,多伦多大学的GeoffHiton利用深度学习的新技术,带领团队达到了85%的准确率。

在2015年的ImagineNet大赛中,一个深度学习系统首次以96%的准确率超过了人类(人类的平均准确率为95%)。

计算机读图的能力已经超过了人。特别是在图像、语音等复杂应用中,深度学习技术取得了优越的性能。为什么?其实是一种思维上的创新。举几个脑洞大开的例子。1.先说计算机识别猫。我们通常可以用许多属性来描述一个事物。这些属性中的一些可能是关键和有用的,而另一些可能是无用的。我们称属性为特征。特征识别是一个数据处理的过程。

传统算法通过标注各种特征来识别猫。只有大眼睛,胡子和图案。但是这个特写说有些猫和老虎不能分开,狗和猫不能分开。这个方法调用——个人来制定规则,机器学习这样的规则。深度学习方法呢?直接给你一百万张图,说这里有猫,再给你百万张图,说这里没有猫。然后训练一个深度网络,通过深度学习学习猫的特征,计算机就知道谁是猫了。

2.第二个例子是谷歌训练机器人抓取。传统的方法一定是在那里看到一个机械手,写一个函数,移动到xyz标记的空间点,用程序实现一次抓取。谷歌现在使用机器人训练一个深度神经网络,帮助机器人根据摄像头输入和电机命令预测抓取的结果。简单来说就是训练机器人手眼协调能力。机器人会观察自己的机械臂,实时修正抓取动作。

所有的行为都是通过学习自然产生的,而不是依赖于传统的系统程序。为了加快学习过程,谷歌使用了14个机器人同时工作。经过近3000小时的训练,相当于80万次抓取尝试,它开始看到智能反应行为的出现。公开资料显示,未经训练的机械手前30次的失败率为34%,但经过训练后,失败率降至18%。这是一个自我学习的过程。3.有人问,深度学习能学会写文章吗?

看看这个例子。斯坦福大学的计算机博士Andrejkapathy用托尔斯泰的小说《战争与和平》来训练神经网络。每训练100轮,就叫写文章。100轮后,机器知道要求空格,但仍有乱码。500回合后,我能正确拼写一些短单词。1200回合后,还有标点符号和长词。2000回合后,更复杂的句子也能正确拼写。整个进化过程是怎样的?

以前我们写文章,只是讲主客体。在上述过程中,根本没有人告诉机器语法规则。甚至你不用告诉它标点和字母的区别。不要告诉机器任何程序。只要不断训练原始数据,一层一层,最后输出结果——就是一句可以理解的话。一切看起来都很有趣。人工智能和深度学习的妙处也在这里。

4.我还去硅谷看过一家公司,——,完全颠覆了之前的算法,用深度学习来收集图像深度信息。

众所周知,现在市面上已经有无人机了,可以实现人体追踪。它的方法是什么?一个人,在图像系统中,是一堆色块的组合。手动选择特征,例如颜色特征和渐变特征。以简单的颜色特征为例:比如你穿了绿色的衣服,突然走进草丛,你可能会丢失。或者,他脱了衣服,几个人靠得很近,容易走失。

此时,若想在这个基础上继续优化,将颜色特征进行某些调整,是非常困难的。而且调整后,还会存在对过去某些状况不适用的问题。

总之,这样的算法需要不停迭代,迭代又会影响前面的效果。

而硅谷这个团队,利用深度学习,把所有人脑袋做出来,只区分好前景和背景。区分之后,背景全部用数学方式随意填充,再不断生产大量背景数据,进行自学习。只要把前景学习出来就行。

据我所知,很多传统方法,还在采用双目视觉。用计算机去做局部匹配,再根据双目测出的两个匹配的差距,去推算空间另一个点和它的三角位置,从而判断离你多远。

可想而知,深度学习的出现,使得很多公司辛苦积累的软件算法直接作废了。

“算法为核心竞争力”,正在转变为,“数据为核心竞争力”。

技术人员必须进入新的起跑线。

5.最后再举个例子。

大家都做过胃镜。尤其胃痛,很痛苦。肠胃镜要分开做,而且小肠看不见。

有一家公司出了一种胶囊摄像头。吃进去后,在你的消化道,每5秒拍一幅图,连续摄像,此后再排出胶囊。所有关于肠道胃部的问题,全部完整记录。但医生光把那个图看完,就需要五个小时。原本的机器主动检测漏检率高,要医生复查。

后来,他们采用深度学习。采集8000多例图片数据灌进去,用机器不断学,不仅提高诊断精确率,减少了医生的漏诊,以及对稀缺好医生的经验依赖。只需要靠机器自己去学习规则。

深度学习算法,可以帮助医生作出决策。

了解完深度学习,接着思考一个问题——20世纪70年代末80年代初,个人电脑突飞猛进时,人工智能的商业化却步履维艰。乔布斯曾这样定义个人计算机的价值——“它是我们思维的自行车”。那么,今天的人工智能呢?深度学习呢?它给我们真正带来的东西是什么?未来,对行业和社会有什么影响?中国公司的机会在哪?

以上知识分享希望能够帮助到大家!