首页>>科技 >>内容

基于人工智能的自然语言处理模型GPT-3分析

发布时间:2023-09-07 23:04:40编辑:温柔的背包来源:

很多朋友对基于人工智能的自然语言处理模型GPT-3分析不是很了解,每日小编刚好整理了这方面的知识,今天就来带大家一探究竟。

基于人工智能的自然语言处理模型GPT-3分析

1简介

人类社会正在从信息社会走向智能社会,计算已经成为推动社会发展的关键因素。在万物互联的数字文明新时代,传统的基于数据的计算已经不能满足人类对更高智能水平的追求。近年来,随着计算和信息技术的快速发展,以及深度学习的空前普及和成功,人工智能(AI)已经被确立为人类探索机器智能的前沿领域。

此后产生了一系列突破性的研究成果,包括Yann LeCun提出的卷积神经网络和Yoshua Bengio在深度学习因果推理领域的成果。

2016年3月,DeepMind推出的人工智能围棋程序AlphaGo与世界顶级围棋选手李世石对弈,引起了全球范围内前所未有的关注。这场划时代的人机大战以AI的压倒性胜利而告终,成为将AI浪潮推向新高度的催化剂。

AI的另一个重要推动者是大规模预训练模型的出现,这些模型已经广泛应用于自然语言和图像处理,以借助迁移学习来处理各种应用。其中,自然语言处理模型GPT-3最具代表性。已经证明,具有高结构复杂度和大量参数的大模型可以提高深度学习的性能。

计算能力是支撑智能计算的重要因素之一。面对信息社会庞大的数据源、异构的硬件配置和不断变化的计算需求,智能计算主要通过纵向和横向架构来满足智能任务的计算能力需求。垂直架构的特点是同构计算基础设施,主要通过应用智能方法提高资源利用效率来提升计算能力。

相比之下,水平架构协调和调度异构和广域计算资源,以最大化协作计算的效果。例如,2020年4月,针对全球新冠肺炎研究的计算需求,Folding@home在三周内加入了40万计算志愿者,实现了2.5Exaflops的计算能力,超越了世界上任何一台超级计算机。尽管在智能和计算方面取得了巨大的成功,但我们仍然在这两个领域面临一些重大挑战:智能方面的挑战。

使用深度学习的AI目前在可解释性、普遍性、进化和自主性方面面临重大挑战。与人类的智能相比,目前的大多数AI技术都很弱,只能在特定的领域或任务中发挥良好的作用。从基于数据的智能升级到更多样化的智能,包括感知智能、认知智能、自主智能和人机一体化智能,也面临着巨大的理论和技术挑战。计算挑战。

数字化浪潮带来了应用、连接、终端、用户和数据的空前增长,这些都需要巨大的计算能力。满足如此快速增长的计算能力需求变得越来越具有挑战性。智能社会中的巨型任务依赖于各种特定计算资源的有效组合。另外,传统的硬件模型不能很好地适应智能算法,制约了软件的发展。

到目前为止,智能计算还没有一个普遍接受的定义。考虑到人类社会空间、物理空间和信息空间这三个世界基本空间日益紧密的融合,我们从解决复杂科学和社会问题的角度出发,提出了智能计算的新定义:智能计算是支持万物互联的数字文明时代新的计算理论方法、架构体系和技术能力的总称。

智能计算可以根据具体的实际需求,以最小的成本完成计算任务,匹配足够的计算能力,调用最佳的算法,得到最佳的结果。

智能计算的新定义是为了应对人类社会、物理世界和信息空间三重融合的快速增长的计算需求而提出的。智能计算以人为本,追求高计算能力、高能效、智能化和安全性。其目标是提供通用、高效、安全、自主、可靠和透明的计算服务,以支持大规模和复杂的计算任务。图1是智能计算的整体理论框架,体现了支持人类社会、物理世界和信息空间融合的各种计算范式。

图1:基于人类社会空间、物理空间和信息空间整合的智能计算概述2。智能计算是数字文明时代支撑万物互联的新计算理论、方法、架构体系和技术能力的总称。使用智能计算,可以实现经典和前沿研究领域的许多创新,以解决复杂的科学和社会问题。智能计算的基本要素包括人类的智能、机器的能力和由万物组成的物理世界。

在理论框架中,人是智能计算的核心,是智慧的源泉,代表原始的、先天的智能,称为元智能。元智能包括理解、表达、抽象、推理、创造和反思等高级人类能力,包括积累的知识。元智能(Meta-intelligence)是基于碳基生命,由个体和生物群体数百万年的进化产生的。它包括生物的具身智能、大脑智能(尤其是人脑)和群体智能。所有的智能系统都是由人类设计和建造的。

因此,在智能计算的理论体系中,人类的智慧是智能的源泉,计算机是人类智能的赋能。我们称计算机的智能为普遍智能。通用智能代表计算机解决具有广泛外延的复杂问题的能力,由以硅基设施为载体的个体和群体计算设备产生。生物智能可以在以下四个层次移植到计算机上:数据智能、感知智能、认知智能和自主智能。元智力和一般智力如图2所示。

图2:元智能和一般智能智能计算面临大场景、大数据、大问题和无处不在的需求的挑战。算法模型越来越复杂,需要超级计算能力来支持越来越多的模型训练。目前,计算资源已经成为提高计算机智能研究水平的障碍。随着智能算法的发展,拥有丰富计算资源的机构可能会形成系统的技术垄断。经典的超级计算机已经很难满足AI对计算能力的需求。

虽然通过算法优化可以在一定程度上降低算力需求,但并不能从根本上解决这个问题。需要从架构、加速模块、集成模式、软件栈等多个维度进行全面优化,如图3所示。

图3:智能计算的计算能力智能计算

在理论技术上具有以下特点(图4):理论技术上的自学习和可进化性,架构上的高计算能力和高能效,系统方法上的安全性和可靠性,运行机制上的自动化和精确性,以及服务性上的协作和泛在性。智能计算包括两个本质方面:智能和计算,两者相辅相成。

智能促进了计算技术的发展,计算是智能的基础。提高计算系统性能和效率的高级智能技术范式是「智能驱动的计算」。支持计算机智能发展的高效、强大的计算技术范式是「面向智能的计算」。

两种基本范式从五个方面进行创新,提升计算能力、能源效率、数据使用、知识表达和算法能力,实现泛在、透明、可靠、实时、自动化的服务。

图4:智能计算的特征3 智能驱动的计算

提高计算的普适性对智能计算至关重要。现实场景中的问题,例如模拟、图(gragh)(图5)等,需要进行各种计算。智能计算的另一个关键点是如何提高计算的智能化水平。从经验上来说,我们常常需要向自然界的智能生物学习,计算也不例外,例如三大经典智能方法:人工神经网络(图6)、模糊系统和进化计算,都是受生物智能启发提出的算法。

智能计算理论包括但不限于以上几种计算,以实现高度的泛在化和智能化。

图5:图计算的技术架构

图6:典型神经元的结构和人工神经元的结构

智能系统在开始工作之前,首先要进行智能感知。因此,感知智能在所有智能系统中都起着至关重要的作用。感知智能的重点是多模态感知、数据融合、智能信号提取和处理。

典型的例子包括智慧城市管理、自动潜水系统、智能防御系统和自主机器人。感知智能研究中最热门的领域是模拟人类的五种感觉能力,视觉、听觉、嗅觉、味觉和触觉。

此外,智能传感还包括温度、压力、湿度、高度、速度、重力等,需要大量的计算或数据训练来提高其性能。

近年来,随着模式识别和深度学习技术的全面应用,机器的感知智能已经超过人类,在语音、视觉和触觉识别方面取得了重大进展。由于其日益增长的重要性和日益拓宽的应用领域,智能传感器受到了广泛关注。如图7所示,智能传感器具有各种形式以满足不同应用的需求,并且更新更好的型号正在被不断的开发出来。

图7:工业中需要连接到物联网的的各种传感器类型

认知智能是指机器具有像人一样的逻辑理解和认知能力,特别是思考、理解、总结和主动应用知识的能力。它描述了智能体在真实环境中处理复杂事实和情况的能力。数据识别是感知智能的核心功能,需要对图像、视频、声音等各类数据进行大规模的数据采集和特征提取,完成结构化处理。

相比之下,认知智能需要理解数据元素之间的关系,分析结构化数据中的逻辑,并根据提炼出的知识做出响应。

认知智能计算主要研究机器的自然语言处理、因果推理和知识推理(图8)等领域。通过对人脑的神经生物学过程和认知机制的启发式研究,可以提高机器的认知水平,以使其获得帮助、理解、决策、洞察和发现的能力。

图8:知识推理概述

机器从被动输出到主动创造有两个关键要素:强泛化模型和与外部环境的持续交互。自主智能的发展路径从学习单一任务开始,举一反三,逐步达到与环境动态交互的主动学习,最终实现自我进化的高级智能。当前可以通过迁移学习、元学习和自主学习等技术寻找生成自主智能的可行路径。

尽管在智能的四个层面上(数据智能,感知智能,认知智能,自主智能)取得了重大进展,但目前仅通过计算/统计模型还难以从极其复杂的场景中实现完全的智能。

在这些场景中,人类应该继续在解决问题和决策中发挥不可或缺的作用,来探索人类认知过程中涉及的要素,并将其与机器智能相结合。下一步,将聚焦于人机交互、人机融合和脑机接口等技术。

4 面向智能的计算

AI的发现不断涌现,这在很大程度上归功于不断增长的计算能力。AI的快速变化是由新思想或革命性理论推动的。通常,最新的先进模型仅依赖于更大的神经网络和更强大的处理系统。

Open AI研究人员在2018年进行了一项研究,追踪基于计算能力的最大模型的增长情况。利用AI研究史上训练的一些最著名的AI模型所需的计算量,他们发现了计算资源快速增长的两个趋势。

开发突破性模型所需的计算能力的增长速度与摩尔定律大致相同,即在2012年之前,单个微芯片的计算能力往往每两年翻一番。但图像识别系统AlexNet在2012年发布时引起了人们的新兴趣。AlexNet的引入刺激了顶级模型的计算需求急剧增加,从2012年到2018年,这种需求每3到4个月翻一番,如图9所示。

图9:过去十年计算能力需求的增长大大超过宏观趋势

当摩尔定律失效时,超大算力主要依赖于海量计算、内存和存储资源的并行叠加。

例如,「高性能计算」是指将大量计算机快速联网成一个「集群」以进行密集计算的做法,使用户能够比传统计算机更快地处理大量数据,从而获得更深入的洞察力和竞争优势。

此外,得益于云计算(图10),用户现在可以选择增加其高性能计算程序的容量,从而继续提高算力。

图10:云、雾和边缘计算的表示

推进智能计算架构创新的目标包括更高效的能源管理、更低的功耗、更便宜的总芯片成本以及更快速的错误检测和纠正。当涉及某些无法在CPU上执行的AI操作时,AI加速器可能会大大减少训练和执行时间。

在短期内,所使用加速器的架构专业化将是保持计算能力增长的最佳方式,如图11所示为已公开发布的AI加速器和处理器的峰值性能与功耗。

另外,内存计算(图12)是一个非常有效的方案,它能够使内存单元执行原始逻辑操作,因此它们可以在不需要与处理器交互的情况下进行计算,这是内存和处理器之间不断扩大速度差距的主要原因。

图11:公开发布的AI 加速器和处理器的峰值性能与功耗散点图

图12:计算的三种概念方法:(a)传统数字计算,(b)近内存阵列计算(NMAC)和(c)内存阵列计算(IMAC)

复杂性是传统计算机进一步突破的瓶颈。当今高度复杂的AI模型(例如深度神经网络)在边缘设备中仍然难以实现普遍使用。这是由于运行这些模型的高级GPU和加速器存在功率和带宽紧缩的缺陷,导致处理时间长并且架构设计繁琐。

由于这些问题,研究人员开始创造新的计算模式,主要包括:

量子计算(图13),因为其具有纠缠或其他非经典相关性带来的量子优势,可以在许多复杂的计算问题中实现指数速度;

神经形态计算(图14)的构造和操作受到大脑中神经元和突触的启发,因其能源效率高而非常适合计算,神经形态计算是事件驱动和高度并行化的,这意味着只有小部分系统同时工作,所以消耗的功率非常小;

光子计算(图15)与电神经网络相比具有许多优势,包括超高带宽、快速计算速度和高并行性,所有这些都是通过使用光子硬件加速来计算复杂的矩阵向量乘法来实现的;

生物计算(图16)是利用生物系统固有的信息处理机制发展起来的一种新的计算模型,主要包括蛋白质计算机、RNA计算机和DNA计算机,具有并行和分布式计算能力强、功耗低的优势。

图13:显示复杂性等级之间关系的图表(a)以及用于识别和评估可能的量子优势的流程图(b)

图14:传统计算系统和类脑计算系统的结构

图15:深度神经网络,包括传统网络和电子光子网络

图16:生物计算可能提供优于传统计算机的性能

5 智能计算的应用

如果要跟上当前科学的快速发展,就必须不断的进行革新。现在正在进行的计算机革命的融合将以前所未有的方式极大地推动科学发现的进步。

几十年来,计算材料(图17)已成为研究材料特性和设计新材料的有力手段。然而,由于材料和材料行为的复杂性,它们的应用面临许多挑战,包括缺乏许多原子、离子以及原子和离子相互作用的力场和电位,分子动力学模拟中的不同热力学相,以及优化材料成分和工艺参数的巨大搜索空间。

作为一种新的研究范式,AI集成到计算材料中是对传统计算材料的革命,并且已经在多长度、多时间尺度、多物理场耦合计算方面取得了巨大成功。

图17:材料/分子科学范式的比较

作为最古老的观测科学之一,天文学在历史上收集了大量数据。由于望远镜技术的突破,收集到的数据爆炸性增长。天文学和天体物理学领域的特点是拥有丰富的数据和各种大口径的地面望远镜,例如即将推出的大型巡天望远镜和天基望远镜。使用高分辨率相机和相关工具,数据收集现在更加高效,并且在很大程度上实现了自动化,必须进行更高效的数据分析。

因此,需要智能计算技术来解释和评估数据集。

药物设计同样受益于AI(图18),AI可以帮助科学家建立蛋白质的3D结构、模拟药物和蛋白质之间的化学反应以及预测药物的功效。在药理学中,AI可以用于创建靶向化合物和多靶点药物。利用AI还可以设计合成路线、预测反应产率并了解化学合成背后的机制。AI让重新利用现有药物来治疗新的治疗目标变得更加容易。

此外,AI对于识别不良反应、测定生物活性和获得药物筛选结果至关重要。

图18:不同的基于深度学习的药物-靶点相互作用预测算法对应不同的输入特征。(a)基于配体的方法,(b)基于结构的方法,和(c)基于关系的方法

随着大数据和AI技术使用的增长,作物育种开始进行融合与突破(图19)。AI技术可以支持服务的创建、模型的识别以及农业食品应用和供应链阶段的决策过程。AI在农业中的主要目标是准确预测结果并提高产量,同时最大限度地减少资源使用。因此,AI工具提供的算法可以评估产量,预测难以预见的问题或事件以及发生趋势。从种植到收获再到销售,AI促进了整个农业价值链。

图19:大数据与AI在植物育种中的结合

智能计算加速转型变革,导致经济和社会秩序的转变。由于技术进步,商品和劳动力市场正在发生巨大变化,数字社会正在逐渐形成(图20)。AI应该成为数字经济中每一个数据驱动战略的核心,包括工业4.0。例如,人工智能可以应用于预测性维护。预测性维护包括涉及通用设备或生产机械的维护,并使用来自生产线或运营线的传感器数据帮助降低运营费用或停机时间。

另外。AI可以应用于城市治理,通过开发新的策略和方法,使城市更智能。智慧城市治理旨在利用最先进的信息技术同步数据、程序、权限等,造福城市居民,主要包含四个方面:

智慧决策、智慧城市治理、智慧行政和智慧城市合作。

图20:数字社会的组成部分6 展望

从新兴产业生态的角度来看,智能计算产业仍面临着一系列挑战,决定着其未来发展。

第一,与传统计算理论相比,智能计算是语言和生物学驱动的计算范式的应用和发展。

这意味着机器可以根据不同的场景模仿人脑解决问题和决策的能力。然而,硅基和碳基运算的底层逻辑存在根本差异,大脑智能的机制仍有待进一步探索。智能计算的下一步是通过深入探索类人智能的基本要素,其在宏观层面的相互作用机制以及在微观层面上支持不确定性生成的计算理论,进行彻底的改革。

第二,探索人类如何学习并将其应用到AI的研究中具有重要意义。

知识驱动的机器智能可以从人类活动中学习,模仿人脑的决策能力,使机器能够像人一样感知、识别、思考、学习和协作。需要探索多知识驱动的知识推理和持续学习的理论和关键技术,使智能系统具有类人的学习、感知、表示和决策能力,促进智能计算从数据驱动向知识驱动演进。

第三,软硬件适配面临着巨大的挑战,如精度损失、调用困难、协作效率低下等。

未来,计算机必须突破冯诺依曼体系结构下固定的输入和处理范式,大力发展交叉学科的智能计算和仿生学。在算法层面进行设计,突破现有架构的局限,以更低的计算和硬件设计成本尝试更灵活、更人性化的数据处理方式。此外,开发高性能、低能耗的新型组件设计方案,提高软件和硬件的计算能力和效率,以满足快速增长的需求和智能计算应用也很重要。

第四,智能计算的理论技术架构是一个复杂的系统,具有多个与其他学科相互作用的子系统。

系统中的各种硬件需要更复杂的系统设计,更好的优化技术,以及系统调优的更大成本。高维计算理论复杂性的缺乏是大规模计算系统面临的主要挑战。

7 结论

当前,我们正迎来人类发展的第四次浪潮,正处于从信息社会向人类社会-物理世界-信息空间融合的智能社会的关键转型期。在这种转变中,计算技术正在经历变革,甚至是颠覆性的变化。

智能计算被认为是未来计算的发展方向,不仅是面向智能的计算,而且是智能赋能的计算。它将提供通用、高效、安全、自主、可靠和透明的计算服务,以支持当今智能社会中大规模和复杂的计算任务。

本文全面回顾了智能计算的理论基础、智能与计算的技术融合、重要应用、挑战和未来方向。

我们希望这篇综述能为研究人员和从业者提供一个很好的参考,并促进未来智能计算领域的理论和技术创新。

黄飞

以上知识分享希望能够帮助到大家!