首页>>百科 >>内容

用于企业生成式AI的英伟达NeMo Retriever发布

发布时间:2023-11-30 14:17:22编辑:可爱的眼神来源:

NVIDIA 在 AWS re:Invent 大会上推出了 NVIDIA NeMo Retriever,这是一种新的生成式 AI 微服务,有望通过实现自定义大语言模型 (LLM) 与企业数据的集成来改善企业 AI 格局。NeMo Retriever 的目标是为企业中的人工智能应用程序提供前所未有的准确响应。

用于企业生成式AI的英伟达NeMo Retriever发布

NVIDIA NeMo Retriever 是 NeMo 系列的最新成员,以其先进的框架和工具而闻名,旨在构建、定制和部署尖端的生成式 AI 模型。这种企业级语义检索微服务旨在通过强大的检索增强生成 (RAG) 功能来增强生成式 AI 应用程序。

NeMo Retriever 的与众不同之处在于它能够通过 NVIDIA 优化的算法提供更准确的响应。该微服务允许开发人员将其人工智能应用程序无缝连接到不同的业务数据,无论其位置如何(跨云或数据中心)。它是 NVIDIA AI Enterprise 软件平台的一部分,可在 AWS Marketplace 中方便地获取。

NVIDIA NeMo 检索器已投入使用

Cadence、Dropbox、SAP 和 ServiceNow 等行业领导者与 NVIDIA 的合作已经感受到了该技术的影响。他们正在将这项技术集成到他们的定制生成人工智能应用程序和服务中,突破商业智能的可能性界限。

Cadence 总裁兼首席执行官 Anirudh Devgan 表示:“生成式 AI 引入了创新方法来满足客户需求,例如在设计过程早期发现潜在缺陷的工具。”

Cadence 是电子系统设计领域的全球领导者,它正在利用 NeMo Retriever 为工业电子设计中的 AI 应用开发 RAG 功能。Cadence 首席执行官 Anirudh Devgan 强调了生成式人工智能在及早发现设计缺陷方面的潜力,从而加速高质量产品的开发。

与开源 RAG 工具包不同,NeMo Retriever 以其生产就绪的立场进入市场,提供商业上可行的模型、API 稳定性、安全补丁和企业支持。其优化的嵌入模型是一项重大技术进步,可以捕获复杂的单词关系并增强法学硕士的处理和分析能力。

NeMo Retriever 将法学硕士连接到多个数据源和知识库的能力非常出色。它使用户能够通过简单的对话提示与数据进行交互,获得准确、最新的响应。此功能扩展到各种数据模式,包括文本、PDF、图像和视频,确保全面、安全的信息访问。

最令人兴奋的是,NVIDIA NeMo Retriever 承诺以更少的训练提供更准确的结果,从而加快上市时间并支持生成式 AI 应用程序开发工作流程中的能源效率。

这就是 NeMo Retriever 真正闪光的地方。通过将 RAG 与法学硕士集成,NeMo Retriever 克服了传统模型的局限性。RAG 将信息检索的能力与法学硕士结合起来,特别是对于开放域问答应用程序,从而显着增强了法学硕士对庞大、可更新知识库的访问能力。

RAG 管道一探究竟

NeMo Retriever 从离线阶段对知识库进行编码开始优化 RAG 流程。在此阶段,使用深度学习模型对各种格式的文档进行分块和嵌入,以生成密集的向量表示。然后将它们存储在矢量数据库中,这对于以后的语义搜索至关重要。嵌入过程是关键,因为它捕获单词之间的关系,使法学硕士能够更准确地处理和分析文本数据。

在幕后、生产中和回答问题是 NeMo Retriever 真正发挥作用的地方。它涉及两个关键阶段:从矢量数据库检索和响应生成。当用户输入查询时,NeMo Retriever 首先将此查询嵌入为密集向量,用它来搜索向量数据库。然后,该数据库检索与查询相关的最相关的文档块。在最后阶段,这些块被组合起来形成一个上下文,该上下文与用户的查询一起被输入到 LLM 中。此过程可确保生成的响应准确且与用户的查询高度相关。

借助 NVIDIA NeMo 克服企业挑战

为企业应用程序构建 RAG 管道是一项重大挑战。从现实世界查询的复杂性到多轮对话的需求,企业需要一个技术先进、合规且商业可行的解决方案。NeMo Retriever 旨在通过提供针对低延迟和高吞吐量进行优化的生产就绪组件来完成此任务,并承诺企业可以在其人工智能应用程序中部署这些功能。

NVIDIA 对这项技术的承诺延伸到不断改进其模型和服务,就像 NVIDIA 问答检索嵌入模型一样。NVIDIA 表示,作为转换器编码器,它已经过微调,可以利用私有和公共数据集为基于文本的问答提供最准确的嵌入。

用最先进的人工智能为企业赋能

NeMo Retriever 的实际应用广泛且多样。从 IT 和人力资源帮助助理到研发研究助理,NeMo Retriever 能够将法学硕士连接到多个数据源和知识库,使企业能够以更加对话、直观的方式与数据进行交互。NeMo Retriever 致力于增强用户体验并提高企业各个业务职能部门的效率和生产力。

渴望利用这项革命性技术的开发人员可以注册抢先体验 NVIDIA NeMo Retriever。

围绕这一版本的兴奋是显而易见的,因为它增强了当前的人工智能功能,并为企业领域采用法学硕士开辟了许多可能性。在最近的人工智能新闻中,“游戏规则改变者”这个词经常被提及。尽管如此,NeMo Retriever 仍然是连接生成式人工智能和可操作商业智能的基石,在先进的人工智能功能和现实企业应用程序之间架起了一座有形的桥梁。