首页>>互联网 >>内容

Databricks推出用于构建高质量RAG应用程序的新工具

发布时间:2023-12-08 14:12:02编辑:可爱的眼神来源:

您准备好提高您的品牌知名度了吗?考虑成为人工智能影响之旅的赞助商。详细了解这里的机会。

Databricks推出用于构建高质量RAG应用程序的新工具

今天,Databricks宣布为其数据智能平台推出新的检索增强生成( RAG ) 工具,以帮助客户构建、部署和维护针对不同业务用例的高质量大语言模型 (LLM) 应用程序。

这些工具从今天开始提供公共预览版,解决了开发生产级 RAG 应用程序的关键挑战。这些范围从提供来自不同来源的相关实时业务数据,到将该数据与目标应用程序的正确模型相结合,以及监控该应用程序的毒性和其他经常困扰法学硕士的问题。

RAG 是什么?为什么这么难?

法学硕士风靡一时,但大多数模型都包含参数化知识,这使得它们在以光速响应一般提示时非常有用。为了使这些模型更新并满足特定主题,尤其是内部业务需求,企业考虑检索增强生成或 RAG。它是一种利用某些特定数据源来进一步提高模型的准确性和可靠性并提高其响应的整体质量的技术。想象一下,一个模型正在接受人力资源数据的训练,以帮助员工解决不同的问题。

RAG 涉及多个层面的工作。您必须从多个系统收集最新的结构化和非结构化数据,进行准备,将其与正确的模型、工程师提示、监控等相结合。这是一个支离破碎的过程,导致许多团队的 RAG 应用程序表现不佳。

Databricks 如何提供帮助

借助其数据智能平台中的新 RAG 工具,Databricks 正在解决这一挑战,使团队能够结合所有方面并快速制作原型并将高质量的 RAG 应用程序投入生产。

例如,借助新的矢量搜索和特征服务功能,构建复杂管道以将数据加载到定制服务层的麻烦就消失了。所有结构化和非结构化数据(来自 Delta 表)都会自动提取并与 LLM 应用程序同步,确保它能够访问最新的相关业务信息,以提供准确的上下文感知响应。

“Unity Catalog 自动跟踪所服务数据集的离线和在线副本之间的沿袭,使调试数据质量问题变得更加容易。它还一致地强制执行在线和离线数据集之间的访问控制设置,这意味着企业可以更好地审核和控制谁正在查看敏感的专有信息。”Databricks 的联合创始人兼工程副总裁 Patrick Wendell 和神经网络首席技术官 Hanlin Tang 在一份联合报告中写道博客文章。

然后,通过统一的 AI Playground 和 MLFlow 评估,开发人员能够访问来自不同提供商的模型,包括Azure OpenAI Service、AWS Bedrock 和 Anthropic 以及Llama 2和MPT等开源模型,并了解它们在关键指标上的表现例如毒性、延迟和令牌计数。这最终使他们能够通过模型服务将项目部署在性能最佳且最实惠的模型上 ,同时保留在出现更好的情况时进行更改的选择。