RAG的过程

实现一个RAG，自己需要写代码实现这样的两个阶段：

数据加载阶段：文件加载 -> 文件分片 -> 内容向量化 -> 存入向量库 -> 建立向量索引
检索阶段：用户问题 -> 向量化用户问题 -> 向量语议检索出相关内容 -> 问题增强(提示词) -> 提交给大语言模型 -> 返回结果。

Oracle 23ai RAG

RAG是一个面向数据的检索方法，因此，由数据层面的基础设施完成数据相关的工作是比较合理的。

Oracle 23ai 推出了 SelectAI RAG，用户不再需要写代码就可以实现整个RAG的过程，直接用SQL语句就可以返回RAG的结果：

详细配置步骤

主要包括以下这些步骤（前面六步是数据加载（Data Loading）的配置）。

Data Loading Step1: Whitelist the provider for API access

BEGIN
   -- allow connecting to outside hosts
    DBMS_NETWORK_ACL_ADMIN.APPEND_HOST_ACE(
        host => '*',
        ace => xs$ace_type(privilege_list => xs$name_list('connect'),
                           principal_name => 'OUSER',
                           principal_type => xs_acl.ptype_db));
END;
/

Data Loading Step2: Create Credential for Vector Embedding

declare
  jo json_object_t;
begin
  jo := json_object_t();
  jo.put('user_ocid','ocid1.user.oc1..aaaaaaaaxxxxxxx');
  jo.put('tenancy_ocid','ocid1.tenancy.oc1..aaaaaaaaxxxxxx');
  jo.put('compartment_ocid','ocid1.compartment.oc1..aaaaaaaapxxxxxxx');
  jo.put('private_key','private key content string');
  jo.put('fingerprint’,’xx:xx:xx:…');

  dbms_vector.create_credential(
    credential_name   => 'VECTOR_OCI_GENAI_CRED',
    params            => json(jo.to_string));
end;
/

Data Loading Step3: Create Embedding Profile

BEGIN
  DBMS_CLOUD_AI.CREATE_PROFILE(
    profile_name => 'OCI_TEXT_TRANSFORMER',
    attributes   => '{"provider": "oci",
                      "credential_name": "VECTOR_OCI_GENAI_CRED",
                      "embedding_model": "cohere.embed-multilingual-v3.0",
                      "oci_compartment_id": "ocid1.compartment.oc1..aaaaaaaa…",
                      "region": "us-chicago-1"
                      }');
END;
/

Data Loading Step4: Create Credential for Object Storage and OCI LLM Service

begin
    DBMS_CLOUD.CREATE_CREDENTIAL (
      credential_name => 'OCI_GENAI_CRED',
      user_ocid => 'ocid1.user.oc1..aaaaaaaaxxxxxx',
      tenancy_ocid => 'ocid1.tenancy.oc1..aaaaaaaaxxxxxx',
      private_key => 'private key string',
      fingerprint => 'xx:xx:xx……' );
end;
/

Data Loading Step5: Create Vector Index For Files in Object Storage

BEGIN
  DBMS_CLOUD_AI.CREATE_VECTOR_INDEX(
    index_name  => 'DEMO_VECTOR_INDEX',
    attributes  => '{"vector_db_provider": "oracle",
                     "location": "https://objectstorage.{region}.oraclecloud.com/n/{namespace}/b/{bucket}/o/{folder}",
                     "object_storage_credential_name": "OCI_GENAI_CRED",
                     "profile_name": "OCI_TEXT_TRANSFORMER",
                     "vector_dimension": 1024,
                     "vector_distance_metric": "cosine",
                     "chunk_overlap":128,
                     "chunk_size":1024,
                     "refresh_rate":120}');
END;
/
-- refresh_rate 这里设成了120分钟，表示每隔2小时数据库会自动检查对象存储中的内容变化及自动更新数据

Data Loading Step6: Create SelectAI Profile

BEGIN
  DBMS_CLOUD_AI.CREATE_PROFILE(
    profile_name => 'PROFILE_OCI_SELECTAI_RAG_LLAMA33_70B',
    attributes   => '{"provider": "oci",
                      "credential_name": "OCI_GENAI_CRED",
                      "vector_index_name": "DEMO_VECTOR_INDEX",
                      "temperature": 0,
                      "max_tokens": 4000,
                      "model": "meta.llama-3.3-70b-instruct",
                      "embedding_model": "cohere.embed-multilingual-v3.0",
                      "oci_compartment_id": "ocid1.compartment.oc1..aaaaaaaa…",
                      "region": "us-chicago-1",
                      "enable_sources": true }');
END;
/

完成前面六步数据加载的配置后，上传相关的一些文档到指定的对象存储目录，就可以通过SQL语句直接查询RAG结果了，比如：

“什么是 ADB Schema Advisor?” 这个问题，通过 SQL 可以直接查看：

EXEC DBMS_CLOUD_AI.SET_PROFILE('PROFILE_OCI_SELECTAI_RAG_LLAMA33_70B’);
                               
SELECT AI NARRATE '什么是 ADB Schema Advisor?’;

得到如下结果：

非常简单方便，数据库直接帮我们做了整个RAG的过程，应用程序就只要像执行传统的SQL一样获取结果就行了。

相关推荐

腾讯开源框架TarsCpp-rpc设计分析-server(二): 2Tars协议2.1是什么借用官方说法：TARS编码协议是一种数据编解码规则，它将整形、枚举值、字符串、序列、字典、自定义结构体等数据类型按照一定的规则编码到二进制数据流中。对端接收到二进制数据流...

微服务调用为什么用RPC框架，http不更简单吗?: 简单点，HTTP是协议，RPC是概念！实现RPC可以基于HTTP协议（Feign），TCP协议(Netty)，RMI协议（Soap），WebService（XML—RPC）框架。传输过程中，也因为序列...

go-zero:开箱即用的微服务框架（gin框架微服务）: go-zero是一个集成了各种工程实践的Web和rpc框架，它的弹性设计保障了大并发服务端的稳定性，并且已经经过了充分的实战检验。go-zero在设计时遵循了“工具大于约定和文档”的理...

SOFARPC :高性能、高扩展性、生产级的 Java RPC 框架: #暑期创作大赛#SOFARPC是一个高性能、高扩展性、生产级的JavaRPC框架。在蚂蚁金服，SOFARPC已经使用了十多年，已经发展了五代。SOFARPC致力于简化应用程序之间的RPC...

自研分布式高性能RPC框架及服务注册中心ApiRegistry实践笔记: 痛点1.bsf底层依赖springcloud,影响bsf更新springboot新版本和整体最新技术版本升级。2.eureka已经闭源，且框架设计较重，同时引入eureka会自行引入较多sprin...

Rust语言从入门到精通系列 - Tonic RPC框架入门实战: Rust语言是一种系统级语言，被誉为“没有丧失性能的安全语言”。Rust语言的优势在于其内存安全机制，在编译时就能保证程序的内存安全。Tonic模块是Rust语言的一个RPC（RemoteProce...

腾讯开源框架TarsCpp-rpc设计分析-client(一): 前言Tars是腾讯开源的微服务平台，包含了一个高性能的rpc框架和服务治理平台，TarsCpp是其C++版本。对于以C++为主要开发语言，同时还想深入了解rpc和微服务框架具体实现的同学来说，Tars...

设计了一款TPS百万级别的分布式、高性能、可扩展的RPC框架: 为啥要开发RPC框架事情是这样的，在开发这个RPC框架之前，我花费了不少时间算是对Dubbo框架彻底研究透彻了。冰河在撸透了Dubbo2.x和Dubbo3.x的源码之后，本来想给大家写一个Dubbo源...

rpc框架使用教程，超级稳定好用，大厂都在使用: rpc是什么远程调用协议如何使用导入依赖<dependency><groupId>org.apache.dubbo</groupId><art...

Layui 框架实战:动态加载 Select 与二级联动全解析: 在现代Web开发中，下拉选择框（Select）是用户输入数据时不可或缺的组件。很多时候，我们需要的选项并非静态写死在HTML中，而是需要根据业务逻辑从后端动态获取。更有甚者，我们可能需要实现“...

15个能为你节省数百小时的前端设计神器，从UI库到文档生成: 无论你是刚开始开发之旅的新手，还是疲于应付生产期限的资深程序员，有一个真理始终不变：正确的工具能彻底改变你的工作流程。多年来，我测试了数百个开发工具——有些实用，大多数平庸。但有一批免费网站经受住了时...

Layui与WinForm通用权限管理系统全解析: 嘿，小伙伴们，今天咱们来聊聊Layui和WinForm这两个框架在通用权限管理系统中的应用。别担心，我会尽量用简单易懂的语言来讲解，保证让大家都能跟上节奏！首先说说Layui。Layui是一个前端UI...

纯Python构建精美UI!MonsterUI让前端开发效率飙升: “无需CSS知识，告别类名记忆，11行代码实现专业级卡片组件”在传统Web开发中，构建美观界面需要同时掌握HTML、CSS、JavaScript三剑客，开发者不得不在多种语言间频繁切换。即使使用Boo...

WebTUI:将终端用户界面(TUI)之美带到浏览器的CSS库: 在当今Web技术飞速发展的时代，界面设计愈发复杂多样。然而，随着现代化工具的广泛使用，一些开发者开始回归极简风格，追求一种简洁而富有韵味的设计。WebTUI正是这样一款CSS库，它将经典的终...

人教版二年级下册生字描红汇总(拼音+笔顺+描红)，可打印!: 可定制内容，评论区留言。本次整理的为人教版二年级下册所有生字，共计300个；写字是小学阶段一项重要的基本功训练，把汉字写得正确、工整、美观，可以提高运用汉字这一交际工具的准确性和效率。对小学生进行写字...

Oracle SelectAI RAG - 数据库自动化RAG整个过程

RAG的过程

Oracle 23ai RAG

详细配置步骤

相关推荐

取消回复欢迎你发表评论:

使用cheat engine修改unity游戏（cheat engine教程）

1分钟了解Tableau

钉钉打卡虚拟定位赶快点赞收藏吧!

超级硬核的钉钉模拟wifi，定位，远程打卡教程

足不出户便能环游世界!手机发微信朋友圈如何定位到国外?

6米跨度柱子一般多大?框架结构的柱子应该设置多大?

项目使用 Jfrog Artifactory 制品库

.NET 多版本 WinForm 开源控件库 SunnyUI 技术解析与示例代码

美国陆军游骑兵和长程侦察巡逻部队军服图册

SpringBoot的starter到底是什么?

Oracle SelectAI RAG - 数据库自动化RAG整个过程

RAG的过程

Oracle 23ai RAG

详细配置步骤

相关推荐

取消回复欢迎 你 发表评论:

使用cheat engine修改unity游戏（cheat engine教程）

1分钟了解Tableau

钉钉打卡虚拟定位赶快点赞收藏吧!

超级硬核的钉钉模拟wifi，定位，远程打卡教程

足不出户便能环游世界!手机发微信朋友圈如何定位到国外?

6米跨度柱子一般多大?框架结构的柱子应该设置多大?

项目使用 Jfrog Artifactory 制品库

.NET 多版本 WinForm 开源控件库 SunnyUI 技术解析与示例代码

美国陆军游骑兵和长程侦察巡逻部队军服图册

SpringBoot的starter到底是什么?

取消回复欢迎你发表评论: