百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Oracle SelectAI RAG - 数据库自动化RAG整个过程

ccwgpt 2025-03-06 12:49 86 浏览 0 评论

RAG的过程

实现一个RAG,自己需要写代码实现这样的两个阶段:

  1. 数据加载阶段:文件加载 -> 文件分片 -> 内容向量化 -> 存入向量库 -> 建立向量索引
  2. 检索阶段:用户问题 -> 向量化用户问题 -> 向量语议检索出相关内容 -> 问题增强(提示词) -> 提交给大语言模型 -> 返回结果。

Oracle 23ai RAG

RAG是一个面向数据的检索方法,因此,由数据层面的基础设施完成数据相关的工作是比较合理的。

Oracle 23ai 推出了 SelectAI RAG,用户不再需要写代码就可以实现整个RAG的过程,直接用SQL语句就可以返回RAG的结果:

详细配置步骤

主要包括以下这些步骤(前面六步是数据加载(Data Loading)的配置)。

  1. Data Loading Step1: Whitelist the provider for API access
BEGIN
   -- allow connecting to outside hosts
    DBMS_NETWORK_ACL_ADMIN.APPEND_HOST_ACE(
        host => '*',
        ace => xs$ace_type(privilege_list => xs$name_list('connect'),
                           principal_name => 'OUSER',
                           principal_type => xs_acl.ptype_db));
END;
/
  1. Data Loading Step2: Create Credential for Vector Embedding
declare
  jo json_object_t;
begin
  jo := json_object_t();
  jo.put('user_ocid','ocid1.user.oc1..aaaaaaaaxxxxxxx');
  jo.put('tenancy_ocid','ocid1.tenancy.oc1..aaaaaaaaxxxxxx');
  jo.put('compartment_ocid','ocid1.compartment.oc1..aaaaaaaapxxxxxxx');
  jo.put('private_key','private key content string');
  jo.put('fingerprint’,’xx:xx:xx:…');

  dbms_vector.create_credential(
    credential_name   => 'VECTOR_OCI_GENAI_CRED',
    params            => json(jo.to_string));
end;
/
  1. Data Loading Step3: Create Embedding Profile
BEGIN
  DBMS_CLOUD_AI.CREATE_PROFILE(
    profile_name => 'OCI_TEXT_TRANSFORMER',
    attributes   => '{"provider": "oci",
                      "credential_name": "VECTOR_OCI_GENAI_CRED",
                      "embedding_model": "cohere.embed-multilingual-v3.0",
                      "oci_compartment_id": "ocid1.compartment.oc1..aaaaaaaa…",
                      "region": "us-chicago-1"
                      }');
END;
/
  1. Data Loading Step4: Create Credential for Object Storage and OCI LLM Service
begin
    DBMS_CLOUD.CREATE_CREDENTIAL (
      credential_name => 'OCI_GENAI_CRED',
      user_ocid => 'ocid1.user.oc1..aaaaaaaaxxxxxx',
      tenancy_ocid => 'ocid1.tenancy.oc1..aaaaaaaaxxxxxx',
      private_key => 'private key string',
      fingerprint => 'xx:xx:xx……' );
end;
/
  1. Data Loading Step5: Create Vector Index For Files in Object Storage
BEGIN
  DBMS_CLOUD_AI.CREATE_VECTOR_INDEX(
    index_name  => 'DEMO_VECTOR_INDEX',
    attributes  => '{"vector_db_provider": "oracle",
                     "location": "https://objectstorage.{region}.oraclecloud.com/n/{namespace}/b/{bucket}/o/{folder}",
                     "object_storage_credential_name": "OCI_GENAI_CRED",
                     "profile_name": "OCI_TEXT_TRANSFORMER",
                     "vector_dimension": 1024,
                     "vector_distance_metric": "cosine",
                     "chunk_overlap":128,
                     "chunk_size":1024,
                     "refresh_rate":120}');
END;
/
-- refresh_rate 这里设成了120分钟,表示每隔2小时数据库会自动检查对象存储中的内容变化及自动更新数据
  1. Data Loading Step6: Create SelectAI Profile
BEGIN
  DBMS_CLOUD_AI.CREATE_PROFILE(
    profile_name => 'PROFILE_OCI_SELECTAI_RAG_LLAMA33_70B',
    attributes   => '{"provider": "oci",
                      "credential_name": "OCI_GENAI_CRED",
                      "vector_index_name": "DEMO_VECTOR_INDEX",
                      "temperature": 0,
                      "max_tokens": 4000,
                      "model": "meta.llama-3.3-70b-instruct",
                      "embedding_model": "cohere.embed-multilingual-v3.0",
                      "oci_compartment_id": "ocid1.compartment.oc1..aaaaaaaa…",
                      "region": "us-chicago-1",
                      "enable_sources": true }');
END;
/

完成前面六步数据加载的配置后,上传相关的一些文档到指定的对象存储目录,就可以通过SQL语句直接查询RAG结果了,比如:

“什么是 ADB Schema Advisor?” 这个问题,通过 SQL 可以直接查看:

EXEC DBMS_CLOUD_AI.SET_PROFILE('PROFILE_OCI_SELECTAI_RAG_LLAMA33_70B’);
                               
SELECT AI NARRATE '什么是 ADB Schema Advisor?’;

得到如下结果:

非常简单方便,数据库直接帮我们做了整个RAG的过程,应用程序就只要像执行传统的SQL一样获取结果就行了。

相关推荐

腾讯开源框架TarsCpp-rpc设计分析-server(二)

2Tars协议2.1是什么借用官方说法:TARS编码协议是一种数据编解码规则,它将整形、枚举值、字符串、序列、字典、自定义结构体等数据类型按照一定的规则编码到二进制数据流中。对端接收到二进制数据流...

微服务调用为什么用RPC框架,http不更简单吗?

简单点,HTTP是协议,RPC是概念!实现RPC可以基于HTTP协议(Feign),TCP协议(Netty),RMI协议(Soap),WebService(XML—RPC)框架。传输过程中,也因为序列...

go-zero:开箱即用的微服务框架(gin框架微服务)

go-zero是一个集成了各种工程实践的Web和rpc框架,它的弹性设计保障了大并发服务端的稳定性,并且已经经过了充分的实战检验。go-zero在设计时遵循了“工具大于约定和文档”的理...

SOFARPC :高性能、高扩展性、生产级的 Java RPC 框架

#暑期创作大赛#SOFARPC是一个高性能、高扩展性、生产级的JavaRPC框架。在蚂蚁金服,SOFARPC已经使用了十多年,已经发展了五代。SOFARPC致力于简化应用程序之间的RPC...

自研分布式高性能RPC框架及服务注册中心ApiRegistry实践笔记

痛点1.bsf底层依赖springcloud,影响bsf更新springboot新版本和整体最新技术版本升级。2.eureka已经闭源,且框架设计较重,同时引入eureka会自行引入较多sprin...

Rust语言从入门到精通系列 - Tonic RPC框架入门实战

Rust语言是一种系统级语言,被誉为“没有丧失性能的安全语言”。Rust语言的优势在于其内存安全机制,在编译时就能保证程序的内存安全。Tonic模块是Rust语言的一个RPC(RemoteProce...

腾讯开源框架TarsCpp-rpc设计分析-client(一)

前言Tars是腾讯开源的微服务平台,包含了一个高性能的rpc框架和服务治理平台,TarsCpp是其C++版本。对于以C++为主要开发语言,同时还想深入了解rpc和微服务框架具体实现的同学来说,Tars...

设计了一款TPS百万级别的分布式、高性能、可扩展的RPC框架

为啥要开发RPC框架事情是这样的,在开发这个RPC框架之前,我花费了不少时间算是对Dubbo框架彻底研究透彻了。冰河在撸透了Dubbo2.x和Dubbo3.x的源码之后,本来想给大家写一个Dubbo源...

rpc框架使用教程,超级稳定好用,大厂都在使用

rpc是什么远程调用协议如何使用导入依赖<dependency><groupId>org.apache.dubbo</groupId><art...

Layui 框架实战:动态加载 Select 与二级联动全解析

在现代Web开发中,下拉选择框(Select)是用户输入数据时不可或缺的组件。很多时候,我们需要的选项并非静态写死在HTML中,而是需要根据业务逻辑从后端动态获取。更有甚者,我们可能需要实现“...

15个能为你节省数百小时的前端设计神器,从UI库到文档生成

无论你是刚开始开发之旅的新手,还是疲于应付生产期限的资深程序员,有一个真理始终不变:正确的工具能彻底改变你的工作流程。多年来,我测试了数百个开发工具——有些实用,大多数平庸。但有一批免费网站经受住了时...

Layui与WinForm通用权限管理系统全解析

嘿,小伙伴们,今天咱们来聊聊Layui和WinForm这两个框架在通用权限管理系统中的应用。别担心,我会尽量用简单易懂的语言来讲解,保证让大家都能跟上节奏!首先说说Layui。Layui是一个前端UI...

纯Python构建精美UI!MonsterUI让前端开发效率飙升

“无需CSS知识,告别类名记忆,11行代码实现专业级卡片组件”在传统Web开发中,构建美观界面需要同时掌握HTML、CSS、JavaScript三剑客,开发者不得不在多种语言间频繁切换。即使使用Boo...

WebTUI:将终端用户界面(TUI)之美带到浏览器的CSS库

在当今Web技术飞速发展的时代,界面设计愈发复杂多样。然而,随着现代化工具的广泛使用,一些开发者开始回归极简风格,追求一种简洁而富有韵味的设计。WebTUI正是这样一款CSS库,它将经典的终...

人教版二年级下册生字描红汇总(拼音+笔顺+描红),可打印!

可定制内容,评论区留言。本次整理的为人教版二年级下册所有生字,共计300个;写字是小学阶段一项重要的基本功训练,把汉字写得正确、工整、美观,可以提高运用汉字这一交际工具的准确性和效率。对小学生进行写字...

取消回复欢迎 发表评论: