百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

加密数据迁移二三事

ccwgpt 2025-02-27 14:32 47 浏览 0 评论

随着应用系统以及数据库的迭代更新,新旧系统之间往往需要进行大量的数据迁移。与此同时,在数据库中,越来越多的敏感数据是以加密的方式进行存储的。市场上不同的数据库产品之间关于数据加解密的接口实现以及使用上存在差异,导致在应用系统迁移的时候需要考虑更多的兼容性问题。

本文以KingbaseES数据库为例,谈谈如何规避或解决用户在加密数据迁移过程中可能出现的一些问题。

1、若用户选择了透明加密,迁移是否会遇到问题?

数据库透明加密是指对库内数据的加密和解密,对数据库的访问程序是完全无感知的。特别是应用系统,不需要做任何修改和编译,就能够直接应用到加密库上。因此,使用透明加密的应用通常不用关心加密处理,包括加密算法。

透明加密的数据如何迁移呢?

通常需要关注在算法的选择上。比如源数据库中数据是透明加密的,这类数据迁移到KingbaseES时,需要选择和源数据库的加密算法强度类似的加密算法,KingbaseES支持SM4和RC4算法,密钥由数据库内部随机生成,需要参照KingbaseES的《安全管理手册》文档设置透明加密。

透明加密使用的密钥都是数据库服务器负责生成和维护的,不用用户和应用指定,所以迁移时,不需要处理密钥。

2、若用户使用加密函数对数据进行加密,可能会遇到哪些问题?

2.1应该选择什么样的加解密函数?

与透明加密相对应的,是在应用系统中对数据进行加密,然后再存储到数据库中。需要真实数据的时候,从数据库中读取密文,应用程序再对数据进行解密得到明文。

这时候,用户对数据的加解密操作既可以使用外部自定义的函数,也可以采用数据库内置的加解密模块中函数来实现。

KingbaseES提供了一系列函数接口供用户使用,包括常规散列函数Digest用于MD5,SHA系列算法,HMAC等哈希运算,encrypt/decrypt函数支持AES算法对称加解密,gen_random_bytes()函数生成随机数等。

用户可根据当前业务的使用情况,将对应的接口使用迁移替换成KingbaseES的对应接口。比如,如果当前使用的是其他数据库的加解密接口,迁移到KingbaseES的话,用户需要将当前使用到的相关函数替换为KingbaseES的函数接口。此时,需要注意不同数据库的接口间存在差异,以常见的MD5哈希计算函数和AES数据加解密函数为例,比较如下:

1)MD5比较

数据库

哈希计算


KingbaseES

digest(data text, type text) returns bytea

digest(data bytea, type text) returns bytea

type支持MD5

MySQL

MD5(str)

Oracle

DBMS_CRYPTO.Hash(src IN RAW, typ IN PLS_INTEGER))

RETURN RAW;

typ支持HMAC_MD5

2)AES加解密函数比较

数据库

AES加解密


KingbaseES

encrypt(data bytea, key bytea, type text) returns bytea

decrypt(data bytea, key bytea, type text) returns bytea

encrypt_iv(data bytea, key bytea, iv bytea, type text) returns bytea

decrypt_iv(data bytea, key bytea, iv bytea, type text) returns bytea

MySQL

AES_ENCRYPT(str,key_str[,init_vector])

AES_DECRYPT(crypt_str,key_str[,init_vector])

Oracle

DBMS_CRYPTO.ENCRYPT(src IN RAW, typ IN PLS_INTEGER, key IN RAW, iv IN RAW DEFAULT NULL) RETURN RAW;

DBMS_CRYPTO.DECRYPT(src IN RAW, typ IN PLS_INTEGER, key IN RAW, iv IN RAW DEFAULT NULL) RETURN RAW;



通过以上的比较可以看到


不同数据库的算法接口在函数名、参数传递上都存在着差异。往KingbaseES数据库迁移时,需要将其他数据库支持的特有的数据类型转换为KingbaseES支持的类型进行输入


另外,对于AES加解密函数的具体实现,各数据库也存在着差异。参照MySQL文档可验证,MySQL对数据进行加密时是强制填充的,而KingbaseES和Oracle函数需要指定加密填充方式。所以,在使用时,用户应特别注意需要当前业务使用哪种算法和加密模式,对相关函数做必要的数据验证,以确认算法的一致性,并在使用接口时传递正确的参数。


同时,也要注意使用函数的返回类型,如KingbaseES的digest()和encrypt()等函数返回的是bytea类型的数据,如要转换为十六进制,需要借助其他函数进行转换如:encode(digest($1, 'sha1'), 'hex')。

上面仅以哈希计算和AES算法为例说明应用系统在迁移时选择加解密函数的注意事项,更多的API和细节可查阅对应产品官网。

2.2数据加解密时如何保证一致性?

应用数据中数据的加解密不一定都在数据库服务端进行,有的情况下,加密在应用程序中进行,在数据库中进行解密,或者反之。

这时,如何保证加密和解密的结果是一致的?

首先,需要保证加密和解密时采用的算法、加密模式、填充方式等一致,对数据加密前或解密后的处理方式要保持一致。关于这点,通常在往数据库加密存储时,应用程序本身也需要做一个解密校验,保证存入数据库的值是正确加密的。

其次,加密和解密时客户端和服务端选择的字符编码应该保持一致。

以KingbaseES数据库为例,它支持客户端和服务端编码方式设置,可以通过以下方式去查询或更改当前接收的字符集。

test=# show client_encoding;? -- 客户端使用字符集client_encoding-----------------UTF8(1 row)
test=# show server_encoding; -- 服务端使用字符集server_encoding-----------------UTF8(1 row)
-- 更改数据库客户端字符集test=# set client_encoding to 'GBK'; --也可\encoding GBK指定SETtest=# show client_encoding;client_encoding-----------------GBK(1 row)

下面以KingbaseES中的encode函数为例说明字符集编码对数据的影响。

test=# create table t (id int, name varchar(32));CREATE TABLE设置客户端环境编码。以LINUX环境来说,LANG环境变量设置客户端编码。如果是使用SecureCRT之类的终端软件连接,终端软件的字符集要与LANG保持一致。[daoke@localhost bin]$ echo $LANGen_US.UTF8test=# select encode('汉字','hex');? ? encode? ?--------------e6b189e5ad97? ?(1 row)输出结果为'汉字'的UTF-8编码
test=# \encoding GBKtest=# select encode('汉字','hex');? ? ? ?encode? ? ??--------------------e5a7b9e5a48ae793a7??(1 row)? ?此时客户端编码为UTF8,数据库设置的客户端编码为GBK,数据库服务端编码为UTF8,不一致,输出结果会转换,表示将’e6b189e5ad97’作为GBK编码转换为UTF-8后的编码。
如果将客户端环境或客户端使用终端的编码设置为GBK[daoke@localhost bin]$ export.GBK[daoke@localhost bin]$ echo $LANGzh_CN.GBKtest=# show client_encoding;client_encoding-----------------GBK(1 row)test=# select encode('汉字','hex');?? ? encode? ?--------------e6b189e5ad97(1 row)
test=# select encode('姹夊瓧','hex');? ? ? ?encode? ? ??--------------------e5a7b9e5a48ae793a7(1 row)我们可以看到,数据库客户端编码设置为GBK和用户客户端环境一致时,encode的结果不发生转换。同样地,如果这时修改数据库客户端编码为UTF8test=# set? client_encoding to 'UTF8';SETtest=# show client_encoding;client_encoding-----------------UTF8(1 row)
test=# select encode('汉字','hex');2020-10-10 16:01:55.113 CST [28203] ERROR:? invalid byte sequence for encoding "UTF8": 0xbaERROR:? invalid byte sequence for encoding "UTF8": 0xbatest=# select encode('姹夊瓧','hex');? ? encode? ?--------------e6b189e5ad97(1 row)会出现字符解码错误的问题。

通过上面关于encode()函数的例子,我们可以发现字符集的一致性对于最终的结果有着很大的影响,在使用到加解密类函数的时候也会存在着类似的问题。对于KingbaseES来说,客户端编码和服务端编码如果一致,则插入的数据之间不经过转码,直接存入服务器;当客户端编码和服务器编码不一致的时候,插入的数据会自动转码。

所以,在使用相关函数的时候,需要保证字符编码使用上的统一。即用户客户端环境的字符编码应该和数据库中设置的客户端编码保持一致。

2.3JAVA程序与数据库加解密相结合

对于一些JAVA的应用系统,会采用JAVA自带的程序进行加密,使用数据库函数完成解密,这时需要注意哪些问题呢?

对于该问题,参照2.2部分的内容:

1)java程序需要保证对数据的加解密算法及处理过程与数据库端一致。

2)java程序使用的编码与数据库端设置编码应一致。

2.4是否可以直接迁移密文?

理论上来说,只要保证密钥一致,加解密方法及过程一致,是可以直接迁移密文的。但在实际迁移中,仍需要考虑实际场景。

不同数据库的加解密接口实现存在差异,如果直接迁移密文就必须确认清楚当前使用的算法以及相关参数,以保证在迁移之后能顺利地完成数据解密操作以及后续的数据存储业务。但由于有些数据库内部如何实现的并不透明,对其加密结果的分析造成一定难度,需要根据实际需要具体分析。

3、总结

在对加密数据做迁移时,和普通的数据迁移思路应该是一致的,最终是要将对应的业务逻辑正确地兼容过来。加解密接口的使用过程中,用户需要关注待迁移的功能在新数据库系统下的API接口,保证算法和加解密过程一致,并进行正确的传参,根据函数返回类型正确使用输出结果。同时,在迁移数据时,客户端和数据库端需要使用统一的字符集,从而保障数据的一致性。Kingbase默认采用的是UTF8字符,建议统一使用UTF8字符集进行处理。

相关推荐

如何让老师看完文章后还啧啧称奇?满分作文有框架,这3点是关键

历年来语文考试中,作文的分数都占着相当大的一个比例,同时作文也是最容易拉开差距的一个模块。别人拿满分,而你却只有20分左右,分数的差距就是这样拉开的。作文想拿很高的分数却是不容易,但不是完全不可能的事...

小学作文写作技巧和方法,万能公式框架法。家长收藏

小学语文老师用心整理,将写作框架编成万能公式。作文的写作是语文学习中的重要一环,从小学到初中再到高中,作文一直是语文考试中占分比重最高的部分。小学阶段的语文写作相对来说比较简单,主要是打基础,但是很多...

如何用爆款改写技巧提升文章吸引力结构重塑:打破原文框架悬念前

如何用爆款改写技巧提升文章吸引力?结构重塑:打破原文框架悬念前置法-在开头设置悬念或提出反常识的结论,吸引读者注意力。例如,将“接纳不完美是治愈的开始”改写为“天天逼自己当完美超人?别杠了!生活本就...

守护袁昆:是否有必要按框架去写文章,拍摄剪辑视频?

(文/守护袁昆)如今不管是写文章还是剪辑视频,越来越多的朋友喜欢用框架、用脚本,作为互联网创作者,我们是否有必要按框架去写文章,拍摄剪辑短视频呢?其实在内容创作过程中,是否使用框架始终是一个充满争议的...

揭秘!爆款文章的秘密:让读者无法抗拒的文章框架

说说我自己一开始写文章都会犯一个毛病,文章,通常是想到哪里,写到哪里,“管不住字儿”。这样往往会出现以下问题绊住我们继续写下去1、很容易,写着就跑偏了,最终出来的成品和最初的设想偏离很大2、会写得很慢...

想要写出逻辑清晰的文章,你需要掌握哪些写作结构

想要写出好文章,就必须要了解文章的结构和框架。一篇文章结构清晰,读者就很容易跟上作者的思路,看出文章的重点内容。如果你对新媒体的文章有进行过研究,你就会发现很多公众号的文章结构都是类似的。所以你需要掌...

写作结构拆解:从选题到框架,如何让文章说服力翻倍?

你有没有想过,为什么有些文章能轻松获得很高的阅读量,而你的文章却始终无人问津?其实,写出爆款文章并没有想象中那么难。关键在于选择一个吸引人的主题,并用一个清晰的写作框架,通过2-3个有力的子观点支撑...

申论怎么写?结构怎么弄?这篇文章是最基本的好文章框架

写作总被吐槽逻辑混乱?三步搭建框架法,新手也能写出漂亮文章

一、结构决定论:信息传递的桥梁写作者和读者之间始终存在一道隐形的鸿沟。作者脑海中的想法如同一棵枝繁叶茂的大树,但直接倾倒给读者时,往往只剩下零散的枝叶,信息在传达过程中的丢失,作者输出的和读者读到的不...

如何搭建文章框架:新手写作者很有必要看

#头条深一度-深度阅读计划#见面好呀,我是潼臻~37岁,边上班边带娃的二胎妈妈藏起生活里的琐碎,期望你我都能遇到更好的自己~~~~~~~~~~~~~~~~~~果然多读书是可以真切学习到有用的东西最近把...

模型上下文协议(MCP)的可视化向导

最近,模型上下文协议(MCP)引起了广泛关注。你一定听说过它。今天,让我们来了解一下它是什么。直观地说,MCP就像是AI应用的USB-C接口。正如USB-C提供了一种标准化的方式,用于将...

97个人放一页PPT!用对Smartart架构图直接开挂!

从讯飞出差回来的路上,在高铁上看到一条微博,关于红楼梦人物的思维导图:下面很多家长说,帮助很大,能帮助上学的孩子梳理清人物关系,我看了下,清楚是清楚,但真的不太好看!作为一名PPT博主,我就顺带在高...

技术架构规范与实践(二)架构设计示例

1.逻辑架构1.1领域概念1.2宏观应用架构1.3宏观流程1.4微服务拆分与分层2.技术架构3.开发架构3.1后端技术栈分类名称版本描述后端框架/组件JavaJdk8(openjdk:8u342)后...

倾斜柱模板安装加固

1、适用范围:呈梯形逐层向内侧倾斜的框架柱。2、工艺流程:定位放线-配模-校正梁位置-安装加固。3、工艺方法:(1)定位放线首先现场技术管理人员对每颗不同标高的梁底、梁中边线及200mm控制线进行平面...

地基与基础工程、主体工程节点构造

#去班味吧#桩头凿除环切法工艺说明:1、根据桩头预留长度(深入承台10cm)放样桩顶标高,施工人员根据测量结果在基桩上用红油漆标注环切线;2、在切割线以上部分桩底,人工用钢钎打入桩底约15cm,打入时...

取消回复欢迎 发表评论: