手机版
你好,游客 登录 注册
背景:
阅读新闻

Oracle字符与字节的整理

[日期:2019-09-16] 来源:Linux社区  作者:零度的雨1205 [字体: ]

平时工作中,偶尔会有关于Oracle字符与字节的困惑,今天闲暇之余,特意整理一下。

术语: 

位(bit):是计算机 内部数据 储存的最小单位,11001100是一个八位二进制数。 

字节(byte):是计算机中 数据处理 的基本单位,习惯上用大写  B  来表示,1B(byte,字节)= 8bit(位) 

字符:是指计算机中使用的字母、数字、字和符号 

说明:  

在Oracle中,NVARCHAR2、NCHAR使用的是国家字符集(NLS_NCHAR_CHARACTERSET),同时国家字符集必须 

 为AL16UTF16、UTF8两个中的一个;其他的字符类型使用的是  标准字符集(NLS_CHARACTERSET),例如该库的字符集查询  如下:

测试

(1) 首先在  数据库字符集为  ZHS16GBK,国家字符集为  UTF8进行测试: 

建一张测试表并插入数据 :

create table t_var(va nvarchar2(32),vb varchar2(32)); 

insert into t_var values('你好','你好'); 

insert into t_var values('hello','hello'); 

此时我们查询: 

测试结果:

a. 当字符类型使用标准  字符集为  ZHS16GBK时,  一个英文字符占一个字节,一个中文字符占两个字节; 

b. 当  字符类型使用  国家字符集为  UTF8时,  一个英文字符占一个字节,一个中文字符占三个字节; 

(2) 然后我们在另一个库标准字符集为 ZHS16GBK,国家字符集为AL16UTF16时,再进行以上相同的测试: 

测试结果:

a.  当字符类型使用标准  字符集为  ZHS16GBK时,  一个英文字符占一个字节,一个中文字符占两个字节; 

b. 当  字符类型使用  国家字符集为  AL16UTF16  时,一个  英文字符占两个字节,一个中文字符占两个字节;   

以上是一个简单的测试过程,说明当我们当我们选择不同的字符类型时,一个字符所占的字节是不一样的,这可能会对我们使用一些字符处理的函数时造成影响。

此外,我们在日常工作中,也许看到过以下的字符长度定义的写法:

varchar2(32)

varchar2(32 char)

varchar2(32 byte)

这三种定义方法都是正确的,只不过它表示的意思是不一样的:

varchar2(32 char) :指定了字符串最大长度是32位,不管是中文还是英文,最大存储长度是32位;

varchar2(32 byte) :指定了字符串所占的最长字节数为32,例如允许存储中文最多16个,英文32个;

varchar2(32)  :未明确指定字符串最大长度的度量是以byte为准,还是以char为准,此时起决定作用的是

                          参数NLS_LENGTH_SEMANTICS;

在测试库中查询该参数如下:

可以看到数据库默认的字符串长度的度量是BYTE。

更多Oracle相关信息见Oracle 专题页面 https://www.linuxidc.com/topicnews.aspx?tid=12

Linux公社的RSS地址https://www.linuxidc.com/rssFeed.aspx

本文永久更新链接地址https://www.linuxidc.com/Linux/2019-09/160676.htm

linux
相关资讯       Oracle字符  Oracle字节 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数

       

评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款