问题描述
Oracle数据库字符集为ZHS16GBK时,插入和查询生僻字显示乱码。
解决方法
绝大多数生僻字,在UTF8字符集中都是存在的,也就是在Oracle数据库的 AL32UTF8 字符集中都能够被正确存储,针对以上问题有以下两种处理方式:
-
方式一:将生僻字的数据类型由varchar2改成nvarchar2,并使用utl_raw.cast_to_nvarchar2 函数来插入和查询数据。
-
方式二:插入或修改时在字符串前加上“N”。
相关知识:Oracle中varchar2和nvarchar2的区别主要有以下几点:
varchar2 | nvarchar2 |
---|---|
可变长度的字符类型,最多可以存放4000字节的数据 | 可变长度的国家字符类型,最多可以存放2000个字符 |
长度单位可以是字节或字符,取决于type参数 | 长度单位只能是字符 |
存储汉字时受到数据库字符集编码的影响,例如GBK编码时一个汉字占两个字节,UTF-8编码时一个汉字占三个字节 | 存储汉字时不受数据库字符集编码的影响,一个汉字始终占两个字节 |
varchar2和nvarchar2在插入和查询数据时可能需要使用不同的函数来转换数据类型。