现象
Oracle数据库字符集为ZHS16GBK
,插入和查询生僻字显示乱码:
查询乱码:
解决办法
先问问chatGPT,找找答案:
解决办法:
- 一种是将生僻字的数据类型由varchar2改成nvarchar2,并使用
utl_raw.cast_to_nvarchar2
函数来插入和查询数据。这种动作较小。 - 另一种是将数据库的字符集修改为支持更多汉字的字符集,例如
AL32UTF8
或ZHS32GB18030。 这种需要删除数据库,重新建库,动作较大,其实经过测试显示仍然有问题。
例如生僻字:㼆 yíng ,㱔 suǒ,䶮 yǎn
1-- 解决Oracle存储生僻字、偏僻字
2-- 只能保证业务系统能正常读取生僻字
3
4DROP TABLE TEST;
5CREATE TABLE TEST(id int,n1 varchar2(255), n2 nvarchar2(255));
6insert into TEST values(0,'张学?䄲友','张学?䄲友');
7insert into TEST values(1,n'张学?䄲友',n'张学?䄲友');
8insert into TEST VALUES(0,'㱔','㱔');
9insert into TEST VALUES(1,'㱔',N'㱔');
10insert into TEST VALUES(1,'㛃',N'㛃');
11insert into TEST VALUES(0,'䶮','䶮');
12insert into TEST VALUES(0,'㼆','㼆');
13
14
15
16-- 中文转unicode参考:https://www.w3cschool.cn/tools/index?name=unicode_chinese
17insert into TEST select 1,utl_raw.cast_to_varchar2('3c54'),utl_raw.cast_to_nvarchar2('3c54')from dual;
18insert into TEST select 1,utl_raw.cast_to_varchar2('36c3'),utl_raw.cast_to_nvarchar2('36c3')from dual;
19commit;
20
21-- ID为1且n2列为正确的插入方法
22SELECT n1,n2 FROM TEST;
23
24
25
26-- 补充
27-- 测试 sql
28select n'䄲' from dual; -- 显示正常
29select '䄲' from dual; -- 显示乱码
解决办法:
1-- 第一步: 将需要存储生僻字的字段类型修改为 nvarchar2 (注意:不是 varchar2)
2alter table TEST modify N1 nvarchar2(255);
3
4-- 第二步: 手工通过数据库图形化工具 将生僻字转换后 插入该字段(单引号前面加上 n)
5update TEST set sqrmc = n'张学?䄲友' where sblsh = '44180022B0000NJ';
6commit;
7
8-- 第三步: 进入业务系统页面查看 正常显示为 《 张学?䄲友 》
实验
1[oracle@lhrora11204 ~]$ dbca -silent -createDatabase -templateName General_Purpose.dbc -responseFile NO_VALUE
2> -gdbname gbk -sid gbk
3> -sysPassword lhr -systemPassword lhr
4> -datafileDestination '/u01/app/oracle/oradata'
5> -recoveryAreaDestination '/u01/app/oracle/flash_recovery_area'
6> -redoLogFileSize 50
7> -storageType FS
8> -characterset ZHS16GBK -nationalCharacterSet AL16UTF16
9> -sampleSchema true
10> -totalMemory 512
11> -databaseType OLTP
12> -emConfiguration NONE
13/bin/cat: /proc/sys/net/core/wmem_default: No such file or directory
14/bin/cat: /proc/sys/net/core/wmem_default: No such file or directory
15/bin/cat: /proc/sys/net/core/wmem_default: No such file or directory
16Copying database files
171% complete
183% complete
1911% complete
2018% complete
2126% complete
2237% complete
23Creating and starting Oracle instance
2440% complete
2545% complete
2650% complete
2755% complete
2856% complete
2957% complete
3060% complete
3162% complete
32Completing Database Creation
3366% complete
3470% complete
3573% complete
3685% complete
3796% complete
38100% complete
39Look at the log file "/u01/app/oracle/cfgtoollogs/dbca/gbk/gbk.log" for further details.
40[oracle@lhrora11204 ~]$ export ORACLE_SID=gbk
41[oracle@lhrora11204 ~]$ sas
42
43SQL*Plus: Release 11.2.0.4.0 Production on Tue Mar 7 17:34:32 2023
44
45Copyright (c) 1982, 2013, Oracle. All rights reserved.
46
47
48Connected to:
49Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production
50With the Partitioning, OLAP, Data Mining and Real Application Testing options
51
52SYS@gbk> select userenv('language') from dual;
53
54USERENV('LANGUAGE')
55----------------------------------------------------
56AMERICAN_AMERICA.ZHS16GBK
57
58SYS@gbk>
Oracle中varchar2和nvarchar2的区别
Oracle中varchar2和nvarchar2的区别主要有以下几点:
- varchar2是可变长度的字符类型,最多可以存放4000字节的数据,而nvarchar2是可变长度的国家字符类型,最多可以存放2000个字符。
- varchar2的长度单位可以是字节或字符,取决于type参数,而nvarchar2的长度单位只能是字符。
- varchar2在存储汉字时受到数据库字符集编码的影响,例如GBK编码时一个汉字占两个字节,UTF-8编码时一个汉字占三个字节。而nvarchar2在存储汉字时不受数据库字符集编码的影响,一个汉字始终占两个字节。
- varchar2和nvarchar2在插入和查询数据时可能需要使用不同的函数来转换数据类型。
总结
1、若Oracle数据库字符集为ZHS16GBK,则必须同时满足如下2个条件,才能避免生僻字乱码:
- 字段必须修改为
nvarchar2
类型 - 插入或修改在字符串前加上“N”或者使用
utl_raw.cast_to_nvarchar2('unicode码')
来插入。
2、绝大多数生僻字,在UTF8字符集中都是存在的,也就是在Oracle数据库的 AL32UTF8 字符集中都能够被正确存储。
3、若数据库为UTF8格式,则建议使用正常方式来操作,若还有乱码,则可以修改NLS_LANG
参数,
1export NLS_LANG=AMERICAN_AMERICA.AL32UTF8
在windows上也需要修改该参数,
若plsql developer显示有问题在:plsql developer 中在工具--》首选项--》选项中,选中 unicode enable 就可以显示了。
参考
https://www.modb.pro/db/125984