主页 > 知识库 > 数据库 > Oracle >

Oracle-关于查询数据出现乱码的问题

来源:中国IT实验室 作者:佚名 发表于:2013-01-06 13:26  点击:
问题描述: 经常有些朋友会遇到,我明明是输入的正确中文,为什么我在另外一台电脑上查询却出现乱码啦?其实这个是数据库在进行字符集转换的时候出现了问题, 下面通过测试来描述具体的情况: www.2cto.com 1.环境 Oracle 数据库字符集: Connected to Oracle
问题描述:    经常有些朋友会遇到,我明明是输入的正确中文,为什么我在另外一台电脑上查询却出现乱码啦?其实这个是数据库在进行字符集转换的时候出现了问题,
    下面通过测试来描述具体的情况:  www.2cto.com
    1.环境
    Oracle 数据库字符集:
    Connected to Oracle Database 11g Enterprise Edition Release 11.2.0.1.0
    Connected as scott
    SQL> SELECT * FROM DATABASE_PROPERTIES WHERE PROPERTY_NAME = 'NLS_CHARACTERSET';
    PROPERTY_NAME  PROPERTY_VALUE DESCRIPTION
    ------------------------------ -------------------------------------------------------------------------------- --------------------------------------------------------------------------------
    NLS_CHARACTERSET ZHS16GBK Character set
    Oracle 数据库所在的客服端字符集:
    在注册表的:NLS_LANG=SIMPLIFIED CHINESE_CHINA.ZHS16GBK 如下图:
    Oracle 所在的操作系统的字符集:
    Microsoft Windows [版本 6.1.7601]
    版权所有 (c) 2009 Microsoft Corporation。保留所有权利。
    C:\Users\Andy>chcp
    活动代码页: 936
    表示是:中国 - 简体中文(GB2312)
    2.测试
    字符集如下:
    Oracle 数据库字符集:ZHS16GBK
    Oracle 数据库客户端字符集:ZHS16GBK
    操作系统字符集:中国 - 简体中文(GB2312)
    输入测试数据:
    SQL> INSERT INTO TAB_INDX
    2  values(1,'汉字输入字符集测试','Chinese Input Test',sysdate);
    www.2cto.com
    1 row inserted
    字符集不修改,进行测试数据现实:
    SQL> select * from tab_indx where tid = 1;
    TID TNAME  TDESC  SYSDT
    ---------- ---------------------------------------------------
    1 汉字输入字符集测试 Chinese Input Test 2012/12/30
    显示正常,
    现在我把客服端的字符集修改为:UTF8
    及注册表的:NLS_LANG=SIMPLIFIED CHINESE_CHINA.UTF8
    现在字符集如下:
    Oracle 数据库字符集:ZHS16GBK
    Oracle 数据库客户端字符集:UTF8
    操作系统字符集:中国 - 简体中文(GB2312)
    现在再查询刚才输入的数据:
    SQL> select tname,tdesc from tab_indx;
    TNAME  TDESC
    -----------------------------------------------------------------
    姹夊瓧杈揿叆瀛楃板嗘祴璇?  Chinese Input Test
    发现查询出来的数据已经不能正常现实,因为这些汉字是以ZHS16GBK编码格式存储的,然而你查询出来后根据Oracle客服端的编码(UTF8)转换,及转成了UTF8的编码格式,但是操作系统是简体中文(GB2312),所以操作系统就把UTF8编码格式的数据,当成简体中文(GB2312)的编码格式数据显示,结果就出现了乱码,
    现在我再插入一笔数据:
    SQL> INSERT INTO TAB_INDX
    2 values(1,'UTF8下汉字输入字符集测试','Chinese Input Test',sysdate);
    1 row inserted
    再查询:
    SQL> select tname,tdesc from tab_indx;
    TNAME  TDESC
    ----------------------------------------------------------------
    姹夊瓧杈揿叆瀛楃板嗘祴璇?  Chinese Input Test
    UTF8锛??锛燂紵锛燂紵?????锛? Chinese Input Test
    发现新插入的数据也出现了乱码,但是乱码跟刚才的值不一样??为什么呢?
    因为输入的汉字,是简体中文(GB2312)的编码格式,当Oracle数据库按照客户端的编码格式传给数据库,Oracle数据库发现,Oracle数 据库客户端是UTF8的编码格式,跟数据库的编码格式(ZHS16GBK)不一样,就进行字符集转换,UTF8-->ZHS16GBK,所以把简体 中文(GB2312)的编码格式的数据当成UTF8,转为ZHS16GBK的编码格式数据,就已经出错啦,查询出来自然转换回去就不行啦
    (本来需要测试Oracle数据库的字符集修改后的情况,这种情况暂时不测试)这里我们在把Oracle客户的字符集修改回去;
    在注册表的:NLS_LANG=SIMPLIFIED CHINESE_CHINA.ZHS16GBK
    现在字符集如下:
    Oracle 数据库字符集:ZHS16GBK
    Oracle 数据库客户端字符集:ZHS16GBK
    操作系统字符集:中国 - 简体中文(GB2312)
    再查询:
    SQL> select tname,tdesc from tab_indx;
    TNAME  TDESC
    ----------------------------------------------------------------
    汉字输入字符集测试 Chinese Input Test
    UTF8?????????????  Chinese Input Test
    发现最开始输入的汉字正常啦,但是第二次输入的汉字,又变了,跟上次的乱码不一样????
    虽然这里没有进行编码格式转换,但是上次在存数据的时候,已经是存的错误的编码格式,所以显示出来肯定不正确 
    其实还有好几种情况测试,由于本地环境的限制,所以测试的其它情况,大家可以去试试,如:数据库的字符集是UTF8,然后客服端的字符集变化,对汉字的输入输出有什么影响
    根据上面的测试情况和我自己的分析,现在总结如下:
    1.数据库的查询出来的数据,是Oracle数据库字符集,Oracle客户端字符集,操作系统字符集共同作用的结果。
    2.Oracle存数据和查询数据都是通过Oracle数据库的字符集和Oracle客服端的字符集进行转换的,显示数据又是根据操作系统的字符集来确定的。
    3.为了避免出现乱码必须要把Oracle客户端的字符集和操作系统的字符集设置成一样的。

    有帮助
    (0)
    0%
    没帮助
    (0)
    0%