数据库
首页 > 数据库> > Oracle中如何判断一个字符串是否含有汉字

Oracle中如何判断一个字符串是否含有汉字

作者:互联网


看到网友问,怎么查询表中某个字段数据是不是包含了全角字符啊? 这个问题涉及到几个函数:to_single_byte、length和lengthb,我之前做开发的时候研究的是如何判断一个字符串中是否包含中文,其实和这个本质是一样的,且看实验部分。

 


1  实验部分

 

1.1  lengthb和length函数结合to_single_byte函数

---查找出含有汉字,严格的说是含有全角字符的行

SELECT l.name,

       length(l.name),

       lengthb(l.name)

FROM   xb_link l

WHERE  length(l.name) != lengthb(l.name)

AND    length(l.name) < 20;

 


以下数据也满足条件:

 SELECT l.id,

        l.name

 FROM   xb_link l

 WHERE  length(l.name) != lengthb(l.name)

 AND    l.metacategory IN

        ('com.gxlu.ngrm.network.DDNCircuit',

          'com.gxlu.ngrm.network.FRCircuit',

          'com.gxlu.ngrm.network.ATMCircuit',

          'com.gxlu.ngrm.network.DDNOCircuit',

          'com.gxlu.ngrm.network.FROCircuit')

 AND    l.id IN ('301898331', '301898335', '301908187', '301929403');

 

 


所以可以借助to_single_byte函数来解决。

 

 SELECT l.id,

        l.name,

        to_single_byte(l.name),

        length(l.name) l1,

        lengthb(l.name) l2,

        length(to_single_byte(l.name)) l

 FROM   xb_link l

 WHERE  length(l.name) != lengthb(l.name)

 AND    l.metacategory IN

        ('com.gxlu.ngrm.network.DDNCircuit',

          'com.gxlu.ngrm.network.FRCircuit',

          'com.gxlu.ngrm.network.ATMCircuit',

          'com.gxlu.ngrm.network.DDNOCircuit',

          'com.gxlu.ngrm.network.FROCircuit')

 AND    l.id IN ('301898331', '301898335', '301908187', '301929403');

 


1.2  regexp_replace --替换其它字符为空

SELECT 

 l.id,

 l.name

FROM   xb_link l

WHERE  regexp_replace(TRIM(l.name),

                      '([A-Za-z0-9]|[[:punct:]]|[[:space:]])',

                      '') IS NOT NULL;


 


1.3  to_multi_byte 函数--全是全角字符

---全是汉字

SELECT l.name,

       to_multi_byte(l.name)

FROM   xb_link l

WHERE  l.name = to_multi_byte(l.name);

 

 

SELECT l.name,

       to_multi_byte(l.name)

FROM   xb_link l;

 


1.4  网友问题解答:某个字段数据是不是包含了全角字符?

我们做如下的实验:

drop table aa;

create table aa (col   varchar2(255));

SELECT * FROM aa for update;

 

SELECT a.col,

       to_single_byte(a.col),

       length(a.col),

       lengthb(a.col),

       length(to_single_byte(a.col)),

       lengthb(to_single_byte(a.col))

FROM   aa a

WHERE  (lengthb(a.col) - length(a.col)) <>

       (lengthb(to_single_byte(a.col)) - length(to_single_byte(a.col)));


 


About Me

 

.........................................................................................................................................................................................................

本文来自于微信公众号转载文章,若有侵权,请联系小麦苗及时删除,非常感谢原创作者的无私奉献

小麦苗分享的其它资料:http://blog.itpub.net/26736162/viewspace-1624453/

原文地址:http://blog.itpub.net/26736162/viewspace-1688209/

联系我请加QQ好友(642808185),注明添加缘由

时间:2015-06-05 10:00~ 2015-06-05 13:00 于外汇交易中心

【版权所有,文章允许转载,但须以链接方式注明源地址,否则追究法律责任】

.........................................................................................................................................................................................................

拿起手机扫描下边的图片来关注小麦苗的微信公众号:xiaomaimiaolhr,学习最实用的数据库技术。





本文分享自微信公众号 - DB宝(lhrdba)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

标签:name,汉字,字符串,length,Oracle,lengthb,byte,col,network
来源: https://blog.51cto.com/lhrbest/2706907