数据字段异常识别正则表达式(深圳)
作者:互联网
-- 数据字段异常识别正则表达式(深圳)
-- Author: SZC Stanley Hwang
-- Apply : Huawei Gauss DWS
-- Create: 2022-07-03
-- Update: 2022-07-03
-- Remark: 配合数据治理基础建设,用于检测各类常用字段是否符合格式要求
-
字段值为空:
"COL_NAME_EN" IS NULL OR "COL_NAME_EN" = ''
-
不是深圳市内有效的11个行政区名称:
NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '^(福田|罗湖|盐田|南山|宝安|龙岗|光明|坪山|龙华|大鹏|深汕特别合作|深汕合作)(区|新区)?')
-
不是深圳市内有效的19位楼栋编码:
NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '^4403[0-9]{15}$')
-
不是深圳市内有效的25位房屋编码:
NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '^4403[0-9]{21}$')
-
不是深圳市内有效的街道名称:
NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '^((桂园|黄贝|东门|翠竹|南湖|笋岗|东湖|莲塘|东晓|清水河|南园|园岭|福田|沙头|香蜜湖|梅林|莲花|华富|福保|华强北|南头|南山|沙河|蛇口|招商|粤海|桃源|西丽|新安|西乡|航城|福永|福海|沙井|新桥|松岗|燕罗|石岩|平湖|坪地|葵涌|大鹏|南澳|南湾|坂田|布吉|龙城|龙岗|横岗|吉华|宝龙|园山|梅沙|盐田|沙头角|海山|观湖|民治|龙华|大浪|福城|观澜|坪山|马峦|碧岭|石井|坑梓|龙田|光明|公明|新湖|凤凰|玉塘|马田)(街道)?)$|^((鹅埠|小漠|鲘门|鮜门|赤石)镇?)$|^(宝安国际机场|福田保税区|前海合作区|坪山综合保税区|盐田综合保税区)$')
-
不是有效的证件类型代码01-17、99:
NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '(0[0-9])|(1[0-7])|99')
-
不是中国境内有效的18位身份证号:
("zjlx" IS NULL OR "zjlx" = '01') AND NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '^[1-68][0-9]{5}(19|20)[0-9]{2}(0[1-9]|1[012])(0[1-9]|[12][0-9]|3[01])[0-9]{3}[0-9Xx]$', 'i')
-
不是中国境内有效的18位统一社会信用代码:
NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '^[159Y][1239][1-6][0-9]{5}[A-Z0-9]{10}$', 'i')
-
出生日期不符合YYYY-MM-DD格式:
NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '^(19|20)[0-9]{2}([\/-][0-9]{1,2}){2}')
-
批次号不符合YYYYMMDDNN格式,N为顺序数字:
NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '^202[0-9](0[1-9]|1[012])(0[1-9]|[12][0-9]|3[01])[0-9]{2}$')
-
数据值不为「是、否、1、0」:
NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '[是|否|1|0]')
标签:TRIM,EN,NAME,正则表达式,数据字,REGEXP,识别,COL,LIKE 来源: https://www.cnblogs.com/MoonYear530/p/16439526.html