其他分享
首页 > 其他分享> > 数据字段异常识别正则表达式(深圳)

数据字段异常识别正则表达式(深圳)

作者:互联网

-- 数据字段异常识别正则表达式(深圳)
-- Author: SZC Stanley Hwang
-- Apply : Huawei Gauss DWS
-- Create: 2022-07-03
-- Update: 2022-07-03
-- Remark: 配合数据治理基础建设,用于检测各类常用字段是否符合格式要求

  1. 字段值为空:
    "COL_NAME_EN" IS NULL OR "COL_NAME_EN" = ''

  2. 不是深圳市内有效的11个行政区名称:
    NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '^(福田|罗湖|盐田|南山|宝安|龙岗|光明|坪山|龙华|大鹏|深汕特别合作|深汕合作)(区|新区)?')

  3. 不是深圳市内有效的19位楼栋编码:
    NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '^4403[0-9]{15}$')

  4. 不是深圳市内有效的25位房屋编码:
    NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '^4403[0-9]{21}$')

  5. 不是深圳市内有效的街道名称:
    NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '^((桂园|黄贝|东门|翠竹|南湖|笋岗|东湖|莲塘|东晓|清水河|南园|园岭|福田|沙头|香蜜湖|梅林|莲花|华富|福保|华强北|南头|南山|沙河|蛇口|招商|粤海|桃源|西丽|新安|西乡|航城|福永|福海|沙井|新桥|松岗|燕罗|石岩|平湖|坪地|葵涌|大鹏|南澳|南湾|坂田|布吉|龙城|龙岗|横岗|吉华|宝龙|园山|梅沙|盐田|沙头角|海山|观湖|民治|龙华|大浪|福城|观澜|坪山|马峦|碧岭|石井|坑梓|龙田|光明|公明|新湖|凤凰|玉塘|马田)(街道)?)$|^((鹅埠|小漠|鲘门|鮜门|赤石)镇?)$|^(宝安国际机场|福田保税区|前海合作区|坪山综合保税区|盐田综合保税区)$')

  6. 不是有效的证件类型代码01-17、99:
    NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '(0[0-9])|(1[0-7])|99')

  7. 不是中国境内有效的18位身份证号:
    ("zjlx" IS NULL OR "zjlx" = '01') AND NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '^[1-68][0-9]{5}(19|20)[0-9]{2}(0[1-9]|1[012])(0[1-9]|[12][0-9]|3[01])[0-9]{3}[0-9Xx]$', 'i')

  8. 不是中国境内有效的18位统一社会信用代码:
    NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '^[159Y][1239][1-6][0-9]{5}[A-Z0-9]{10}$', 'i')

  9. 出生日期不符合YYYY-MM-DD格式:
    NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '^(19|20)[0-9]{2}([\/-][0-9]{1,2}){2}')

  10. 批次号不符合YYYYMMDDNN格式,N为顺序数字:
    NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '^202[0-9](0[1-9]|1[012])(0[1-9]|[12][0-9]|3[01])[0-9]{2}$')

  11. 数据值不为「是、否、1、0」:
    NOT REGEXP_LIKE(TRIM("COL_NAME_EN"), '[是|否|1|0]')

标签:TRIM,EN,NAME,正则表达式,数据字,REGEXP,识别,COL,LIKE
来源: https://www.cnblogs.com/MoonYear530/p/16439526.html