编程语言
首页 > 编程语言> > python 数据清洗之提取字符串中的日期

python 数据清洗之提取字符串中的日期

作者:互联网

import re
import numpy as np
from dateutil import parser

def get_std_timeformater(val:str)->str:
	if val != val:
		return None  # 当np.nan时,给出空值
	val = re.sub(r'\s', '',val)
	pattern = re.compile('\d{4}[\.\/年-]{,3}\d{1,2}[\.\/月-]{,3}\d{1,2}[\.\/日-]{,3}'
	val_list = re.findall(pattern, val)
	if val_list:
		val = val_list[0] # 若字符串有多个日期 ,则只取第0个
		if re.search(r'年|月|日', val):
			val = re.sub('[年月日]', '', val)
		if re.search(r"\/{2,}",val):
			val = re.sub("\/{2,}", '/', val)
		return parser.parse(val, yearfirst=True)
	else:
		return None #不能解析,则给出None

标签:None,return,sub,val,python,re,字符串,import,清洗
来源: https://blog.csdn.net/weixin_39791387/article/details/122692540