有一个Excel表,录入的日期格式很混乱,有些看着差不多,但实际多一个空格少一个字符很难发现,希望的理想格式是 1980-01-01,10位,即:“YYYY-mm-dd”,实际上数据表中这样的格式都有
1988.9.10
1985-01-26
09 0CT1978
Jan.25,1975
15/11/1988
1986年12月26
19850430
28-Mar-70
31 OCT 1990
要求:能规范的尽量规范,不能规范的 标记为“格式错误”,之后人工处理;
先将原始数据Copy到A列,做以下处理:
第1步:B列:8位的格式,如19850430,加上分隔符:
=IF(LEN(A2)=8,(MID(A2,1,4)&"-"&MID(A2,5,2)&"-"&MID(A2,7,2)),A2)
第2步:C列:转换1
=TEXT(B2, "YYYY-MM-dd")
第3步:D列 转换完成,将 . 的替换成 - 线
=SUBSTITUTE(C2, ".", "-")
第4步:结果格式判断,判断第5位和第7位是否是连接线 “-” 及是否包含 “–” 和 “/”
=IF(AND(MID(D2,5,1)="-",MID(D2,8,1)="-",ISNUMBER(FIND("--",D2))=FALSE,ISNUMBER(FIND("/",D2))=FALSE),"OK","格式错误")
以上仅供参考!