VBA之正则表达式(35)-- 提取年份
实例需求:提取文字中的4位数字年份(19xx或者20xx),文字中包含其他的数字,例如多余4位的:0749345,非年份数字:H-1803F。
示例代码如下。
Sub Demo() Dim regExp As Object Dim aRes, arr Set regExp = CreateObject("vbscript.regExp") regExp.Global = True regExp.Pattern = "D((19|20)d{2})D" txt = [a1].Value Set objMatch = regExp.Execute(txt) If objMatch.Count > 0 Then For Each mat In objMatch Debug.Print mat.submatches(0) Next End If Set regExp = Nothing End Sub
【代码解析】 第4行代码创建正则表达式对象。 第5行代码设置全局匹配。 第6行代码设置匹配模式。 第7行代码读取A1单元格的内容。 第9行代码判断是否匹配成功。 第10~12行代码循环处理匹配结果。 第11行代码输出匹配值。
通过观察发现年份字符有的在圆括号中,有的在方括号中,有的没有括号,因此不能使用此特征。无论是否有括号,年份前后都分别有一个非数字字符,这是本正则匹配的核心点。
【立即窗口】中的输出结果如下所示。