Python正则表达式提取省市名称

2023年 8月 22日 58.0k 0

问题导入:考虑以下城市

浙江省舟山市
云南省西双版纳州
新疆维吾尔族自治区伊犁州
内蒙古自治区阿拉善盟

如何提取出省、市名称呢?

提取省市全称

import re

pattern = r'^(.*?(?:省|自治区|维吾尔族自治区|壮族自治区|回族自治区))(.*?(?:市|州|盟))'
file_names = ["浙江省舟山市", "云南省西双版纳州", "新疆维吾尔族自治区伊犁州", "内蒙古自治区阿拉善盟","哈哈哈"]

for file_name in file_names:
    matches = re.findall(pattern, file_name)
    if matches:
        province, city = matches[0]
        print(province,city)
    else:
        print("未匹配到省份和市")

结果为:

浙江省 舟山市
云南省 西双版纳州
新疆维吾尔族自治区 伊犁州
内蒙古自治区 阿拉善盟
未匹配到省份和市

提取省市简称

import re

pattern = r'^(.*?)(?:省|自治区|维吾尔族自治区|壮族自治区|回族自治区)(.*?)(?:市|州|盟)'
file_names = ["浙江省舟山市", "云南省西双版纳州", "新疆维吾尔族自治区伊犁州", "内蒙古自治区阿拉善盟","哈哈哈"]

for file_name in file_names:
    matches = re.findall(pattern, file_name)
    if matches:
        province, city = matches[0]
        print(province,city)
    else:
        print("未匹配到省份和市")

结果为:

浙江 舟山
云南 西双版纳
新疆 伊犁
内蒙古 阿拉善
未匹配到省份和市

提取省简称,市全称

import re

pattern = r'^(.*?)(?:省|自治区|维吾尔族自治区|壮族自治区|回族自治区)(.*?(?:市|州|盟))'
file_names = ["浙江省舟山市", "云南省西双版纳州", "新疆维吾尔族自治区伊犁州", "内蒙古自治区阿拉善盟","哈哈哈"]

for file_name in file_names:
    matches = re.findall(pattern, file_name)
    if matches:
        province, city = matches[0]
        print(province,city)
    else:
        print("未匹配到省份和市")

结果为:

浙江 舟山市
云南 西双版纳州
新疆 伊犁州
内蒙古 阿拉善盟
未匹配到省份和市

相关文章

JavaScript2024新功能:Object.groupBy、正则表达式v标志
PHP trim 函数对多字节字符的使用和限制
新函数 json_validate() 、randomizer 类扩展…20 个PHP 8.3 新特性全面解析
使用HTMX为WordPress增效:如何在不使用复杂框架的情况下增强平台功能
为React 19做准备:WordPress 6.6用户指南
如何删除WordPress中的所有评论

发布评论