python针对不定分隔符切割提取字符串的方法

乐观主义者从每一个灾难中看到机遇,而悲观主义都从每一个机遇中看到灾难。无论有多困难,都坚强地抬头挺胸,人生是一场醒悟,不要昨日,不要明天,只要今日。

问题:我们需要在散沙一般的数据中提取出字符,分隔符不止一个,而且还有不少空格,比如:

原字符串如下:

'asd ff gg; asd , foo| og '

我们需要删除上面的,;|分隔符和多余空格,提取出:

['asd', 'ff', 'gg', 'asd', 'foo', 'og']

这种一般用于处理日志或者网页数据提取,一般而言,这种数据中需要的数据分布规律性不是太强,而且比较散。

处理结果如下:

import re
line = 'asd ff gg; asd , foo| og '
data = re.split(r'[;,|\s]\s*',line)
for i in data:
 if i == '':
 data.remove(i)
print(data)

以上这篇python针对不定分隔符切割提取字符串的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。

您可能有感兴趣的文章
Python读取csv文件分隔符设置方法

对python 多个分隔符split 的实例详解

python 读取竖线分隔符的文本方法

对python csv模块配置分隔符和引用符详解

pandas读取csv文件,分隔符参数sep的实例