本文实例讲述了Python统计文件中去重后uuid个数的方法。分享给大家供大家参考。具体如下:
利用正则表达式按行获取日志文件中的的uuid,并且统计这些uuid的去重个数(去重利用set)
import re
pattern=re.compile(r'&uuid=.*&')
uuidset=set()
with open('request.log.2015-05-26','rt') as f:
for line in f:
all=pattern.findall(line)
if len(all)>0 and line.find('iphone')>0:
# print(all[0])
uuidset.add(all[0])
print(len(uuidset))
希望本文所述对大家的Python程序设计有所帮助。
您可能感兴趣的文章:Python实现的txt文件去重功能示例python批量查询、汉字去重处理CSV文件Python实现对文件进行单词划分并去重排序操作示例对python读写文件去重、RE、set的使用详解python 高效去重复 支持GB级别大文件的示例代码Python过滤txt文件内重复内容的方法python去除文件中重复的行实例python删除本地夹里重复文件的方法Python3 实现随机生成一组不重复数并按行写入文件Python实现的删除重复文件或图片功能示例【去重】