Python如何拆分ZIP文件

Kara ·

更新时间:2024-11-13

· 274 次阅读

Python拆分ZIP文件

文件样子如下

Python ZIP 装包拆包

装包

拆包

Python拆分ZIP文件

同事接到个任务，每周拆分下发zip文件。

文件样子如下

目录下有很多文件，要按网点下发。这个总不能每次都手工做吧。 python 脚本搞起！

需要 2个库

import os
import zipfile

先解压到临时目录，再遍历压缩成新zip文件。注意中文字符问题。

上代码

# encoding: utf-8
"""
@author: 陈年椰子
@contact: hndm@qq.com
@version: 1.0
@project:MyTools 
@file: zip_work.py
@time: 2021-9-13 15:48
说明
"""
import os
import zipfile
def dfs_get_zip_file(input_path,result):
    # 遍历目录列表
    files = os.listdir(input_path)
    for file in files:
        if os.path.isdir(input_path+'/'+file):
            dfs_get_zip_file(input_path+'/'+file,result)
        else:
            result.append(input_path+'/'+file)
def zip_path(input_path,output_path,output_name,up_path=""):
    # input_path 要压缩的目录
    # output_path zip文件存放目录
    # output_name zip文件名
    # up_path zip包需要剔除的父目录，避免压缩包内目录过深
    f = zipfile.ZipFile(output_path+'/'+output_name,'w',zipfile.ZIP_DEFLATED)
    filelists = []
    dfs_get_zip_file(input_path,filelists)
    for file in filelists:
        f.write(file,file.replace(up_path,''))
    f.close()
    return output_path+r"/"+output_name
def get_category_dir_zip(filepath, ext_dir, up_path = ""):
    #遍历filepath下所有文件，包括子目录 , 找到网点目录，压缩成zip文件
    # 按需要修改压缩逻辑 ， 我这里是按网点机构分别压缩
    cate_dict = {'469030':'21',
                '469035':'23',
                '469031':'24',
                '469027':'19',
                '469003':'13',
                '469025':'17',
                '469007':'16',
                '460101':'11',
                '469033':'25',
                '469028':'26',
                '469034':'27',
                '469002':'14',
                '469036':'28',
                '460201':'12',
                '469026':'22',
                '469006':'20',
                '469005':'18',
                '469001':'15',
                }
    files = os.listdir(filepath)
    if os.path.isdir(ext_dir):
        pass
    else:
        os.mkdir(ext_dir)
    for fi in files:
        fi_d = os.path.join(filepath,fi)
        if os.path.isdir(fi_d):
            if fi.find("46")==0:
                zip_file_cnt = 0
                ctg_dir_list = os.listdir(filepath)
                for ci in ctg_dir_list:
                    ctg_dir = os.path.join(filepath, ci)
                    if os.path.isdir(ctg_dir):
                        zip_file = "{}.zip".format(ci[:6])
                        zip_file_dir = os.path.join(ext_dir, zip_file)
                        if os.path.exists(zip_file_dir):  # 如果文件存在 删除文件
                            os.remove(zip_file_dir)
                        print('压缩', ctg_dir, zip_file_dir, ext_dir)
                        zip_path(ctg_dir, ext_dir, zip_file, up_path)
                        zip_file_cnt = zip_file_cnt + 1
                return zip_file_cnt
            else:
                return get_category_dir_zip(fi_d, ext_dir)
def sfp_unzip(file_path, ext_dir):
    """unzip zip file"""
    zip_file = zipfile.ZipFile(file_path)
    if os.path.isdir(ext_dir):
        pass
    else:
        os.mkdir(ext_dir)
    zip_i = 0
    for names in zip_file.namelist():
        zip_i = zip_i + 1
        # 避免中文出现乱码
        gbk_names = names.encode('cp437').decode('gbk')
        file_size = zip_file.getinfo(names).file_size
        new_path = os.path.join(ext_dir, gbk_names)
        # 判断文件是文件夹还是文件
        if file_size > 0:
            # 是文件，通过open创建文件，写入数据
            with open(file=new_path, mode='wb') as f:
                # zf.read 是读取压缩包里的文件内容
                f.write(zip_file.read(names))
        else:
            # 是文件夹，就创建
            os.mkdir(new_path)
    zip_file.close()
    return zip_i
if __name__=="__main__":
    # 解压文件
    file_cnt = sfp_unzip("zip/xyk.zip", "D:/zip/tmp")
    if file_cnt > 0:
        # 按网点压缩打包文件
        zip_file_cnt = get_category_dir_zip("D:/zip/tmp", "D:/zip/data")
        print("拆分建立{}个zip文件。".format(zip_file_cnt))
    else:
        print("zip文件为空，未拆分建立zip文件。")

Python ZIP 装包拆包 装包

zip函数可以将两个列表“缝合起来”，比如：

a=[1,2,3]
b=['x','y','z']
c=list(zip(a,b))
print(c)

这里的含义是a里面的第一个元素跟b里面的第一个元素配对，放到一个元组里面；a里面的第二个元素跟b里面的第二个元素配对，放到另外一个元组里面；以此类推。

现在，另外在a里面增加一个元素，再使用zip的结果会怎么样呢？

a.append(4)
c=list(zip(a,b))
print(c)

从上面截图可以看出，列表是作为参数被传入zip函数中，而zip函数在遍历列表（或者其他的可迭代数据类型 Iterable data type）时，遍历到最短的那个列表后，遍历结束。

在上面a和b的例子中，b列表长度是3，a列表长度是4，所以最终产生的列表c的长度也只有3。

拆包

拆包是装包的方向操作

d=list(zip(*c))
print(d)

上述拆包的核心是在zip(*c)里面，这里不是太好理解。从结果来看，是产生了两个元组，d和e。其分别的内容和a及b这两个列表元素一样。

这里重点看下*c,不太好理解。其实可以打印出来：

print(*c)

从上图可以看出 *c是把c列表里面的三个参数分别拆了出来，然后作为参数传入了zip函数里面。可以做另一个试验验证一下。

p1=(1,'x')
p2=(2,'y')
p3=(3,'z')
p=list(zip(p1,p2,p3))
p==d

从上面的验证可以看出拆包时候的*c，其实就c列表里面三个作为元组的元素分别传入zip函数中。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持软件开发网。

zip Python

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

HTML 字符集

Kamiisa 2020-04-27

703

SQL UCASE() 函数

Julia 2021-01-21

540

Docker部署Python应用的方法实现

Madge 2023-07-22

687

一文详解Python中多进程和进程池的使用方法

Serafina 2023-07-24

338

Python中常用功能的实现代码分享

Kathy 2023-07-24

934

python简单几步实现时间日期处理到数据文件的读写

Nora 2023-07-24

926

Python采集二手车数据的超详细讲解

Pandora 2023-07-24

294

Python进阶之利用+和*进行列表拼接

Tani 2023-07-24

656

Python进阶之列表推导与生成器表达式详解

Tanisha 2023-07-24

1394

Python实战使用XPath采集数据示例解析

Diane 2023-07-24

1433

Python 对象拷贝及深浅拷贝区别的详细教程示例

Miette 2023-08-09

488

使用Python对接OpenAi API实现智能QQ机器人的方法

Miette 2023-08-28

1874

python进阶学习实时目标跟踪示例详解

Serafina 2023-08-28

1732

Python人工智能语音合成实现案例详解

Rhea 2023-08-28

744

python Tkinter实例详解

Malinda 2023-08-28

1999

Python人工智能构建简单聊天机器人示例详解

Kathy 2023-08-28

1370

Python ttkbootstrap的介绍与使用教程

Nora 2023-08-28

1592

python中os模块和sys模块的使用详解

Pandora 2023-08-28

600

Python中的QPixmap用法详解

Tani 2023-08-28

951

python人工智能算法之线性回归实例

Diane 2023-08-28

527

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座