写着玩儿的 python 小程序

返回首页	项目 GitHub 地址

介绍

用 python 写的 3 个小工具。软件包放在 Release 里。

merge_pdf_with_UI.py（最新）、two_in_one.py：
- 动机：我曾得到一套题库，原来是一个很大的 PDF 文件，前半部分是各章习题，后半部分是各章答案。我想将其重新分章整理成习题 + 答案的形式。于是就写了这个小脚本，利用 PyPdf2 库来辅助我。后来又用于将 iPad 上导出的 PDF 和电脑上的 PDF 合并成同一份作业。
- 使用说明：
  - 转换流程：点击「选择文件」来选定文件及要加入的页数，程序会显示已加入文件的文件路径及起止页码（一条这样的信息称为一条「记录」）。在文本框里输入转换后文件的文件名（不需要带扩展名），点击「执行转换」，会弹出提示框要求选择路径，选择路径并确定后会自动开始转换。
  - 对于「记录」的操作：点击「清除指定记录」，输入想删除的记录序号，该记录即被删除；「清除所有记录」，字面意思。要单独更改某条记录的话，如果只是更改页码范围，就选择「更改某条记录的页码范围」，否则选取「更改某条记录」。
  - 特别地，该程序还可用于截取 PDF 的一部分或拆分 PDF，只要选择单独的一个 PDF 文件，然后输入需要截取的那部分页面的页码即可。
- 另一个 two_in_one.py 及其二进制程序包增加了一个双页合一功能。这个功能只是因为我打印电子书想省纸（笑）。双页合一往往是 A4 双页合并到 A3，页面会扩大，所以又写了个很粗糙的页面大小规整功能。
homework_rename.py：
- 动机：作为学习委员，收作业的时候常常困扰于文件的命名格式，总有人不按照格式命名。于是写了这个小程序，通过提取文件名里的学号，并通过记录有学号-姓名的表格找到姓名，并按照一定文件名规范进行重命名。
- 使用步骤：
  - 先选取存有班级学号-姓名对应关系的 xls 表格。表格要求：需要是 xls 格式而不是 xlsx 格式；第一列是学号，第二列是姓名，学号姓名从第二行开始填写。学号的允许格式：9-12 个数字/字母的组合。（考虑数字+字母组合，是为了适配 23 级学生的学号。如果有些学校的学号模式不一样，可以在源码中修改正则表达式）
  - 然后选取存有待重命名文件的文件夹。注意，其中每个文件都要包含正确的学号。因为此程序依靠学号来查找姓名，从而进行替换。
  - 然后填写「文件类型」框，指明需要转换的文件在哪些类型的文件中选取。需要写完整扩展名，比如「.pdf」或 .docx」，而不是不带”点”的「pdf」、「docx」。
  - 最后编辑「替换后文件名」。其中，{0} 将会被替换成学号，{1} 将会被替换成姓名。如：「{0}-{1}-实验报告1」将被替换为「学号-姓名-实验报告1」，「{0}-作业1」将被替换成「学号-作业1」。该文本框中不需要写扩展名。
- 示例待重命名文件和示例名单已经放在 Release 当中。

main_openpyxl.py（最新）、main_command_line.py、main_xlrd.py：

动机：之前很喜欢一个名为 WakeUp 课程表 的轻量级课表软件。这个软件本来可以自动抓取教务系统的课表（通过从 html 文件里获取信息）并将其以小组件形式显示，但是由于 HITsz 教务系统的特殊设计，其无法抓取成功。我又不想每学期或每次课表更新都手动输入一遍课表，于是就写了个小脚本，将从 HITsz 教务系统官网下载得到的 xlsx 文件，转化为 WakeUp 课程表可识别的 csv 文件。
- 不过，现在有同学开发了在日历中自动导入课表的功能，上面的功能没法实时更新，就变得没什么用处了。推荐大家都去使用一键导入课程表。
本来是利用 xlrd 读写 Excel 文档的，结果发现这个库只能处理 xls 格式的表格，要先调用 Excel 将文档先转化成 xls 格式，有些卡顿，不太方便，而且 xlrd 已经停止维护了，遂改用 openpyxl 来读写。后来又搞了一个不带 tkinter 的命令行版本，更为简洁。
使用说明硬编码在 exe 里了（笑），点击即可查看。输出的默认文件名是 res.csv。

示例文件放在 Release 中的 example.zip 压缩包中。

待转换文件	对应的转换后示例文件
export0415.xlsx	res.csv
21秋.xlsx	res_21秋.csv

程序注明 new 者用 Nuitka 打包，其余均用 pyinstaller 打包。
- 用 pyinstaller 打包命令：pyinstaller -F –-noconsole xxx.py，其中 -F 是指打包为单个文件，–-noconsole 是程序运行时不出现控制台。如果电脑上有多个版本 python 解释器，最好是只有一个 python 环境下装有 pyinstaller。
- 用 Nuitka 打包命令是：python39 -m nuitka –-onefile –disable-console –show-memory –enable-plugins=tk-inter –output-dir=out –remove-output xxx.py
  - python39：我电脑上有多个版本python解释器，将python解释器程序改了名字，用 python39 来指明。若没有多个 python 解释器则直接写 python 即可。若电脑上装了多个 python，最好的 specify 方法是：python 解释器路径 + -m + 模块。但注意 pyinstaller 不是 module，不能这样运行。
  - -m：即 module
  - –onefile：打包成一个 exe（或 bin，其他操作系统）。如果是 –standalone，就是一个文件夹，其中包含软件本体和各种依赖库、待 import 的 module 等，像是绿色安装版。
  - –disable-console：程序运行时不出现控制台。
  - –show-memory：显示内存使用情况。
  - –enable-plugins=tk-inter：对于 tkinter、tensorflow 等特殊的大包需要增加 nuitka 插件支持。列表可通过 –plugin-list 查看。
  - –output-dir=out：输出文件夹名为 out
  - –remove-output：生成过程中在输出文件夹下生成 xxx.build 和 xxx.dist 文件夹（xxx为python文件名），分别存放生成过程的中间文件和 –standalone 形式的软件包。如果使用了 –standalone 命令，则 –remove-output 这条命令会在生成成功时清除 xxx.build 文件夹；如果使用了 –onefile 命令，则这条命令会把 xxx.dist 文件夹也清除掉。
  - xxx.py：最后跟上 python 脚本源文件名。
  - 还有几条会用到的命令：
    - –nofollow-imports：所有在源文件里 import 的模块/包都不查找，软件包将不会包含与 import 的模块。对 standalone 模式不可用。–follow-imports 与之相反。
    - –nofollow-import-to=xxx：不查找指定模块/包。–follow-import-to 与之相反。
    - –include-package=xxx、–include-module=xxx：包含指定包和模块。
  - Details：Nuitka User Manual — Nuitka the Python Compiler
- TODO：学习多文件打包方式。

备注

本人编程水平有限，所以

代码风格可能不够优雅；
程序结构可能比较混乱；
没有做跨平台支持；
还可能有一些小 bug（）

敬请各位指正！！

此页面由 GitHub Pages 生成，使用的模板基于 Primer。最近更新于 2024.6.8。