简介
处于某些上下游对接需求,所以需要频繁的将生信的分析结果整理成PPT文件,以便进行结果的展示。所以基于该模块可以更方便的在集群上自动化生成相关的文档示例,用于进行后续的处理。
使用python操作PPT,需要使用的模块就是python-pptx,下面来对该模块做一个简单的介绍。
这里提前做一个说明:python操作PPT,最好是我们提前设计好自己的一套样式,然后利用进行python进行内容的获取和填充(最主要的功能!),最好是不用使用python代码操作PPT的格式,格式的修改肯定不如我们直接在PPT中修改方便。
可以创建、修改PPT(.pptx)文件。
环境准备
模块的安装
需要单独安装,不包含在Python标准模块里1
2
3
4# "Windows用户命令行下输入"
pip install python-pptx
# "Mac用户命令行下输入"
pip3 install python-pptx
模块的导入
1 | import pptx |
模块的使用
python读取PPT文档中的内容
在使用python操作PPT之前,首先应该清楚PPT的结构,这个对于之后代码的编写很有帮助。
获取Slide
1 | from pptx import Presentation |
获取Shape形状
1 | import pptx |
判断每个Shape中是否存在文字
- shape.has_text_frame :是否有文字
- shape.text_frame :获取文字框
1
2
3
4
5
6
7
8
9import pptx
from pptx import Presentation
prs = Presentation("统计学习方法PPT.pptx")
for slide in prs.slides:
for shape in slide.shapes:
if shape.has_text_frame:
text_frame = shape.text_frame
print(text_frame.text)
获取某一页Slide中的内容
1 | import pptx |
获取Shape中的某个Paragraph
1 | import pptx |