Python包-WordCloud 绘制词云图

安装

1
pip install wordcloud

使用

1
2
3
4
5
w= wordcloud.WordCloud()
w.generate() # 向WordCloud对象中加载文本txt
>>>w.generate("Python and WordCloud")
w.to_file(filename) # 将词云输出为图像文件,.png或.jpg格式
>>>w.to_file("outfile.png")

数据获取

wordcloud如何将文本转化为词云

1.分隔:以空格分隔单词
2.统计:单词出现次数并过滤
3.字体:根据统计配置字号
4.布局:颜色环境尺寸

参数介绍

参数 描述 示例
width 指定词云对象生成图片的宽度,默认400像素 w=wordcloud.WordCloud(width=600)
height 指定词云对象生成图片的高度,默认200像素 w=wordcloud.WordCloud(height=400)
min_font_size 指定词云中字体的最小字号,默认4号 w=wordcloud.WordCloud(min_font_size=10)
max_font_size 指定词云中字体的最大字号,根据高度自动调节 w=wordcloud.WordCloud(max_font_size=20)
font_step 指定词云中字体字号的步进间隔,默认为1 w=wordcloud.WordCloud(font_step=2)
font_path 指定文体文件的路径,默认None w=wordcloud.WordCloud(font_path=”msyh.ttc”)
max_words 指定词云显示的最大单词数量,默认200 w=wordcloud.WordCloud(max_words=20)
stop_words 指定词云的排除词列表,即不显示的单词列表 w=wordcloud.WordCloud(stop_words=”Python”)
mask 指定词云形状,默认为长方形,需要引用imread()函数 from scipy.msc import imread ;mk=imread(“pic.png”);w=wordcloud.WordCloud(mask=mk)
background_color 指定词云图片的背景颜色,默认为黑色 w=wordcloud.WordCloud(background_color=”white”)

异常处理

中文显示乱码

  1. 进入python根目录, 然后进入Lib\site-packages\wordcloud
  2. 进入C:\Windows\Fonts目录下, 拷贝一个中文字库, 如华文新魏, 将其复制粘贴到Lib\site-packages\wordcloud目录下

image
image

  1. 打开Lib\site-packages\wordcloud目录下wordcloud.py, 找到如下这行代码
1
2
FONT_PATH = os.environ.get('FONT_PATH', os.path.join(FILE, 'DroidSansMono.ttf')) #原内容
FONT_PATH = os.environ.get('FONT_PATH', os.path.join(FILE, 'STKAITI.TTF')) #更改/添加 拷贝的字体文件
-------------本文结束感谢您的阅读-------------