安装
1 | pip install wordcloud |
使用
1 | w= wordcloud.WordCloud() |
数据获取
wordcloud如何将文本转化为词云
1.分隔:以空格分隔单词
2.统计:单词出现次数并过滤
3.字体:根据统计配置字号
4.布局:颜色环境尺寸
参数介绍
参数 | 描述 | 示例 |
---|---|---|
width | 指定词云对象生成图片的宽度,默认400像素 | w=wordcloud.WordCloud(width=600) |
height | 指定词云对象生成图片的高度,默认200像素 | w=wordcloud.WordCloud(height=400) |
min_font_size | 指定词云中字体的最小字号,默认4号 | w=wordcloud.WordCloud(min_font_size=10) |
max_font_size | 指定词云中字体的最大字号,根据高度自动调节 | w=wordcloud.WordCloud(max_font_size=20) |
font_step | 指定词云中字体字号的步进间隔,默认为1 | w=wordcloud.WordCloud(font_step=2) |
font_path | 指定文体文件的路径,默认None | w=wordcloud.WordCloud(font_path=”msyh.ttc”) |
max_words | 指定词云显示的最大单词数量,默认200 | w=wordcloud.WordCloud(max_words=20) |
stop_words | 指定词云的排除词列表,即不显示的单词列表 | w=wordcloud.WordCloud(stop_words=”Python”) |
mask | 指定词云形状,默认为长方形,需要引用imread()函数 | from scipy.msc import imread ;mk=imread(“pic.png”);w=wordcloud.WordCloud(mask=mk) |
background_color | 指定词云图片的背景颜色,默认为黑色 | w=wordcloud.WordCloud(background_color=”white”) |
异常处理
中文显示乱码
- 进入python根目录, 然后进入Lib\site-packages\wordcloud
- 进入C:\Windows\Fonts目录下, 拷贝一个中文字库, 如华文新魏, 将其复制粘贴到Lib\site-packages\wordcloud目录下
- 打开Lib\site-packages\wordcloud目录下wordcloud.py, 找到如下这行代码
1 | FONT_PATH = os.environ.get('FONT_PATH', os.path.join(FILE, 'DroidSansMono.ttf')) #原内容 |