Python将文本内容读取分词并绘制词云图 - 寂天风

lq13035130506 2021-10-05 原文

Python将文本内容读取分词并绘制词云图

功能：Python将文本内容读取分词并绘制词云图

import matplotlib
import matplotlib.pyplot as plt #数据可视化
import jieba #词语切割
import wordcloud #分词
from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS #词云，颜色生成器，停止
import numpy as np #科学计算
from PIL import Image #处理图片

def ciyun():
    #打开文本
    with open(\'dancitiao.txt\',\'r\',encoding=\'UTF-8\') as f:  # 打开新的文本转码为utf-8
        textfile= f.read()  #读取文本内容
    wordlist = jieba.cut_for_search(textfile)#切割词语
    space_list = \' \'.join(wordlist) # 链接词语
    backgroud = np.array(Image.open(\'beijin.png\')) #背景图片，只有黑白图才能按照形状生成词云
    mywordcloud = WordCloud(width=14000, height=2200,
                            background_color=None, mode="RGBA",#背景颜色
                            mask=backgroud, #写字用的背景图，从图片中提取颜色
                            max_words=500, #最大词语数
                            stopwords=STOPWORDS,#停止的默认词语
                            font_path=\'simkai.ttf\',#源码自带字体
                            max_font_size=200,#最大字体尺寸
                            random_state=50,#随机角度
                            scale=1).generate(space_list) #生成词云
    image_color = ImageColorGenerator(backgroud)#生成词云的颜色
    plt.imshow(mywordcloud) #显示词云
    plt.axis(\'off\') #关闭坐标（x,y轴）
    plt.savefig(\'cytu.png\') #保存图片
    plt.show()#显示
 
def main():
    ciyun()
 
if __name__ == \'__main__\':
    main()

版权声明：本文为lq13035130506原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/lq13035130506/archive/2004/01/13/12326082.html

Python将文本内容读取分词并绘制词云图 - 寂天风的更多相关文章

时区的概念定义和发展史 – jack_Meng
时区的概念定义和发展史时区的概念关于时区的概念，其实初中地理课已经涉及，很多人都多少了解一些，可能只是细节 […]...
全球图像传感器市场市占排名 – cn2022
全球图像传感器市场市占排名今年智能手机的主摄已经达到4800万像素，甚至千元机都开始使用。小米、OPPO最近 […]...
石子归并 51Nod – 1021
N堆石子摆成一条线。现要将石子有次序地合并成一堆。规定每次只能选相邻的2堆石子合并成新的一堆，并将新的一堆石子 […]...
对学Oracle数据库初学者的开场篇 – 梦之航
对学Oracle数据库初学者的开场篇前言：因为项目原因，近期开始学习Oracle数据库。Oracle是目前最 […]...
Windows net命令使用方法 – IriczhaoLive2D
Windows net命令使用方法 net命令大全,net命令用法,net网络命令,net命令使用,net命令 […]...
最近好想做外汇交易，苦于没有时间进行系统的研究和模拟盘面操作 – linbaba
最近好想做外汇交易，苦于没有时间进行系统的研究和模拟盘面操作历经2007年辉煌的中国股市，本人没有赚到一分钱 […]...
Linux – SpringBoot文件上传、下载和访问
一、上传与下载使用Java将文件、图片等通过ftp协议上传到linux中 1）Linux配置在上传与下载之 […]...
Deep Learning(3)算法简介 – Loull
Deep Learning(3)算法简介 2013-07-04 22:57 Loull 阅读(392) […]...

随机推荐

DOM4J解析xml
　XML的解析方式分为四种：1、DOM解析；2、SAX解析；3、JDOM解析；4、DOM4J解析。其中前两种属 […]...
聊聊阿里面试的三个层次
博主个人独立站点开通啦！欢迎点击访问：https://shuyi.tech 最近去阿里的菜鸟国际做了一次面试交 […]...
Windows10无法修改图标字体和菜单栏字体问题 —— regedit注册表修改
1.打开注册表 regedit 2.修改如图所示的几个表分别单击选择修改 CaptionFont […]...
Mac 解压zip文件错误：无法将\”*.zip\”解压缩到\”\” （错误 1-操作不被允许）
错误提示：无法将”*.zip”解压缩到”” （错误 1- […]...
集群一键启动/停止脚本
集群一键启动/停止脚本集群一键启动/停止脚本 1.集群一键启停脚本：mysh #!/bin/bash #1 […]...
你知道，HTTPS用的是对称加密还是非对称加密？ – im中国人
你知道，HTTPS用的是对称加密还是非对称加密？本文将带你了解HTTPS到底用的是对称加密还是非对称加密，以 […]...
Assemble实验报告
这是第一二章的汇编语言上机实验，这次实验的主要内容是掌握使用debug工具编写和调试汇编命令的方法，掌握一 […]...
layer —— 一个简单的jQuery弹出层插件
layer的使用 4.24更新：注意：layer现在有旧版1.8.5版本和新版本3.0版本的，对应引入的JQ也 […]...

展开目录

目录导航