赞!python 生成词云详细教程-最简单的中文词云生成代码

pip install wordcloud

赞!python 生成词云详细教程-最简单的中文词云生成代码

pip install jieba

赞!python 生成词云详细教程-最简单的中文词云生成代码

wordcloud生成词云

效果图:

赞!python 生成词云详细教程-最简单的中文词云生成代码

代码:

from wordcloud import WordCloud
import matplotlib.pyplot as plt #绘制图像的模块
import jieba     #jieba分词

path_txt='d://西游.txt'
f = open(path_txt,'r',encoding='UTF-8').read()

# jieba分词,生成字符串,wordcloud无法直接生成正确的中文词云
cut_text = " ".join(jieba.cut(f))

wordcloud = WordCloud(
 #设置字体,不然会出现口字乱码,文字的路径是电脑的字体一般路径,可以换成别的
 font_path="C:/Windows/Fonts/SIMLI.TTF",
 #设置了背景,宽高
 background_color="white",width=1000,height=880).generate(cut_text)

plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")
plt.show()

改进孙悟空形状的西游记人物词云:

赞!python 生成词云详细教程-最简单的中文词云生成代码

西游记人物词云文本下载

from PIL import Image
from wordcloud import WordCloud, ImageColorGenerator
import matplotlib.pyplot as plt
import numpy as np
import jieba


path_txt='d://西游.txt'
path_img = "d://孙悟空.jpg"
f = open(path_txt, 'r', encoding='UTF-8').read()
background_image = np.array(Image.open(path_img))
 # 结巴分词,生成字符串,如果不通过分词,无法直接生成正确的中文词云,感兴趣的朋友可以去查一下,有多种分词模式
 # Python join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。
cut_text = " ".join(jieba.cut(f))

wordcloud = WordCloud(
  # 设置字体,不然会出现口字乱码,文字的路径是电脑的字体一般路径,可以换成别的
  font_path="C:/Windows/Fonts/SIMLI.TTF",
  background_color="white",
  # mask参数=图片背景,必须要写上,另外有mask参数再设定宽高是无效的
  mask=background_image).generate(cut_text)
 # 生成颜色值
image_colors = ImageColorGenerator(background_image)
 # 下面代码表示显示图片
plt.imshow(wordcloud.recolor(color_func=image_colors), interpolation="bilinear")
plt.axis("off")
plt.show()

赞!python 生成词云详细教程-最简单的中文词云生成代码

 

125jz网原创文章。发布者:江山如画,转载请注明出处:http://www.125jz.com/12038.html

(9)
江山如画的头像江山如画管理团队
上一篇 2023年5月26日 上午7:22
下一篇 2023年6月2日 上午7:51

99%的人还看了以下文章

  • 新闻管理系统数据库设计

    新闻管理系统数据库,包含用户表、新闻评论表、管理员表、栏目表、新闻表、评论表、关键字表 每个表的数据字段,数据类型,是否为空,描述,见下表:

    2020年4月11日
    11.2K0
  • ADODB.Connection ���� ‘800a0e7a’ win7 IIS运行ASP常见问题及解决方法

    在win7系统通过 IIS运行ASP出现以下错误提示: ADODB.Connection 错误 ‘800a0e7a’ 很多人根据错误提示,去查数据库连接代码,其实数据库的连接代码没有错误。 出现ADODB.Connection 错误 ‘800a0e7a’的 原因 是64位Windows7操作系统中,IIS7应用程序池默认没有启用32位应用程序,而我们连接AC…

    2018年6月1日
    5.7K0
  • Python数据分析及可视化,科学计算练习题

    第一章 单元测试 1、 问题:数据分析是指通过分析手段、方法和技巧对准备好的数据进行探索、分析,从中发现因果关系、内部联系和业务规则,为商业提供决策参考。( )选项:A:对B:错答案: 【对】 2、 问题:Anaconda中包含了conda、Python在内的超过18个科学包及其依赖项。( )选项:A:对B:错答案: 【对】 3、 问题:数据分析是一个有目的…

    2022年1月29日
    26.0K1
  • 第四章 数据库应用开发案例2

    本章重点讲述以下内容:
    4.4 应用JDBC调用存储过程
    4.5 数据源与连接池技术
    4.6 数据库程序开发案例

    2018年2月7日
    2.5K0
  • python 中time.gmtime()与localtime()的区别

    gmtime转换的时间是UTL时间,与北京时间相差了8个小时 import time print(time.time()) print(time.strftime(“%Y-%m-%d 星期%w %H:%M:%S”,time.localtime())) print(time.strftime(“%Y-%m-%d 星期%w %H:%M:%S”,time.gmti…

    2022年7月15日
    8.4K0
  • 500 Internal Server Error 错误原因及解决方法(图)

    500 属于服务器内部错误。如果其他网站可以打开,就这一网站打不开,那是该网站的服务器出了问题,跟你的电脑无关,如果其他网页都打不开,你就试着用工具修复一下浏览器。 500内部服务器错误的一般原因是IIS服务器无法解析ASP代码。 如:ASP语法出错、ACCESS数据库连接语句出错,文件引用与包含路径出错、使用了服务器不支持的组件如FSO等。 如果在Wind…

    2018年7月2日
    34.0K0

发表回复

登录后才能评论

评论列表(2条)

  • 江山如画的头像
    江山如画 2023年6月9日 上午10:01

    import matplotlib ImportError: DLL load failed 问题及解决方法
    打开https://www.lfd.uci.edu/~gohlke/pythonlibs/#scikit-learn
    找到相应版本的numpy-1.21.6+mkl-cp37-cp37m-win32.whl 下载
    进入命令行:开始输入cmd 回车进入 文件下载目录 如cd d://
    pip install numpy-1.21.6+mkl-cp37-cp37m-win32.whl
    安装成功即可。

  • 江山如画的头像
    江山如画 2023年6月2日 上午7:41

    输入python显示不是内部命令的原因及解决方法 http://www.125jz.com/12001.html
    简!python中安装pip的方法 http://www.125jz.com/11997.html