词云图怎么做?数据大师不外传的秘密方法!——九数云BI
“词云”就是通过形成“关键词云层”或“关键词渲染”,对文本中出现频率较高的关键词进行视觉上的突出。下面和九数云一起来学习一下词云图怎么做吧!
前言
我们在网上经常能看到五花八门的词云图,词云图一般由词汇、颜色、大小三种元素构成,其中颜色主要用于区分不同的词汇,而字体的大小可以直观地展示词汇数值的大小。下面要聊的是词云图怎么做?一起来学习吧!
制作词云图有几种方法:
1.词云图怎么做:pyecharts —— 简单易用但不够美观
使用 pyecharts 生成词云图是一件非常简单的事情,只需要简单的几行代码即可。
2.词云图怎么做:wordcloud —— 使用最多的的词云库
wordcloud 是使用Python 制作词云图使用最广泛的工具,但是使用它制作词云图并不是一件简单的事情:首先,在安装它的时候,就很有可能遇到麻烦,因为 wordcloud 库需要依赖 Microsoft Visual C++ 环境,需要事先安装该组件;其次,为了词云图的美观,使用过程中需要配合其他第三方库使用,比如 PIL(用于加载背景图)
词云图怎么做?以上都是经常见到的,今天来说一下stylecloud —— 最接近完美的 Python 词云库
stylecloud是一款简单易用的 Python 词云生成第三方库,使用非常简单,但是得到的词云图却高级感十足。事实上,stylecloud 是 wordcloud 的高级封装版本。这意味着 stylecloud 库需要依赖 wordcloud 库。这也是我们认为它接近完美而非真正完美的原因。
1.词云图怎么做:安装stylecloud库并导入
# 导入 stylecloud 库
from stylecloud import gen_stylecloud
2.词云图怎么做:准备数据
3.词云图怎么做:选择词语形状
stylecloud 词云形状使用特定网站中的图标,进入该网站,滚动鼠标下拉找到【查看图标】,点击进入后即可在 1600+ 图形中选择中意的形状,选择图形后,点击图形右上角即可复制图形的名称,如下图所示:
我们再将复制到的内容赋给参数 icon_name 即可生成这个形状的词云,代码如下:
words= .join(tfidf_df_chaping)
gen_stylecloud(
#file_path=词频最高的200词.csv, # 必要参数,语料的路径,如果语料是列表格式,则改用 text 参数
text=words,#文本内容
size=(600,600), # 词云图的长宽,设置更大的数字可以增加成图的分辨率,但代码运行时间会随之增加
max_words=200, # 词云图中的最大词语数量
max_font_size=120, # 词云图中字号的最大值, 默认值是 200
#font_path=rC:\Windows\Fonts\SimHei.ttf, # 字体是必要的参数,否则中文会显示异常
output_name=词云图.png, # 保存词云图的路径
icon_name=fas fa-cloud # 设置词云形状为云朵,设置此参数后,系统会到自动到网页端获取对应的背景图
)
报错:
如果是10.0改为9.5还不行,再次尝试一个版本,比如说,9.4.0。
图形1
另外,再添加参数 invert_mask=True 还可以将形状反转,(代码省略)直接展示结果:
4.词云图怎么做:配色方案
配色方案将直接影响词云图的观感,在展示某些主题下的文本词云时,可以选择合适的配色。比如当我们制作与海洋产业有关系的文本词云时,可以设置主题颜色为蓝色/绿色/青色系列颜色。stylecloud 中词云的配色可以由 Python 配色工具库 palettable 来提供,其默认的配色方案也是由palettable 所提供的。我们找到了民间大神整理的配色方案PDF文档,文档中部分配色方案如下图所示:
如果想要使用图中的配色方案,只需在生成词云的代码前面声明(使用上图中左侧的代码)即可,例如,我们使用上图中 Blues_7 蓝色配色方案,声明配色方案的代码如下
# 导入配色方案库
import palettable
palettable.colorbrewer.sequential.Blues_7
# 下面在添加生成词云的代码即可
gen_stylecloud(
#file_path=词频最高的200词.csv, # 必要参数,语料的路径,如果语料是列表格式,则改用 text 参数
text=words,#文本内容
size=(600,600), # 词云图的长宽,设置更大的数字可以增加成图的分辨率,但代码运行时间会随之增加
max_words=200, # 词云图中的最大词语数量
max_font_size=120, # 词云图中字号的最大值, 默认值是 200
#font_path=rC:\Windows\Fonts\SimHei.ttf, # 字体是必要的参数,否则中文会显示异常
output_name=词云图2.png, # 保存词云图的路径
icon_name=fas fa-cloud ,# 设置词云形状为云朵,设置此参数后,系统会到自动到网页端获取对应的背景图
palette=cartocolors.qualitative.Bold_7, # 配色方案,由于前面声明了其他的配色方案(Blues_7),
当然,如果你不会代码也不要烦恼,可以使用九数云BI来解决,它是一款零代码的SaaS BI,主要面向个人、团队及中小企业的一款云端数据分析及可视化平台,可以连接excel、飞书文档、简道云表单和各类数据库,零代码分析千万级别的数据并制作各类美观图表,支持大数据量的图表制作,不需要写代码,快来试试吧!
上一篇: 1文带你快速了解矩形树图!轻松超越99%的人!——九数云BI
下一篇: 图表仪表盘必学的5个技巧!不看的后悔终生!——九数云BI