词云图怎么做?数据大师不外传的秘密方法!——九数云BI

标签: 词云图怎么做 | 发布时间: 2024-10-29 18:56:09

“词云”就是通过形成“关键词云层”或“关键词渲染”,对文本中出现频率较高的关键词进行视觉上的突出。下面和九数云一起来学习一下词云图怎么做吧!

前言

我们在网上经常能看到五花八门的词云图,词云图一般由词汇、颜色、大小三种元素构成,其中颜色主要用于区分不同的词汇,而字体的大小可以直观地展示词汇数值的大小。下面要聊的是词云图怎么做?一起来学习吧!

词云图怎么做?数据大师不外传的秘密方法!——九数云BI插图

制作词云图有几种方法:

1.词云图怎么做:pyecharts —— 简单易用但不够美观

使用 pyecharts 生成词云图是一件非常简单的事情,只需要简单的几行代码即可。

词云图怎么做?数据大师不外传的秘密方法!——九数云BI插图1

2.词云图怎么做:wordcloud —— 使用最多的的词云库

wordcloud 是使用Python 制作词云图使用最广泛的工具,但是使用它制作词云图并不是一件简单的事情:首先,在安装它的时候,就很有可能遇到麻烦,因为 wordcloud 库需要依赖 Microsoft Visual C++ 环境,需要事先安装该组件;其次,为了词云图的美观,使用过程中需要配合其他第三方库使用,比如 PIL(用于加载背景图)

词云图怎么做?数据大师不外传的秘密方法!——九数云BI插图2

词云图怎么做?以上都是经常见到的,今天来说一下stylecloud —— 最接近完美的 Python 词云库

stylecloud是一款简单易用的 Python 词云生成第三方库,使用非常简单,但是得到的词云图却高级感十足。事实上,stylecloud 是 wordcloud 的高级封装版本。这意味着 stylecloud 库需要依赖 wordcloud 库。这也是我们认为它接近完美而非真正完美的原因。

1.词云图怎么做:安装stylecloud库并导入

词云图怎么做?数据大师不外传的秘密方法!——九数云BI插图3

# 导入 stylecloud 库 
from stylecloud import gen_stylecloud

2.词云图怎么做:准备数据

词云图怎么做?数据大师不外传的秘密方法!——九数云BI插图4

3.词云图怎么做:选择词语形状

stylecloud 词云形状使用特定网站中的图标,进入该网站,滚动鼠标下拉找到【查看图标】,点击进入后即可在 1600+ 图形中选择中意的形状,选择图形后,点击图形右上角即可复制图形的名称,如下图所示:

词云图怎么做?数据大师不外传的秘密方法!——九数云BI插图5

词云图怎么做?数据大师不外传的秘密方法!——九数云BI插图6

我们再将复制到的内容赋给参数 icon_name 即可生成这个形状的词云,代码如下:

words= .join(tfidf_df_chaping)
gen_stylecloud(
    #file_path=词频最高的200词.csv,   # 必要参数,语料的路径,如果语料是列表格式,则改用 text 参数
    text=words,#文本内容
    size=(600,600),         # 词云图的长宽,设置更大的数字可以增加成图的分辨率,但代码运行时间会随之增加
    max_words=200,        # 词云图中的最大词语数量
    max_font_size=120,      # 词云图中字号的最大值, 默认值是 200
    #font_path=rC:\Windows\Fonts\SimHei.ttf,  # 字体是必要的参数,否则中文会显示异常
    output_name=词云图.png,      # 保存词云图的路径
    icon_name=fas fa-cloud    # 设置词云形状为云朵,设置此参数后,系统会到自动到网页端获取对应的背景图
)

报错:

词云图怎么做?数据大师不外传的秘密方法!——九数云BI插图7

词云图怎么做?数据大师不外传的秘密方法!——九数云BI插图8

如果是10.0改为9.5还不行,再次尝试一个版本,比如说,9.4.0。

词云图怎么做?数据大师不外传的秘密方法!——九数云BI插图9

图形1

词云图怎么做?数据大师不外传的秘密方法!——九数云BI插图10

另外,再添加参数 invert_mask=True 还可以将形状反转,(代码省略)直接展示结果:

词云图怎么做?数据大师不外传的秘密方法!——九数云BI插图11

4.词云图怎么做:配色方案

配色方案将直接影响词云图的观感,在展示某些主题下的文本词云时,可以选择合适的配色。比如当我们制作与海洋产业有关系的文本词云时,可以设置主题颜色为蓝色/绿色/青色系列颜色。stylecloud 中词云的配色可以由 Python 配色工具库 palettable 来提供,其默认的配色方案也是由palettable 所提供的。我们找到了民间大神整理的配色方案PDF文档,文档中部分配色方案如下图所示:

词云图怎么做?数据大师不外传的秘密方法!——九数云BI插图12

词云图怎么做?数据大师不外传的秘密方法!——九数云BI插图13

如果想要使用图中的配色方案,只需在生成词云的代码前面声明(使用上图中左侧的代码)即可,例如,我们使用上图中 Blues_7 蓝色配色方案,声明配色方案的代码如下

# 导入配色方案库
import palettable
palettable.colorbrewer.sequential.Blues_7
# 下面在添加生成词云的代码即可
gen_stylecloud(
    #file_path=词频最高的200词.csv,   # 必要参数,语料的路径,如果语料是列表格式,则改用 text 参数
    text=words,#文本内容
    size=(600,600),         # 词云图的长宽,设置更大的数字可以增加成图的分辨率,但代码运行时间会随之增加
    max_words=200,        # 词云图中的最大词语数量
    max_font_size=120,      # 词云图中字号的最大值, 默认值是 200
    #font_path=rC:\Windows\Fonts\SimHei.ttf,  # 字体是必要的参数,否则中文会显示异常
    output_name=词云图2.png,      # 保存词云图的路径
    icon_name=fas fa-cloud ,# 设置词云形状为云朵,设置此参数后,系统会到自动到网页端获取对应的背景图
    palette=cartocolors.qualitative.Bold_7,  # 配色方案,由于前面声明了其他的配色方案(Blues_7),

当然,如果你不会代码也不要烦恼,可以使用九数云BI来解决,它是一款零代码的SaaS BI,主要面向个人、团队及中小企业的一款云端数据分析及可视化平台,可以连接excel、飞书文档、简道云表单和各类数据库,零代码分析千万级别的数据并制作各类美观图表,支持大数据量的图表制作,不需要写代码,快来试试吧!



上一篇:
下一篇:
相关内容