推广 热搜: 行业  设备    参数  系统  经纪    教师  机械  中国 

NLP快速入门:手把手教你用wordcloud做词云

   日期:2024-11-18     作者:xu1a5    caijiyuan   评论:0    移动:http://3jjewl.riyuangf.com/news/1260.html
核心提示:导读:在上一章节介绍在Python环境下调用HanLP包进行分词的基础上,本文将介绍如何使用wordcloud绘制词云。尽管目前市面上已经有

导读:在上一章节介绍在Python环境下调用HanLP包进行分词的基础上,本文将介绍如何使用wordcloud绘制词云。尽管目前市面上已经有很多成熟的在线交互词云工具,但是考虑到实际工作中有很多内容是具有保密性的,无法直接在互联网上公开。因此,如何在本地搭建词云平台,自定义地绘制词云显得格外重要。

NLP快速入门:手把手教你用wordcloud做词云

让文字更好看——词云

1.词云图是一种用来展现高频关键词的可视化表达,通过文字、色彩、图形的搭配,产生具有冲击力的视觉效果,并传达有价值的信息。

2.词云是通过形成 "关键词云层" 或 "关键词渲染",对文本中出现频率较高的关键词的视觉上的突出,词云图能过滤掉大量的文本信息,使用户只要一眼扫过文本就可以领略文本的主旨。

常用在线交互词云工具

1.微词云:https://www.weiciyun.com/

4.图悦:http://www.picdata.cn/picdata/index.php

6.美寄词云:https://www.moage.cn/wordart

wordcloud绘制词云

wordcloud是python的一个三方库,称为词云也叫做文字云,是根据文本中的词频,对内容进行可视化的汇总,可以用来绘制用户画像。

1. 如何安装 wordcloud ?

wordcloud的API总体来说并不多,且需要进行的配置并不复杂,适合新手上手。安装wordcloud可以使用python自带的pip工具来进行,本文使用的是python3.7,pip的版本是19.2.1。由于wordcloud依赖于numpy包、pillow包和matplotlib包,所以我们要先装好上述这三个包然后再装wordcloud包,安装命令如下:

2. 如何使用 wordcloud ?

wordcloud库把词云当作一个 WordCloud 对象,所以使用wordcloud可以大致分为三个步骤(以英文为例):

如下图所示,一个简易、基本的词云便生成了。值得注意的是,生成的词云可以过滤掉停用词、介词、冠词等无意义的单词。

此外, wordcloud库还有如下特点。

附上wordcloud内的配置参数

3. wordcloud 基础实战

在本节,本文将介绍如何通过读取文本从而生成自定义式的词云,主要分为以下4步:

注:使用HanLP进行中文分词可以参考我们之前的文章。

《NLP快速入门:手把手教你用HanLP做中文分词》 寒树爱函数,公众号:寒树RPA与AI

下面附上绘制简单中文词云的代码,分词的内容是十九大报告全文。

绘制的词云如下所示。

4. wordcloud 高级实战

在本节,本文将介绍如何将词云绘制在预设定好的背景图片上。例如:以我们最熟悉的中国地图为背景,我们将在此基础上绘制词云,只需修改wordcloud里的“mask”属性值,详细代码如下所示。

本文地址:http://oml01z.riyuangf.com/news/1260.html    迅易网 http://oml01z.riyuangf.com/ , 查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

 
 
更多>同类最新动态
0相关评论

文章列表
相关文章
最新动态
推荐图文
最新动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号