我们常见的数据主要是以数字方式存在的,而在现在大数据爆发时代,数据不仅仅包括数字,还包括一些非结构化数据,如文字、语音、图片等,今天我们介绍一种Power BI 的可视化对象,用于表达文字频率的效果——词云图。
1、词云图简介
词云是词的频率和值的视觉表示,使用它可以立即洞察数据中最重要的术语。
借助于繁琐中的 '云' 的交互体验, 您不必再通过大量的文本挖掘来找出哪些词是突出的或普遍的。您可以简单地将它们可视化为 Word 云, 并立即获得大图片和用户电源 BI 的交互性, 以进一步切片和骰子, 以揭示文本内容背后的主题。
词云图,也叫文字云,是对文本中出现频率较高的“关键词”予以视觉化的展现,词云图过滤掉大量的低频低质的文本信息,使得浏览者只要一眼扫过文本就可领略文本的主旨。
2、数据准备
按照惯例,我们先准备一组数据,如下图所示:
数据包括两个字段,为关键词(Words)以及词出现的频次(Value),我们就先用这组简单的数据,看看如何更好的表达我们想要看到的核心词。
我们先将这组数据导入到Power BI Desktop 中,效果如下图所示:
3、插入可视化对象
我们这次使用的可视化对象,并为Power BI Desktop 默认安装包括的对象,因此需要插入一个Word Cloud对象,操作方法如下图所示: