社会网络分析方法
越来越多的被运用到各种研究中
现在主流的六种社会网络分析软件
各自有哪些优点与不足
01 UCINET简介
UCINET为菜单驱动的Windows程序,可能是最知名和最经常被使用的处理社会网络数据和其他相似性数据的综合性分析程序。与UCINET捆绑在一起的还有Pajek、Mage和NetDraw等三个软件。UCINET能够处理的原始数据为矩阵格式,提供了大量数据管理和转化工具。该程序本身不包含网络可视化的图形程序,但可将数据和处理结果输出至NetDraw、Pajek、Mage和KrackPlot等软件作图。UCINET包含大量包括探测凝聚子群(cliques,clans, plexes)和区域(components,cores)、中心性分析(centrality)、个人网络分析和结构洞分析在内的网络分析程序。UCINET还包含为数众多的基于过程的分析程序,如聚类分析、多维标度、二模标度(奇异值分解、因子分析和对应分析)、角色和地位分析(结构、角色和正则对等性)和拟合中心-边缘模型。此外,UCINET提供了从简单统计到拟合p1模型在内的多种统计程序。
02 Pajek简介
Pajek 是一个特别为处理大数据集而设计的网络分析和可视化程序。Pajek可以同时处理多个网络,也可以处理二模网络和时间事件网络(时间事件网络包括了某一网络随时间的流逝而发生的网络的发展或进化)。Pajek提供了纵向网络分析的工具。数据文件中可以包含指示行动者在某一观察时刻的网络位置的时间标志,因而可以生成一系列交叉网络,可以对这些网络进行分析并考察网络的演化。不过这些分析是非统计性的;如果要对网络演化进行统计分析,需要使用StOCNET 软件的SIENA模块。Pajek可以分析多于一百万个节点的超大型网络。Pajek提供了多种数据输入方式,例如,可以从网络文件(扩展名NET)中引入ASCII格式的网络数据。网络文件中包含节点列表和弧/边(arcs/edges)列表,只需指定存在的联系即可,从而高效率地输入大型网络数据。图形功能是Pajek的强项,可以方便地调整图形以及指定图形所代表的含义。由于大型网络难于在一个视图中显示,因此Pajek会区分不同的网络亚结构分别予以可视化。每种数据类型在Pajek中都有自己的描述方法。Pajek提供的基于过程的分析方法包括探测结构平衡和聚集性(clusterability),分层分解和团块模型(结构、正则对等性)等。Pajek只包含少数基本的统计程序。
03 NetMiner 简介
NetMiner是一个把社会网络分析和可视化探索技术结合在一起的软件工具。它允许使用者以可视化和交互的方式探查网络数据,以找出网络潜在的模式和结构。NetMiner采用了一种为把分析和可视化结合在一起而优化了的网络数据类型,包括三种类型的变量:邻接矩阵(称作层)、联系变量和行动者属性数据。与Pajek和NetDraw相似,NetMiner也具有高级的图形特性,尤其是几乎所有的结果都是以文本和图形两种方式呈递的。NetMiner提供的网络描述方法和基于过程的分析方法也较为丰富,统计方面则支持一些标准的统计过程:描述性统计、ANOVA、相关和回归。
04 STRUCTURE 简介
STRUCTURE是一个命令驱动的DOS程序,需要在输入文件中包含数据管理和网络分析的命令。STRUCTURE支持五种网络分析类型中的网络模型:自主性(结构洞分析)、凝聚性(识别派系)、扩散性、对等性(结构或角色对等性分析和团块模型分析)和权力(网络中心与均质分析)。STRUCTURE提供的大多数分析功能是独具的,在其他分析软件中找不到。
05 MultiNet简介
MultiNet是一个适于分析大型和稀疏网络数据的程序。由于MultiNet是为大型网络的分析而专门设计的,因而像Pajek那样,数据输入也使用节点和联系列表,而非邻接矩阵。对于分析程序产生的几乎所有输出结果都可以以图形化方式展现。MultiNet可以计算degree,betweenness, closeness and components statistic,以及这些统计量的频数分布。通过MultiNet,可以使用几种本征空间(eigenspace)的方法来分析网络的结构。MultiNet包含四种统计技术:交叉表和卡方检验,ANOVA,相关和p*指数随机图模型。
06 StOCNET简介
StOCNET是个WINDOWS环境下的开放软件系统,适用于社会网络的高级统计分析。它提供了一个应用多种统计方法的平台,每种统计方法可以以单独模块的形式方便地嵌入其中。StOCNET包含六个统计模块:(1)BLOCKS,随机块模型;(2)ULTRAS,使用超度量(Ultrametrics)估计潜在的传递性结构(latenttransitive structures);(3)P2,拟合指数随机图p2模型;(4)SIENA,纵向网络数据的分析;(5)ZO,确定随机图统计量的分布概率;(6)PACNET,构造和拟合基于偏代数结构的结构模型(structuralmodels based on partial algebraic structures)。
6 款软件分析和比较
表1描述了六个主要的社会网络分析软件的主要目标或特性。其中,数据格式包括下面三个方面:(1)程序能够处理的数据类型,(2)输入格式,和(3)是否有标明网络关系缺失值的选项。功能方面包括是否包含可视化选项以及可执行的分析类型。支持则包括程序的可得性、是否有操作手册和在线帮助。
表1 六个社会网络分析软件功能介绍
注释:
a c=全局,e=个人中心,a=从属关系,l=大型网络。
b m=矩阵,ln=连接/节点,n=节点
c d=描述,sl=结构和位置,rp=角色和地位,dt=二元和三元方法,s=统计
d com=商业产品,free=自由/共享软件
e 不再更新的DOS程序
g 只有对属性的缺失值编码
h 没有作图程序
i 能够从互联网上免费获取(有些功能有所减少)
j 可以获得评估/演示版本的程序
下面我们以功能、支持和用户友好性三个大方面来对上述六个软件进行综合评价(见表2)。+号代表好(或至少是合格的),++代表很好或强大,-代表存在缺陷,0代表无,+-代表不确定(有好有坏)。必须强调的是,由于各个软件的目标不尽相同,因而不可能在它们之间做出完全公平的比较。因此建议也可以从垂直的方向阅读表3- 2。例如,如果要寻找一个可以获得许多描述性网络度量的软件,则UCINET和NetMiner是很好的选择。但如果网络可视化是主要目的,则Pajek和NetMiner是更好的选择。
表2 六个社会网络分析软件功能比较
注释:
a 基于过程的分析方法
b UCINET包含网络可视化软件NetDraw
注:文章授权转载自管理学季刊,文章版权归原作者所有。