/点击蓝字关注我们
更多科普知识与您分享/
用户画像的英文概念“User Persona”最早由 Alan Copper提出,并在早期研究中占据主流地位。Alan Copper 认为 User Persona 是真实用户的虚拟代表,根据用户行为、动机等不同将用户分为不同的类型,从中抽取每类用户的共同特征,并设定名字、照片、场景等要素对其进行描述。国外三位研究者提出用户画像是利用名字、照片、兴趣和好等要素对用户进行描述而生成的用户原型。国内一研究者认为用户画像的定义包括三个方面内容: 一是用户数据的搜集,是构建用户画像的前提和基础; 二是用户画像与业务是密不可分的,需要体现业务特色; 三是构建用户画像需要进行数学建模,需从已有的海量数据中挖掘出更深层次的用户潜在信息,并通过数据可视化技术为用户展示有价值的信息。
还有学者认为用户画像的内涵包含三个要素,即用户属性、用户特征、用户标签。
用户属性分为静态属性和动态属性,静态属性指用户的基本信息(如姓名、性别、职业等)及其他相对稳定的属性;动态属性指用户的行为信息(如访问频次、访问时长、浏览记录等)及其他动态属性,用户属性可以根据研究目的有针对性的划分,以此构建更精准的用户画像。用户特征是通过一定的方法从用户属性中抽取出来的特性或共性。用户标签是根据用户特征进一步提炼出来的标签化文本,可以精炼准确的表达用户特征,易于理解和应用。
用户画像基于主体划分可大致分为两类:基于单个用户的画像研究和基于群体用户的画像研究。
在单个用户画像的研究中,研究对象是某场景下的一个具体用户。研究者通过抽取具体某一用户多维度的特征,并分别赋予不同的标签,从而对不同用户做出个体区分。
在群体用户画像的研究中,研究对象是某场景下的特定用户群体。通过从群体用户的用户数据中抽取用户特征,研究者对具有相似用户特征的用户进行聚类,构建不同类型的用户画像。
通过相关研究梳理,用户画像的构建流程包括数据收集、特征抽取、标签表示三个步骤。
(1)数据收集。在用户画像研究中主要通过社会调查、网络数据采集和平台数据库采集三种方法来获取用户数据。①通过以访谈、观察、调研为代表的社会调查方法收集数据。②使用网络数据采集方法获取用户公开数据。③直接从平台数据库中采集用户数据。
(2)特征抽取。特征抽取是在收集用户数据的基础上,对其进行整理和分类,并通过一定的数据挖掘方法从中抽取用户特征,进一步提炼得到用户标签并构建用户画像的过程。现有的用户画像研究主要通过两类方法来完成特征抽取。①人工抽取。在相关理论的支持下,结合研究者的知识和经验,“描绘或者抽象用户属性差异”,从而抽取用户特征。这种方法具有一定的主观性,仅适用于数据表达清晰、数据量小的研究场景。②技术抽取。通过机器学习算法抽取用户特征,例如决策树、逻辑回归、支持向量机、贝叶斯网络、K 均值算法、主题模型等算法,这些方法适用于大数据环境下海量用户数据的研究场景。
(3)画像表示。画像表示是以各种直观、明了的可视化图形将构建的用户画像呈现出来的一个过程,表示方法多种多样。例如,将用户标签构成一个标签云,标签占比大小代表用户特征显著性水平;或者通过人物图片结合用户标签的形式表示用户画像;或者借助各种统计图形如直方图、雷达图的形式等来表示用户画像。
用户画像的应用场景相当广泛,包括以图书馆、医疗、金融、农业等为代表的传统行业和以社交网络平台、社会问答社区、电商网站等为代表的互联网行业等。在不同领域和场景下,用户画像的研究与实践发挥着重要价值和作用。
图文参考:
[1]宋美琦,陈烨,张瑞.用户画像研究述评[J].情报科学,2019,37(04):171-177.DOI:10.13833/j.issn.1007-7634.2019.04.027.
[2]高广尚.用户画像构建方法研究综述[J].数据分析与知识发现,2019,3(03):25-35.
[3]刘海鸥,孙晶晶,苏妍嫄,张亚明.国内外用户画像研究综述[J].情报理论与实践,2018,41(11):155-160.DOI:10.16353/j.cnki.1000-7490.2018.11.028.
声明:本文仅做知识分享,提供参考,侵必删。
推荐阅读
CiteSpace可视化分析中医药文献
卷积神经网络基础知识
网络药理学及中医药应用
数据处理效率太低?纸质版资料可以这样做
李克绍先生:灵活多变的学术风格