目录
1 绪论1
1.1 研究背景及意义1
1.2 文献综述2
1.2.1 人才需求分析的文献综述2
1.2.2 文本挖掘的文献综述4
1.3 研究方法与思路6
1.3.1 研究思路6
1.3.2 研究方法8
1.4 本文结构9
1.5 创新点10
2 数据采集与预处理11
2.1 数据采集11
2.2 数据预处理13
3 数据分析岗的主要特征16
3.1 样本公司画像16
3.2 岗位招聘量差异18
3.3 岗位的具体需求21
3.4 薪资的影响因素22
4 各地区岗位要求的主题词提取25
4.1 主题模型原理25
4.2 基于LDA 模型的主题词提取27
4.2.1 文本预处理与特征表示27
4.2.2 LDA 模型的构建29
5 岗位要求的文本聚类34
5.1 文本向量化原理34
5.1.1 词袋模型与TF-IDF34
5.1.2 Word2vec 模型35
5.2 聚类原理42
5.3 模型构建45
5.4 模型效果比较47
5.5 岗位对比50
6 结论建议与展望54
I
6.1 结论54
6.2 建议55
6.3 不足与展望57
参考文献59
附录62
致谢77
II
Co
ntents
Chapter 1 Introduction 1
1.1 Research Background and Significance 1
1.2 Literature Review2
1.2.1 Literature Review of Talent Demand Analysis2
1.2.2 Literature Review of Text Mining 4
1.3 Research Methods and Ideas6
1.3.1 Research Ideas 6
1.3.2 Research Methods8
1.4 Structure of This Article9
1.5 Innovative Points 10
Chapter 2 Data Acquisition and Preprocessing 11
2.1 Data Acquisition 11
2.2 Data Preprocessing 13
Chapter 3 Key Features of Data Analysis Post 16
3.1 Sample Company Portrait 16
3.2 Job Demand Differences 18
3.3 Job Specific Needs 21
3.4 Influencing Factors of Salary 22
Chapter 4 Keyword Extraction for Posts Required by Region 25
4.1 Topic Model Principle25
4.2 Topic Words Extraction B
ased on LDA Model 27
4.2.1 Text Preprocessing and Feature Representation 27
4.2.2 Co
nstruction of LDA Model 29
Chapter 5 Text Clustering for Posts 34
5.1 Text Vectorization Principle 34