分享好友 最新资讯首页 最新资讯分类 切换频道
NLP核心技术与算法概览
2024-12-27 13:20

分词
MM法(正向最大匹配法
RMM法(逆向最大匹配法
BMM法(双向最大匹配法
HMM(隐马尔可夫模型
CRF(条件随机场

NLP核心技术与算法概览

jieba中文分词工具

词性标注
jieba中文词性标注工具
北大词性标注集
宾州词性标注集

命名体识别(NER
正则化表达式+jieba分词
CRF(条件随机场

Spacy NER模型(最先进的NER模型
Stanford NER

关键词提取
TF-IDF算法
TextRank算法
主题模型算法(LSA、LSI、LDA、word2vec

哈工大停用词表

句法分析
PARSEVAL评价体系

PCFG(基于概率的短语结构分析方法
MMMN(基于最大间隔马尔可夫网络的句法分析
基于CRFDE句法分析
SRA(移进-归约方法

PBT(英文宾州树库
CTB(中文宾州树库
TCT(清华树库
Sinica TreeBank(台湾中研院树库

Stanford Parser句法分析器

文本向量化
BOW(词袋模型

Word2vec词向量算法
NNLM(神经网络语言模型
C&W模型
CBOW模型
Skip-gram模型

Doc2vec基于句子的文本向量算法
Str2vec基于文章的文本向量算法
DM模型
DBOW模型

情感分析技术
词法分析
机器学习方法
混合分析
PMC(Polling多项式分类,多项式朴素贝叶斯
文本表示(BOW词袋模型、topic model主题模型
文本分类(SVM支持向量机、LR逻辑回归、NB朴素贝叶斯
LSTM(长短时记忆网络

IMDB情感分析数据集

NLP中用到的机器学习算法
文本分类:NB(朴素贝叶斯)、SVM(支持向量机)/SVM高斯核函数、LR(逻辑回归)、KNN(K近邻居)、DT(决策树)/随机森林、
文本聚类:K-means、DBScan、BIRCH、CURE
降维:PCA(主成分分析法
特征提取:BOW(词袋模型)、TF-IDF、N-Gram

基于深度学习的NLP算法
Word2vec词向量算法
NNLM(神经网络语言模型
C&W模型
CBOW模型
Skip-gram模型

Gensim版本Word2vec
opencc繁体字处理

LSTM
GRU
Depth Gated RNN
Clockwork RNN

Attention
Seq2Seq
NLG(自然语言生成
NLU(自然语言理解
NIC(图说模型

COCO图像标注数据集
Pascal VOC 2008
Flickr8K和30K
MSCOCO
SBU

最新文章
探讨十款高人气的电脑维护与优化工具
下面给大家推荐几款好用的免费的重装系统软件,有需要的小伙伴们来了解一下。系统重装专家官方版是一款方便易用的电脑重装软件。
百度百科词条可以随便编辑吗?谁都可以编辑吗?
很多用户会有这样的感觉,在百度上搜索某个人物名称或是某个企业名称,只要能搜出来百度百科词条就会下意识觉得这个人物或是企业
浅析访谈式课堂教学在干部培训中的应用
浅析访谈式课堂教学在干部培训中的应用中共温岭市委党校 陈周宁内容提要:干部教育是党校的核心工作之一。在新形势下,如何充分
Ubuntu16.04 下docker部署web项目
概念性的请戳安装完成之后默认会启动docker服务,如果没有启动和正常服务一样启动就好待续中·················
【面试】vivo-java开发-安卓方向-技术一面
【这里想说,因为自己也走了很多弯路过来的,所以才下定决心整理,收集过程虽不易,但想到能帮助到一部分自学java 的人,心里也
网站流量与率双提升,网络推广优化策略全解
网络推广优化旨在通过策略提升网站流量和率。关键包括:优化关键词,提高搜索引擎排名;优化网站结构,提升用户体验;运用社交媒
深入探讨床戏高峰瞬间的大尺度视频平台解析
触糖c1v1骨科是一种极具话题性的小说题材,通过探讨家庭和社会的复杂关系,引发读者的思考。在这一系列作品中,作者常常融入个人
珠三角最贵墓地每平米11万元 部分墓地限购
  每到清明,墓地价格和墓地存量就备受关注。眼看珠三角墓地价格年年水涨船高,到底哪里便宜哪里贵,各城还剩多少墓地可用?南
万能学术搜索引擎搭建-基于streamlit
万能超级搜索引擎V7.0(赚钱版)绝对是目前全国功能最优秀的超级搜索引擎之一全国已超过1000个网站和超过100家网吧正在使用本程序V
微信分身版ios免费版下载最新版
微信分身版ios免费版下载最新版是一款非常好用的社交聊天软件!我们手机上只能安装一个微信,这款软件可以同时让你安装多个。多