一、什么是搜索?
计算机根据用户输入的关键词进行匹配,从已有的数据库中摘录出相关的记录反馈给用户。常见的全网搜索引擎,比如百度、谷歌。垂直领域也有广泛的应用,如何淘宝、京东搜索。它们基于海量的数据!
二、倒排索引
全文搜索引擎目前主流的索引技术就是倒排索引的方式。
倒排索引又称反向索引、置入档案或反向档案,是一种索引方法,基于分词技术构建倒排索引,根据单词快速获取包含这个单词的文档列表。倒排索引主要由两个部分组成:单词词典与倒排文件。
三、 全文检索工具elasticsearch
不是一个完整的全文检索引擎,它只是一个提供全文搜索功能类库的核心工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。
现在火热的搜索引擎软件:和,它们基于lucene的搭建的,可以独立部署启动的搜索引擎服务软件,内核相同,所以对数据的操作基本一致,现在在市面应用广泛,基于java语言开发的。
四、elasticsearch应用场景
(1)为用户提供按关键字查询的全文搜索功能;
(2) 著名的框架(,,),实现企业海量日志的处理分析的解决方案。