互联网时代,虽说我们获得信息的方式变得异常简单,但要想获得有效的信息仿佛变得更加困难了。面对铺天盖地、五花八门的信息我们要学会辨别,学会有效的检索。
“都这年代了,谁还用百度啊!” 很多人或许也都这样说。其中一部分人确实是会高效的利用国外的搜索引擎,比如Google;然或许有一部分可能就有点人云亦云的嫌疑了。
你同意吗?百度仍是国内主流的搜索引擎,大家遇到问题首先想到的就是百度一下。今天就先讲一讲百度搜索。
搜索引擎的基本原理是什么呢?简单地说,搜索引擎是利用关键词进行索引,不是 有人才接触时想的那样:要在搜索框输入非常详细的内容,要你绞尽脑汁的去输入一句 “人话” 。所以你对一个机器说再多的官话也没用,机器只在乎关键词。另外,这种扣关键词作为得分要点的方式大家在语文和英语考试中应该都司空见惯了吧。
下面再介绍几个百度基本检索规则:
-
“与” 规则
词与词之间用空格隔开,百度就会默认检索包含所有关键词的网页。关键词之间是逻辑 “与” 的关系,也就是 “并且” 的关系。
-
关键词次序规则
关键词的顺序会对检索结果造成重要的影响,百度会首先匹配与关键词顺序一致的网页。
这点应该是很好理解的。比如 “我、爱、你” 这三个关键词你随便换个顺序组合一下,味道好像就变得不一样了。
-
排除常用词规则
类似于 ”的“ 之类的常用词是不作为关键词进行匹配的,会被自动忽略掉。
-
排除标点符号规则
百度会忽略绝大多数的标点符号,不会将它们作为关键词,如逗号,感叹号,句号等。
-
不区分大小写规则
关键词不区分大小写,这样设计的目的就是避免因为大小写不规范导致用户搜索不到想要的结果。
下面就介绍几个提高搜索效率和准确性的百度搜索技巧。
1,包含完整的关键词
关键词,即使中间没有空格,百度也会自动对其进行拆分,在与搜索进行匹配。比如你搜索 嵌入式学习 ,搜索引擎会把其拆分成嵌入式 和 学习 两个关键词进行索引。而你加了引号,即 “嵌入式学习” ,那么搜索引擎就会进行完整精准的匹配,使得索引的匹配程度更高。
2,排除部分来源关键词
不希望查询结果出现某些关键词,则可以用 “ - ”符号。如输入“狂飙 -好看视屏" ,一个减号就会把与好看视屏有关的结果全都删除。
3,指定某些关键词
和排除关键词相反,使用“加号+” ,就可以搜索指定关键词的内容。
4,限定搜索网站
”site:网址" ,可以限定在某些特定的网站中搜索。即可以使用 ”site: “后面加站点域名的方式实现精准搜索。例如,当下搜索" 两会 site:www.douban.com ” ,就会单纯精准的展现豆瓣上的内容。
5,书名号的应用
书名号是百度独有的查询方法,加上书名号,百度结果就会优先显示含有关键词的文学、影视等作品,同时还能避免关键词被拆分,从而实现精准匹配。
6,查询指定文件类型
通过 filetype 来限制搜索结果中的文件类型,这样我们就可以定向的搜索不同格式的文件。具体规则是:“ filetype:文档类型“(PPTWORDEXCEL),例如,” 二十大报告 filetype:pdf “,出现的文件全是 pdf 格式。
7,关键词位于网页的地址中
关键词如果位于网页的URL中,也就是网页的地址中,网页的相关度一般都会很高。通过 inurl 可以指定结果链接中包含的特定信息,注意,这和前面介绍的 site 不同,site 是指站点内搜索结果,inurl 则是指定搜索结果的 网页链接信息 ,例如,“ 基金 inurl:雪球 ”,就可以搜索到网页链接中包含雪球的信息。
每个人再使用搜索引擎去搜索时,心中肯定都有一个关键词,哪怕是模糊的。其实,无论何种搜索引擎,决定检索结果质量的关键就是关键词。这里在多说几句:怎样才能更快地找到准确的关键词,找到所需要的资料呢?可以综合使用下下面两种方法:
-
换位思考
从搜索引擎的角度换位思考。将关键词识别出来后,再去检索,结果更为全面和准确。
从待搜索的内容角度换位思考。判断内容的用语风格,基于不同的风格确定不同的检索关键词。
-
逐步逼近
首先,一开始的关键词应尽量少,先根据你的理解用一个关键词开始搜索,从返回的搜索结果中寻找线索,然后就可以识别出准确性更高的一组或多组关键词了。