Google收录的查询方法不少。但,最简便的谷歌收录查询工具就是Google搜索本身,只需要输入一个查询指令,即可查看到Google对于网站的详细收录情况。
site:example.com (example.com就是你自己的域名)
通过这个指令,你可以查看到网站中已经被谷歌收录并且可以正常展示的所有网页。有时候,Google会把过于类似的网页隐藏一部分,点击搜索结果页面底部的“show all”提示即可显示全部收录页面。
谷歌收录是网站参与排名的前提,Google会先收录网站到自己的索引库里,然后根据算法计算出排名结果。也就是说,谷歌不收录的网站没有任何获得排名的机会。所以,我们需要关注自身网站的Google收录量情况。
“我的网站已经上线一年了,但目前仍然没有被谷歌收录,不知道怎么回事。我也尝试过一些方法,比如发外链什么的,但是没有效果,请问如何解决?谢谢”
网站如此长的时间没有被谷歌收录确实是存在问题的,很可能的原因是网站中使用了robots.txt协议或页面源代码中存在meta robots “noindex” 标记阻止了Google抓取网站。所以,首先检查以上两项是否设置正确。如果以上没有问题,继续查看以下方面:
- 在Lynx这样的文本浏览器中查看网站是否含有较多的文本内容,其他类型的内容,比如Flash是不能被抓取索引的。如果你的网站中没有文本格式的内容或者说实在太少,这种页面谷歌无法抓取或者放弃索引。
- 对于地域性的网站,最好在当地的谷歌网址里查看收录情况。比如,网站是后缀为.gr的希腊域名,那么最好在Google.gr上进行收录查询,这样的结果会更加准确。
- 检查主机的日志文件(一般主机空间控制台都带有这个功能),看看谷歌爬虫机器人是否访问过你的网站。如果你看到Googlebot访问过网站,但仍然没有被索引,这种情况是比较糟糕的。可能,你的域名之前被用于发送过大量的垃圾邮件,导致被列入了黑名单。
以上就是网站不被Google收录的主要可能原因。如果谷歌不收录你的网站,可以对照上述说明检查网站。
相比完全不被收录,网站部分被谷歌收录是更加常见的。一个网站页数多了,难免有些页面没有什么实际的内容,在Google看来没有收录的价值。但,如果网站大部分页面都不被收录,那就要重视起来了;最好到谷歌站长工具中查看下页面未被收录编入索引的具体原因。
熟悉谷歌的人会发现,Google收录现在越来越“挑剔”。以前的谷歌基本上对于网站都是秒收的,网站有一页收一页。现在的谷歌,收录越来越严格,对于新站更是如此,一般都需要2周左右的考察期,才会慢慢增加收录。如果你的网站大部分页面都无法被收录,一般最有可能的原因就是页面的内容质量太差。对于重复、抄袭、没有阅读性的内容,Google是不会进行收录的。
如果没有设置上的问题,内容质量也可以,谷歌不会不收录我们的网站。通过一些方法措施,我们还可以让Google尽早来抓取页面,进而收录到其索引库里。
1. 利于谷歌站长工具自行提交
谷歌现在没有公众版本的收录提交入口,想要提交一个网址,你得先注册Google站长工具,然后在其中认证网址所有权,才能获得提交这个网站网址的权利。登录站长工具后,可以在页面上方看到网址输入栏:
输入网址后,可以检测此页面的可用性,然后申请编入索引。
2. 合理使用内链接
搜索引擎通过链接抓取一个个页面,网站中多个链接指向一个页面,可以让搜索引擎尽快识别抓取那个页面。在已经被抓取的重要页面中留下链接,作用更大。这里多加注意,留下的链接要合理,与该页面内容有所关联,不要硬加硬塞。
3. 减少低质量页面
低质量页面指的是没有什么有价值的内容,甚至无法正常访问的网页。网站中如果存在大量的低质量页面,会降低谷歌对网站抓取的频率和收录的几率。所以,最好定期清理网站中的低质量页面,处理方式有以下几种:
其一,meta标签里设置为noindex
其二,通过Robots.txt文件阻止抓取。比如,禁止抓取www.example.com/sample.html这个页面,那么example这个网站的robots.txt文件里可以使用如下规则:
其三,301重定向。一般,主机后台都是带有此项功能的。
其四,直接删除。
4. 页面地址加入sitemap中
sitemap也就是网站地图,也叫站点地图,可以帮助搜索引擎了解网站中包含了哪些具体页面。没有网站地图的话,可以使用站点地图生成工具,免费生成网站地图,下载下来上传到网站根目录中。Google的站点地图需要使用xml格式的。
准备好网站地图后,可以通过谷歌站长工具进行提交:
输入sitemap地址,然后点击提交即可。
5. 站外链接
发布外链指向目标页面。这样,谷歌在抓取外链页面时,就能顺藤摸瓜识别到你的页面。