爱苹果,爱生活

加入 Google Sitemaps

昨天碰巧遇到 Gaobo 在水源发 Google Sitemaps 的牢骚,于是花时间研究了一下。

Google Sitemaps 是有关 Web 抓取的实验。通过使用 Sitemaps 通知并指引抓取工具,我们希望扩展对 Web 的覆盖范围,并加快网页搜索及将其添加到索引的速度。

就这个 blog 来说,由于几乎所有页面均由服务器动态生成,因此对于搜索引擎的友好度相对较低,而使用 Sitemaps 则可以从一定程度上改善这个问题。

简单地写一点流程:

  • 使用 Sitemaps 需要使用 Google Account 登录,只要有邮箱就可以注册。
  • 进入后首先提交你的网站地址,比如我就提交了“http://www.klaith.net/”。
  • 接着验证网站的所有权,Google 的详细搜索报告只能提供给站长。有两种验证方法——修改元数据和在站点根目录下提交一个特殊命名的空 HTML 文件,建议使用后一种,比较简单,但是注意命名千万别搞错,我就因为在文件名前面多复制进一个“回车”所以无论如何都无法通过验证……
  • 然后提交 Sitemaps 文件,Google 通过这个文件来判断有哪些页面需要抓取。目前支持四种格式:Google 原创的 Sitemaps 格式、基于页面元数据收集的 OAI-PMH 格式、联合供稿(RSS)格式,以及纯文本文件格式。需要注意的是,Sitemaps 文件必须位于你的网站目录下!
  • 最后就等着 Googlebot 来抓吧!

我目前采用了 RSS 格式的 Sitemaps 提交,不过就在刚才,我翻到了创建标准 Sitemaps 文件的 WordPress 插件,感兴趣的朋友可以试试。


共有 6 条评论

  1. Rhyme's Nest May 6th, 2006 8:40 pm

    加入 Google Sitemaps

    Google Sitemaps 是有关 Web 抓取的实验。通过使用 Sitemaps 通知并指引抓取工具,我们希望扩展对 Web 的覆盖范围,并加快网页搜索及将其添加到索引的速度。
    就这个 blog…

  2. Klaith May 6th, 2006 9:15 pm

    感谢引用!

  3. 高博 May 8th, 2006 6:30 pm

    嗯,我是采取手工制作的办法来硬写并上传的,其间用了好几个欺骗Google的手段(没办法,Google也有bug)。不过,最后终于还算是成功了。我现在打算手写RSS了,谁让我的网站是基于NOTEPAD技术构建呢?

    当然,现在不用NOTEPAD,改用EmEditor了。

  4. Klaith May 9th, 2006 7:07 pm

    硬写当然也是很好的解决方法,但是对于我这种懒人,当然不可能每次修改后自己再改sitemaps^_^

    祝学长的站点越办越好!

  5. Frankel May 26th, 2006 12:42 pm

    不错,按照你的方法也生成了我的站点的sitemap

  6. Klaith May 26th, 2006 6:12 pm

    今天 Sitemaps 显示:
    Googlebot 最终在 5-18 成功访问了您的主页。

    真是矜持,再前一次应该是 5-7……

我有话要说!