上海SEO的建议:URL标准化
易管天下·搜索引擎研究 www.egtx.org.cn 来源:网摘
转载自谷歌中文网站管理员博客
译自: Matt Cutts 博客
(译者按: Matt Cutts, 谷歌反网络作弊组的带头人, 于 2006 年 1 月 4 日在他的个人博客上发表了"SEO advice: url canonicalization"一文。尽管已快两年了,Google(谷歌)也为网站管理员提供了站长工具,我们发现对很多站长来说该文仍是一篇很好的 SEO 文章。)
在我开始收集关于 Bigdaddy 数据中心的反馈之前,我想简略地谈一谈有关标准化、“www 相对于非 www”、重新定向、重复 URLs、302“劫持”等问题的看法,这样我们的讨论才有共同的基础。
问:什么是一个标准化 URL ?为什么要用这么一个奇怪的字眼?
答:很抱歉,这是一个奇怪的词汇;这是谷歌内部对它的称呼。标准化是一个在若干选项中选取最佳 URL 的过程,这里通常是指主页。例如,多数人会将下列 URL 看作相同性质的:
* www.example.com
* example.com/
* www.example.com/index.html
* example.com/home.asp
但是从技术角度看,这些 URL 都是互不相同的。对于上述 URLs,Web 服务器会返回完全不同的内容。当谷歌“标准化”特定的 URL 时,我们试图从一整套同类 URL 中选出看起来最具代表性的一个。
问:那么我如何能确保谷歌能挑选出我所想要的 URL?
答:挑选出你想要的 URL,并且在此后一直使用这个 URL 访问特定网站,这是很有帮助的。例如,不要让同一个输入的链接一半指向 http: //example.com/ 而另一半则指向 http://www.example.com/ 。相反,挑选一个你喜欢的 URL,并且在你的内部链接中总是使用这个格式。
(译者注:现在你可以使用站长工具来通过“控制台 > 工具 > 设置首选域名”)。
问:除此之外,我还能做什么?
答:比如,如果你希望你的默认 URL 为 http://www.example.com/。那么,你可以设置你的 web 服务器,这样如果有人请求 http: //example.com/,它就会产生一个 301 的(永久性)重新定向,链接到http://www.example.com/。这样可以帮助谷歌了解到你希望将哪个 URL 作为自己的标准。如果您的网站常有变更(例如动态内容和博客等),那么加入一个 301 重新定向可能更便于搜索引擎的定位和捕获。
问:如果我希望去掉 domain.com,但希望保留 www.domain.com,我是否应该使用 URL 清除工具来删除这个域名?
答:不要,绝对不要这样做。对于任何一个 www 域名,或非 www 域名,一旦删除其结果可能导致该域名在未来六个月内无法恢复。绝对不要这样做。如果你本想使用 URL 清除工具删除 www 域名或者非 www 域名,但实际上却删除了你所有的域名,请发送一个重新收录请求,并声明你用 URL 清除工具不小心删除了整个域名,现在要求重新收录。
问:我注意到,你自己并没有使用 301 重新定向将你的站点从非 www 版本转向 www 版本,为何没有这样做?
答:实际上我是故意这样做的。我几个月之前就注意到了这一点,但决定不自行调整,或者请求谷歌员工帮我搞定它。我或许最终会加入一个 301,但至少到目前为止,它还是一个有帮助的实验案例。
问: 那么在讨论“www 与非 www”时,你也认为这是一种标准化的类型吗?还有没有别的方法能实现 URL 的标准化?
答:确实还有很多方法,但是多数人不会也无需注意到这些。搜索引擎能够自动完成诸如保留或者删除末尾的斜杠、将 URL 从大写格式转换为小写格式,或者将 session ID 从 BBS 或其他软件上删除等任务(即使你省略了 session ID,许多 BBS 依然能够正常运行)。
问:让我们谈谈"inurl:"操作符。为何每个人都认为如果 inurl:mydomain.com 显示出某些并非来自 mydomain.com 的结果,那么他一定是被人劫持了?