11/21/2008 05:19:00 下午
发表者: Maile Ohye, 开发者项目技术带头人 原文: Importance of link architecture发表于:2008年10月6日星期一 晚上10:51 作为链接专题系列的第二篇, 我们想与您讨论一下链接架构的重要性,并且回答您相关的问题。链接架构---您网站的内部链接方式——是您在网站规划中的重要部分,并对您的网站被搜索引擎的索引状况有重要影响。它也对谷歌机器人是否能找到您的各个网页并进而使用户能顺利访问到它们的起到决定作用。 确保您的核心网页只需通过首页的几次点击就能到达 您或许会认为比起目录式导航来说,用户可能更喜欢使用您网站上的搜索框,但是您的这种做法经常会为搜索引擎爬虫设置障碍,因为他们几乎无法做到在搜索框里输入文字搜索或在下拉菜单里浏览。因此,您需要确认您的重要网页都可以从首页点击访问,并让Googlebot方便地遍历您的网站。您最好建立一个链接架构,这样既便于用户浏览,也便于搜索引擎抓取。下面是一些具体的建议: 符合用户习惯的导航设置您应该尝试将自己代入“用户”的角色,模拟用户的习惯来设计您的网站。比如说,如果您的网站是关于篮球的,想象您是一个想了解最佳运球技巧的访问者。 - 我们先从首页开始吧,如果用户并不使用您网站的搜索功能和下拉菜单,他们能方便地通过你提供的导航链接找到他们想要的信息么(比如篮球巨星的运球技巧)?
- 再比如说一个用户是通过一个外部链接找到您的网站的,但是他们首先到达的不是首页。不管用户首先来到的是哪一页,您都要确保他们能够顺利的找到首页及其他相关部分的链接。换句话说,您要确保您的用户不会迷失方向。您的用户能方便找到“最佳运球技巧”吗?像“首页>技巧>运球” 这样的导航能够帮助用户了解自己所处的网页层次。
为搜索引擎设置可抓取的链接- 文字链接是很容易被搜索引擎发现的,如果您特别关注自己的内容是否能被正常索引的话,使用文字链接是一种比较稳妥的办法。可以想象您肯定也会采用一些最近的技术,但是无论怎样,文字链接对用户和搜索引擎来说都是更友好,更便于访问的。
这个<a href="/new-page.html">文字链接</a>容易被搜索引擎发现。 - 提交网站地图对主要搜索引擎来说也很有帮助,尽管它不应该取代一个便于抓取的链接架构。如果您的网站使用一些更新的技术,比如AJAX,您可以参考下文中的“确认Googlebot能够找到您的内部链接”。
使用描述性定位文字(anchor text)描述性的定位文字,也就是通常看到的在链接中可以点击的词语,是一个对搜索引擎和用户很有帮助的信号。通过您的内容、标题、定位文字等等,Google越了解您的网站,就能为搜索用户(其中很可能包含您的潜在用户)返回越相关的结果。比如,如果您在运营一个篮球网站,并且您想通过文字链接为用户提供一些视频的话,很多网站管理员是这样设置链接的: 如果您想观看我们的篮球视频,请<a href="videos.html">点击这里 </a>浏览视频列表。 我们不建议您使用这种泛泛的“请点击这里”,我们建议您将定位文字替换成更具描述意义的文字,例如: 欢迎您观赏我们的<a href="videos.html">篮球视频</a> 确认Googlebot”能够找到您的内部链接对于已经验证了对网站权限的用户, 网站管理员工具提供了“链接> 含内部链接的网页”的功能,这是一个非常有利于验证Googlebot已经成功地找到了您所期望的链接的功能。特别是当您的网站在导航中使用了JavaScript(Googlebot通常不能很好运行并抓取)等技术的时候,你可能很想知道自己的其他内部链接到底是否被Googlebot成功地识别了。 这里有一个关于“ 网站管理员中心404专题周”的内部链接的屏幕截图。我们的内部链接正如我们预期的一样,都被成功发现了。 欢迎您就内部链接的话题提出您的问题这里是其中的一部分... 问:我可以使用 rel="nofollow"来是我们内部链接的Page Rank流动最大化么? 答:我们自身实际上也是在Google工作的网站管理员,您所考虑的这些实际上不是我们会花时间考虑的。换句话说,如果您的网站已经有了很好的链接架构,那么与其经常担心自己的PageRank,倒不如把更多的精力投入到为用户提供更好的内容上面。 Matt Cutts曾经在网站管理员帮助论坛上回答过 “合理使用nofollow”的问题。 问:比如我的网站是关于我的自行车和露营两大爱好的。我应当让我的内部链接架构主题化组织,而不在两者之间互相链接么? 答:我们目前为止还没有发现过有网站管理员通过刻意将他们的链接架构高度主题化而从中受益的。同时,如果一个访问者不能方便地访问您网站的各部分的时候,这通常意味着,这种结构对搜索引擎的抓取也是有障碍的。 这里请允许我们再重复一遍,请您尽量创建固定并合理的链接架构(包括符合用户习惯的导航设置和为搜索引擎设置可抓取的链接),并积极实行一些对您的用户和他们的使用体验都有益处的措施。 谢谢您阅读这篇文章! 关于导入链接的文章即将作为 链接专题系列的第三篇发表。如果您有关于内部链接的好的建议或问题的话,欢迎您在本文后或 网站管理员支持论坛中发表。 标签: SEO, 网站管理员小贴士
固定链接
0个评论
11/19/2008 02:53:00 下午
发表者: Maile Ohye, 开发者项目技术带头人
原文:Links information straight from the source我们期待您能通过提供优质的内容和服务来服务于用户和整个互联网。与此同时,您或许经常听到来自互联网界的关于链接问题的讨论,人们各持己见,争论不休。您或许会问,“这到底是怎么回事—关于链接我究竟应该了解些什么呢?” 如果您也对这个话题感兴趣,欢迎您阅读链接专题系列,本文是此系列的第一篇文章。 第二篇: 内部链接 (您网站内部的链接) 例如,您的首页有指向“联系我们”的链接,而您的“联系我们”页又有指向“关于我们”的链接,这类链接都属于内部链接。内部链接(也称为链接结构),是很重要的,因为它是决定用户是否能方便地访问您的网站的决定因素。而且,内部链接也决定着您网站的可抓取性---搜索引擎蜘蛛能不能方便地爬行您的网页。欲知详情,请阅读本链接专题的第二篇文章。

第三篇: 导出链接 (您所链向的网站) 导出链接是您所链向的外部网站。比如www.google.com/webmasters 就有指向googlewebmastercentral.blogspot.com 的链接。导出链接使我们可以在网上自由冲浪---这也是互联网变得如此丰富多彩和富有合作精神的重要原因。如果没有导出链接,您的网站将与互联网社区与世隔绝,因为每一页都变成了最简单的文本。大部分的网站包含的都是一些自然的导出链接,因此大多数情况都是无需担忧的。如果您有其他的问题,我们将在第三篇文章里详述导出链接这个话题。 第四篇: 导入链接(所有链向您的网站) 导入链接是指向您的外部链接。正常情况下网站管理员们是不需要为导入链接而伤脑筋的,但是为什么有些网站管理员却特别关注呢?这可能是以业绩为依据的互联网业界现状使然,也可能是因为很多网站管理员认为这种主动指向您的链接是一个提升您的排名和流量的捷径。本专题的第四篇文章将回答您有关“有没有不需要成本就能增加我的导入链接的办法?”等问题。 译者注:该系列将陆续翻译成中文,敬请关注! :) 标签: SEO, 网站管理员小贴士
固定链接
0个评论
11/05/2008 04:29:00 下午
发表者: 孟翔, 搜索质量组9月底从 南京SMX大会回来之后,我们花了一些时间,总结了一下在这次大会与大家交流的一些内容,今天我们将一些与Google有关的内容精华与大家分享,并补充了一些供大家参考的资源。在两天的大会上,我们非常高兴同各位站长以及从业互联网营销的朋友们进行面对面的交流。我们会继续努力加强同各位站长的沟通,帮助大家更好地理解Google,把我们的资源和指南更好、更广和更有效地传播给大家。我们也欢迎大家继续在本博客或者 Google网站管理员支持论坛上提出你的意见和问题。 以下内容的一部分来自朱健飞(谷歌软件工程师,负责中文反搜索引擎垃圾)的“与搜索引擎对话”部分(对原话稍作整理);有一部分来自我们与站长在大会主厅外面的Google展台的交流: 问:每当搜索引擎来抓取我的网站的时候,访问量就会超过正常的很多倍,导致服务器压力很大,我该怎么办?答:您可以在Google网站管理员工具中调整Google对你的网站的抓取速度。更多信息,请参考 要求更改Google的抓取速度。 问:Google对所谓的“沙盒效应”是怎么看的?答:我们的算法的某些作用,会产生类似大家所感受到的“沙盒效应”——即新的网站针对某些关键词不会排名很高。然而,一个新的网站在提供高质量的内容并自然获得较好的“声望”之前,是需要一定时间的,因此一个新站在搜索引擎里面获得好的排名需要一定时间也是很正常的。我们推荐大家专注持续提供高质量内容,遵守 Google网站管理员指南,尤其是在网站建站的初期。如果您的网站在Google里的表现长期不好,那么第一件应该做的事情,就是检查一下网站是否违反了 Google网站管理员指南。 问:谷歌怎么看待链接群发的问题?当一个好的网站被竞争对手“陷害”,群发了很多垃圾链接的时候,Google怎么判断?答:这种现象Google已经注意到了,而且我们在积极地改进我们的算法,保证搜索结果的排名不被这种行为所操控。长远地看,大量垃圾链接不会起作用。另外,一个好的网站往往既有垃圾链接也有好的自然链接,而这个网站排名好,往往不是因为那些垃圾链接。关于这个问题,大家还可以参考这篇文章: 链接方案. 问:在Google,是否存在人工干预搜索质量的情况?答:每一天Google都会抓取和索引大量的网页,人工监测并调整搜索结果将是一件极其困难的事情。在Google,我们尽可能减少人工干预。举个例子,当一个垃圾网站没有被算法发现,但用户向我们举报该网站是垃圾网站的时候,我们会有人去调查。我们希望通过用户举报的信息来改进我们的算法,而不是人工的每天一页一页的处理垃圾网页。另外,如果某个网站违反了当地法律,也会有人工干预。 问:品牌侵权的网站排到了前面,我可以向Google举报吗?答:如果确实是垃圾网站,我们欢迎举报。不过侵权品牌的网站不一定就是作弊的垃圾网站。如果仅是品牌的侵权,Google不会对其采取措施,因为Google仅仅索引网络上公开的内容而无法控制这些内容。 当您的网站遭到了其他网站侵权的时候,如果您认为该网站是垃圾网站,您可以向Google报告索引中存在的垃圾网站,除此之外,您还可以尝试联系对方网站站长,并且(或)根据具体侵权的情况采取相应的法律手段。 问:哪种网页语言更适合被Google收录?答:只要网页内容能被搜索引擎理解,哪种网页语言都是可以的。例如,常见的采用CSS创建的HTML/XHTML页面都可以被Google理解。对一些其他技术例如Flash和Ajax生成的内容的收录,Google已经改进了许多,但还不能“完美”的收录。总而言之,只要网页以HTML/XHTML输出,Google就能理解并收录,Google没有特别倾向哪种网页语言,只要能够被Google读懂就好。更多关于这方面的信息请参考 这里。 问:Google是否特意针对地域有区别的显示搜索结果?答:是的。例如在中国搜[ 苹果],搜索结果会包括苹果中国公司网站,中国IT网站对苹果电脑的评测等。对于不同地区,我们所用的数据库都是一样的,但对不同的地区和语言产生的结果可能会不一样,Google会尽可能调整搜索结果以返回用户最可能想要的信息。 问:网页大小是否影响排名?Google倾向于多大的网页?答:网页大小对排名没有直接影响,而且不存在Google所“倾向”的网页大小。网页大小应取决于你和网站用户的需求。 问:我要转移域名,该如何操作?答:您需要将老的域名301重定向至新域名。更多详细信息请参考 网站迁移的最佳方法。 问:我们网站在搜索结果里的地址为什么没有“www”?答:带“www”的域名是网站根域名的子域名,两者都有可能被收录并且显示在搜索结果当中,这取决于Google 发现您的网站时它所抓取到的链接。事实上,您可以在Google网站管理员工具当中选择其中一个作为首选域,即希望出现在搜索结果里的域名,然后在全站内将不带www的域名301重定向至首选域。更多详细信息,请参考 如何指定我的首选域。 问:"炫"的内容经常对搜索引擎不友好。Google在这方面会不会有所改进?答:Google一直在适应新技术,但不可能在短期内就可以完美收录这些新技术产生的内容。需要提醒大家 的一点是,就算Google支持某新技术,其他的搜索引擎不一定也会支持该新技术。目前Google对Flash的收录已经大幅度改进。推荐大家阅读这两篇博客文章: 如何最好的使用Flash 和 改进后的Flash索引。 问:我将网站URL静态化,并在URL中插入关键词,但是还没有被收录。另外,关键词出现在URL里有助于排名吗?答:您的网页没有被收录可能是Google还没有通过其他链接找到这一页。出现在URL里的关键词会被Google识别,但这并不是影响排名的唯一因素。当URL中某个关键词与用户搜索请求匹配的时候,那一部分URL会被高亮出来,这与网页其他部分出现关键词匹配是一样的,但这并不意味着URL里出现关键词是影响排名的决定性因素。 问:服务器更改了以后对排名有影响吗?答:如果没有改变域名,并且Google可以正常访问您的网站的话,是不会有什么影响的。您可以通过Google网站管理员工具提交Sitemap,看看Google能否正常访问你的网站。一般访问过程出现的错误都会被列在Google网站管理员工具当中。 ------------------------------- 顺便借此机会向各位站长宣布一个好消息,最近,Google网站管理员工具加入了一个新功能:显示找不到的链接来源。以后大家不用再头疼这些“找不到”的链接到底是来自哪里了,在“故障诊断“ 下的 “网络抓取” 中 “找不到”一栏,点击“所链接页面数”下面的链接,即可看到您的网站上返回给Google 404错误(“找不到”链接)的页面URL。 标签: Google Webmaster Tools, Google站长工具, 网站管理员小贴士
固定链接
0个评论
10/29/2008 01:12:00 下午
发表者: 幺宝刚, 谷歌中国工程研究院研发总监随着谷歌浏览器的发布,对网络标准性支持的讨论再次浮上水面(关于网络标准请您参阅W3C发布的相应标准 )。对这个问题,业界的讨论曾经有过很多,但是标准化的推行效果在国内不是特别理想,很多网站和网络应用对标准的支持还是很不够的。
之所以造成这种局面,是与很多网络开发人员在网站和网络应用软件开发中采用了一些非标准特性(比如某些IE插件)息息相关的,许多网站仅仅支持IE或某些以IE为内核的浏览器,这导致了数以百万计的使用其它浏览器(比如Firefox, Safari和Google Chrome)的用户可能无法正常浏览某些网页。我们已经收到一些用户对这类问题的反馈,但我们的分析结果表明,绝大部分类似的问题,是因为网页/站本身的对标准支持不够造成的。 从长期的角度来看,这种非标准性对网站的推广和吸引更多的用户是很不利的,主要包括以下几个原因: 谷歌浏览器在发布当天引起的广泛关注和踊跃的用户下载,说明广大的互联网用户还是很欢迎和支持有更多的浏览器的选择的。因为每一个新的浏览器的诞生,都会在这个产品领域带来更多的技术革新。Firefox火狐发布后迅速被用户接受、普及就是一个很好的例子。我们相信谷歌浏览器的发布,会给浏览器产品和技术创新带来一个新的飞跃。 但是这也会带来另外一个头疼的问题:是不是又要在代码里支持另一个标准呢?其实这种担心,我们从开发浏览器之初就意识到了,这也是我们如此坚持支持标准化的原因。 只要您的程序是按照标准来写的,不需要做任何改动,就应该可以直接在谷歌浏览器里正常工作。 浏览器的不停更新换代,只会使网络应用的功能越来越强大,这样也会使大家的网站和网络服务越做越好,从而带来更多用户。从最近的产品趋势来看,非IE浏览器的用户越来越多。一方面,Firefox、Safari和Chrome 的用户数有持续增长的势头。根据Ars Technica 公布的数据,在美国和欧洲,非IE浏览器的市场份额已经超过了25%。另一方面,使用手机(iPhone, Android)等移动设备上网的用户越来越多,而这些终端上的浏览器很多都不是基于IE的。如果您的网站或者程序是支持标准的,就可以支持更多的用户(包括手机用户)。 另外还有一个因素:随着奥运效应的持续发酵和延续,中国的国际化也在进一步增强,这意味着中国国内网站的国外用户会越来越多,而这些用户很多是使用非IE浏览器的,对标准的不支持,就可能意味着这些用户的流失。 IE本身,对标准的支持也在不断增强,新发布的IE8测试版,已经缺省到标准模式,这就意味着即使您的网站只是针对IE用户,在新版IE中也可能会有问题。
总而言之,将您的网站和网络应用标准化将有助于您以更小的成本“以不变应万变”。 您的网站“标准”么? 要了解您的网站是否标准其实很简单,您可以使用某种对标准有良好支持的浏览器(比如Firefox,Safari或Chrome) 来测试您的程序代码。 将您的网站变得更标准化并不是多么难的技术问题。有很多网站,比如http://www.w3cn.org/howto/index.html,提供了很好的参考信息。我们最近也计划和业界组织一些关于标准的研讨会,探讨如何在市场和技术层面把这件事情做得更好。同时,也会组织一些技术上的研讨,看看如何自动化地识别网络兼容性问题,如何更快速地将一个网页标准化。敬请关注我们这方面的信息发布。 如果您想了解更多关于Chrome的信息,请访问谷歌浏览器或谷歌浏览器支持论坛(英文)。 标签: Google, 网站管理员小贴士
固定链接
2个评论
10/22/2008 05:18:00 下午
发表者: Jason Morrison, 搜索质量组
原文: Keeping comment spam off your site and away from users发表于: 2008年9月26日星期五 下午2:26 假设您已经在您的网站上开辟了一个论坛,或者在您的博客上激活了评论功能。您精心准备了一两篇帖子,点击了提交按钮,然后开始屏住呼吸等待评论的到来。
评论真的来了。您的一个博友发表了友好的评论,您参加的在线角色扮演游戏的盟友发来了新的消息,Millie 阿姨发来了星期四晚上聚餐的提醒… 但同时您还收到另外一些东西… 一些让您头疼的东西。比如一些鼓吹得天花乱坠的广告信息,乱七八糟不知所云的信息,甚至还有一些暴露的图片。可以这样说,您已经陷入可怕的垃圾留言里了。
垃圾留言对您来说是有害的,因为它加重了您的工作负担。垃圾留言对您的用户来说也是有害的,因为他们只是来您的网站来寻找感兴趣的内容,而这些毫不相关的内容只会影响他们的注意力。垃圾留言对整个网络来说也是有害的,因为它使网站管理员们不敢轻易开放自己的网站,这给人们在论坛和博客上自由发表自己的观点带来了不便。
那么作为一个网站管理员,您可以做些什么呢? 注:下面的解决办法是一个很好的起点,但可能并不是全部的解决方案。互联网上有许多不同的博客,论坛和BBS, 我们不可能对每一种系统都提供详尽的指导,以下是较广泛通用的解决办法。
确保是真正的人而不是机器在您的网站上留言 - 添加一个输入验证码环节(CAPTCHA)。CAPTCHA要求用户阅读一段模糊的文字并输入相应的文字,这种办法能够验证对方究竟是真正的人类还是机器程序。如果您的博客或论坛没有植入验证环节的话,您可以使用Recaptcha这个插件。验证环节并不能解决所有的问题,但是它可以有效地制止垃圾留言制造者的猖狂行为。您可以了解更多类型的CAPTCHAS,但是请记住仅仅是添加这么一个环节,就可以起到很大的作用。
- 阻止可疑行为。许多论坛允许您设置两次发贴之间的最小时间间隔。您也可以通过安装插件,监控那些来自于同一IP地址或proxy的异常巨大的流量,以及其他更可能来自于机器程序而不是人类访问者的异常行为。
使用自动过滤系统 - 通过将一些关键词加入黑名单能够帮助您阻止一些明显的不恰当的留言。垃圾制者们有时候会故意模糊所使用的词语,所以这个方法也不是万能的,不过您也不妨一试。
- 使用能够自动删除垃圾留言的插件或系统特性。垃圾制造者们使用自动程序的方式来侵扰您的站点,那我们为什么不也用自动的方式来保护自己呢?像Akismet(有很多针对博客和论坛的插件)这样的系统和TypePad Antispam(开源并兼容Akismet),很容易安装,并能帮您完成大部分的工作。
将您的设置调整地更严格一些 - 禁止跟踪不被信任的链接。许多系统有这样的功能,可以给链接添加“nofollow”的属性。这样做可以防止某种类型的垃圾留言,但并不是唯一可行的方式。
- 您可以考虑要求用户在发帖前必须登录,这样可以防止用户任意地发表留言。但是,这样做也会使信噪比提高。
- 改变您的设置,使留言必须经过您的批准才能展示。如果您是一个规模较小的网站,并且没有太多的留言的话,这是一个使自己网站留言保持高水平的很好的办法。您可以允许自己的员工或者值得信赖的用户能够自助批准自己的留言,这样能减轻您一部分工作负担。
- 可以考虑禁止某些类型的留言。比如,您可以将那些比较陈旧、已经不太可能有高质量评论的帖子冻结。在博客上,您可以把引用通告等功能暂停,因为这是极易吸引网络垃圾的地方。
及时更新您的网站 - 请您花些时间将您的软件及时更新,并关注那些重大的安全升级。一些网络垃圾制造者会利用旧版本博客、论坛或内容管理系统的安全漏洞攻击您的网站。您可以在网站安全快速检查清单上找到更多相应的解决方案。
您可能需要权衡您的软件、您的用户群,及您的经验等多种因素来选择实施各种方法。无论您是一个小型的个人博客,还是一个大型的多用户的网站,不加任何保护地就贸然开放您的网站留言是有很大风险的。另外,如果您的网站已经被成千上万条垃圾帖所侵蚀并且不再出现在Google搜索结果的话,当您已经彻底清除了这些不良内容并采取了相应保护措施的话,您可以考虑提交一个重新收录的申请。 作为一个有较长时间经验的网站开发者和博客一员,我可以以我自己的切身体验告诉您,花一点点时间做一些预防措施会节省您将来大量的时间和精力。我是一个网站管理员中心组的一个较新的成员。我很乐意帮助我的网站管理员同行们,而且我对搜索质量也非常感兴趣(我已经在这一领域做了一些学术研究)。欢迎您在留言板里分享您对防止留言垃圾的心得,同时始终欢迎您访问Google网站管理员支持论坛并提出您的问题。 标签: SEO, 网站管理员小贴士
固定链接
4个评论
9/02/2008 08:24:00 上午
发表者:Sahala Swenson, 网站管理员工具组原文: Make your 404 pages more useful发表于:2008年8月19日星期二,上午10:13 网站的访问者会由于多种原因在访问您的网站时碰到 404“网页不存在”的情况: - 输错了网址,或者复制粘贴网址时出错
- 所点击的网页上或者email信息里的链接已经失效或不完整
- 该网页的内容已经被移动或删除
在碰到404页面时,访问者可能会尝试手动纠正这个错误的网址,或者点击返回按钮,甚至会直接离开您的网站。正如较早前发表在“网站管理员中心404专题周”的一篇文章中提到的,您可以采取多种方法帮助网站访问者走出这个死胡同。为了将404页面变得更加有用,我们刚刚在网站管理员工具里添加了“增强型404页面”工具。如果您已经创建了一个自定义404页面,此功能允许您在404页面嵌入一个小工具。这个小工具可以基于错误的网址提供建议,从而帮助访问者找到他们想找的东西。  举例来说:Jamie在email里收到这样一个链接 www.example.com/activities/adventurecruise.html。由于email客户端的格式问题,这个网址被删减成 www.example.com/activites/adventur。所以,一个404页面就自然而然地出现了。然而,在嵌入这个404小工具后,她就可以看到如下信息:  除了试着纠正错误网址以外,这个404小工具还提供下面的建议(如果可用的话): - 一个指向上一级子目录的链接
- 一个网站地图页面
- 网站查询的建议和搜索框
那么您怎么才能添加这个小工具呢?请访问网站管理员工具的“工具”板块,其中的“增强型404页面”工具,可以让您生成一段JavaScript代码片段。您可以将其复制粘贴到您的自定义404页面的代码里。当然,请不要忘记返回正确的404状态码。
我可以改变它的外观吗?当然可以。我们在初始状态下没有对HTML页面进行任何修饰,但是我们已经将CSS代码部分包括进来,您可以对其进行编辑。想要了解更多这方面的信息,请查阅更改自定义404小工具的外观的帮助文章。
此功能目前处于实验阶段,我们可能无法为您的网站提供更多改善的建议,但我们会努力提高覆盖面。与此同时,欢迎您在文末的评论栏或者网站管理员支持论坛里发表您的看法。感谢您帮助我们使Internet变得更友好更便捷! (译者注:本文译自英文网站管理员博客,所以所有图示均采用英文原图,文中提到的小工具已有中文版本,欢迎您注册谷歌网站管理员工具并使用“增强型 404 页面”小工具! ) 标签: Goolge索引, 网站管理员小贴士
固定链接
5个评论
8/28/2008 08:09:00 上午
发表者:Maile Ohye,开发者项目技术带头人原文: More on 404发表于:2008年8月15日星期五,下午2:52 既然我们已经跟软404代码说再见了,作为404代码专题周的继续,本文将继续回答一些与404 状态代码相关的比较迫切的问题。
你们如何处理410“已删除”状态代码? 与404代码的处理相同。
对于返回404状态代码的网页,你们是否对网页的内容进行收录或者抓取上面的链接呢? 我们会尽可能地去了解您的网站及其内容。所以,尽管我们不想在搜索结果里向用户展示返回404状态代码的页面,但是我们可以把该页面上的内容或者链接(如果能探测到的话)作为一个线索来帮助我们更好地了解您的网站。
同时,请记住如果您想让您的链接和内容被有效抓取和收录的话,将这些链接和内容放在一个非404页面上会更有益处。
如果返回404状态代码,然后使用meta refresh 10秒后进行页面刷新呢? Yahoo!公司现在对于他们的404页面使用这种方法进行处理。他们返回404代码,同时其页面内容也包括:
<meta http-equiv="refresh" content="10;url=http://www.yahoo.com/?xxx">
我们赞同此项技术,因为这样做可以减少对用户的困扰,用户有10秒钟时间来做一个新的选择,如果在此期间用户没有任何输入,10秒钟结束后页面就会自动跳转到主页。
我应该将网址拼写错误导致的404页面使用301永久重定向到正确的网址吗? 如果重定向/301重定向返回404代码的页面对用户有帮助(比如,不像软404代码那样让人困惑),那么这样做就是一个不错的主意。举个例子,如果您看到您的网站管理员工具的抓取错误栏里显示了一个对于拼写错误的网址返回404的抓取错误,您就可以将此拼写错误的网址301重定向到正确的网址。
比如,如果我们在抓取错误里看到这样一个404错误:
http://www.google.com/webmsters <-- webmasters拼写错误
如果网站真的存在这个拼写错误的网址的话,我们可以首先纠正它,然后使用301将其永久重定向到正确的网址(因为这个无效链接可能在其它网站也存在):
http://www.google.com/webmasters
你们有没有见过一些好的404页面? 是的,我们见过!(坦白地说:从来没有人问过我们这个问题,但是没有几个问题能像讨论响应代码这么有趣。:) )这里我们把一些我们比较喜欢的404页面收集起来,以飨读者。如果您还有更多404相关的问题,请告诉我们。同时,谢谢您参与“404代码专题周”活动! http://www.metrokitchen.com/nice-404-page “如果您找的东西没有存货了(像我一样),这个页面可以很容易让您找到替代品。” -Riona, 国货粉丝
http://www.comedycentral.com/another-404 “要怪就怪搜索引擎机器人吧。” -Reid, 爱好讲冷笑话
http://www.splicemusic.com/and-another “这样的404页面可以吸引用户在您的网站上停留更长的时间。” -Susan, 音乐和分析方面的业余爱好者
http://www.treachery.net/wow-more-404s “这个页面虽然看上去肯定不是真的,但是它传达的信息很明确。” -Jonathan, 曾经训练蜘蛛去创建网站,训练蚂蚁去处理404错误 http://www.apple.com/iPhone4g “从可用性的角度来说非常好。” http://thcnet.net/lost-in-a-forest “至少还有一个信箱吧。” -JohnMu, 爱好冒险 http://lookitsme.co.uk/404 “这个看起来非常可爱。:)” -Jessica, 喜欢一切可爱的事物 http://www.orangecoat.com/a-404-page.html “流程图引领您找到正确的方向。” -Sahala, 互联网漫步者 http://icanhascheezburger.com/iz-404-page “如果有问题的话,我可以使用有用的链接或者e-mail地址。但是他们如果能够加上‘噢,此页面不存在!您或许打错了网址,或者此链接无效?’,这样大家就可以知道发生了什么。” -Adam, 摇摆舞爱好者 标签: Goolge索引, 网站管理员小贴士
固定链接
3个评论
8/20/2008 01:58:00 下午
发表者: Maile Ohye, 开发者项目技术带头人原文: Farewell to soft 404s发表于: 2008年8月12日星期二,下午2:54 在网络上,我们可以看到两种404(”文件无法找到”)响应代码:"硬404代码"和"软404代码"。我们不鼓励使用所谓的"软404代码",因为它们可能会对用户和搜索引擎造成困惑。对一个不存在的URL,那些提供"软404代码"的网站不是返回一个404响应代码,而是返回一个200响应代码。然而,伴随这种200响应代码的内容通常是该网站的首页或者是一个错误信息的页面。
一个软404代码的用户体验是怎样的呢?这里有一个软404代码的模型:这个网站对一个不存在的URL返回一个200相应代码以及这个网站的首页。
如上图所示,软404代码会给用户带来困惑,而且搜索引擎也会花很多时间在您的网站上爬行和索引一些并不存在、而且经常重复的URL。这会给您网站的索引覆盖率造成负面影响——由于谷歌机器人被这种代码误导并花了大量时间爬行一些并不存在的网页,您的一部分含有独特内容的网页反而有可能无法被及时发现,或者不能被经常性访问。
如果不返回一个软404代码,我应当怎么做呢? 更好的做法是返回一个404响应代码,而且向用户清晰地说明这个文件无法找到。这样做将使搜索引擎和用户都得到更愉快的体验。 返回404响应代码 向用户返回更明确的信息 我的服务器可以返回404代码,但同时向用户发送一个有帮助意义的"无法找到"的消息么? 当然可以做到!在今后的"404专题周"里您可以看到更多相关信息! 标签: Goolge索引, 网站管理员小贴士
固定链接
10个评论
8/20/2008 01:24:00 下午
发表者: Maile Ohye, 开发者项目技术带头人
原文:It's 404 week at Webmaster Central 发表于:2008年8月11日星期一,下午1:40
近期我们将发表一系列博客,帮助您正确使用404 响应代码。
响应代码是网络服务器在响应一个URL 的浏览请求时返回的数字形式的状态代码(比如200 代表“成功”,301 代表“永久移动”)。如果请求的某一文件“无法找到”,那么服务器端将返回一个404 响应代码。
当用户对您的网页发送请求时,您的服务器就会搜索这个URL 所对应的文件。如果这个文件存在,您的服务器就会返回一个200 状态代码以及相应信息(通常就是这个网页的内容,比如该页的HTML 代码)。那么什么是404呢?以图示中的指向“Visit Google Apps”的链接为例,由于在进行编码时出现了拼写错误,这个链接失效了。如果有用户点击”Visit Google Apps”,这个特定的网页(文件)无法被服务器正确定位。这时,服务器将会返回一个404响应代码,表示“无法找到”。 现在我们了解了404代码的基本知识,欢迎您继续关注近期即将推出的更多关于“如何使用对用户和搜索引擎都友好的404代码”的相关信息。 标签: Goolge索引, 网站管理员小贴士
固定链接
1个评论
6/17/2008 06:02:00 下午
发表者 T.V. Raman,研究学者原文: Webmaster tips for creating accessible, crawlable sites发表于:2008年4月14日 上午10:47  Hubbell和我正在我们位于加州的家中度假。欢迎您随时 阅读在此之前我为网站管理员们写的关于可用性的博客, 以及我为谷歌官方博客所写的其他文章。
对于Accessible search,网站管理员们最经常问的一个问题就是:我怎样才能提高我的网站在Accessible Search上的排名?同时,网站管理员们还会问一个与之类似、但更为宽泛的问题:怎样才能提高我的网站在Google搜索上的排名? 我很高兴地告诉大家,这里有一个一举两得的办法:您可以建立和完善一些关键的网站特性,比如网站导航,这样它就能为所有用户服务,其中自然也包括谷歌机器人。下面是一些小建议,您可以参考。 确保所有重要的内容都能正常访问
为了使用户获取到内容,必须确保这些内容是可以访问的。用户及搜索引擎机器人都是借助超文本链接获取页面内容的,所以关键的第一步是确保您网站上的所有内容都可经由纯HTML超文本链接访问到,并避免网站的关键部分被JavaScript或Flash等技术隐藏起来。
纯超文本链接是指通过HTML锚元素<a>生成的链接。下一步,我们要确保所有超文本链接指向的目标,即<a>元素,都是真实的URL,而不是一个空的、真正的链接行为已经被转到点击触发控制器上的链接。
简而言之,要避免下列超文本链接的形式:
<a href="#" onclick="javascript:void(...)">Product Catalog</a>
我们推荐更简单的链接,如:
<a href="http://www.example.com/product-catalog.html">Product Catalog</a>
确保内容的可读性
只有具有可阅读性,网站内容才能发挥作用。请确保您网站上所有的重要内容都以HTML文件的形式呈现,并且在无须评估页面脚本的前提下就可以获取。对于谷歌机器人和绝大多数不知情的用户而言,Flash动画背后隐藏的内容和由可执行性JavaScript在浏览器端所产生的文本仍然是无法读取的。
确保内容按照适于阅读的顺序提供给读者
在获取可读内容后,用户希望能够按照合乎逻辑的阅读顺序跟进内容。如果您网站中的大部分内容采取了复杂的多栏布局设计,不妨退回去考虑一下您如何才能实现预期的效果。例如,使用深层嵌套的HTML表格会使人们难以将相关的文本按照合乎逻辑的顺序联系起来。
在HTML内使用CSS以及合乎逻辑、有组织的<div>元素,可以取得同样的效果。同时作为一个额外的收获,您会发现您的网站运行得更加快捷高效。补充所有的视觉内容――不必担心重复!让所有人都可以获得您的信息并不意味着让您把网站"降格"成为最简单的文本格式。最大限度地重复您的信息是很重要的,因为只有这样才能确保页面内容最大限度地帮助所有用户。这里有几个简单的小建议:- 确保在图片缺失的情况下,用户仍然可以获得那些通过图片传播的内容。这不仅要在相关的图片上添加适当的ALT属性,还要确保图片周围的文字能够详细地介绍背景,让读者了解为什么这张图片会出现在这里;同时详细给出您期望人们看到这个图片后所得出的结论。简言之,如果您想确保每个人都知道此图片表现的是一座桥梁,那么您最好把该图片周围的文字也以拱形排列。
- 添加相关的摘要和标题,让读者在钻研细节之前可以获得高屋建瓴的信息概述。
- 在数据展示之类的视觉形象旁边添加详细的文字总结。
采纳上述建议可以大大提高用户登陆页面的质量。同时,作为一个额外的收获,您还很有可能惊喜地发现您的网站得到了更好地索引! 标签: Goolge索引, SEO, 搜索引擎优化, 网站管理员小贴士
固定链接
8个评论
|