登陆注册
49068300000025

第25章 附录B Google(谷歌)建站指导

为了给读者提供方便,本书将Google(谷歌)给予网站管理员(站主)的网站优化指导作为附录。这个建站指导在Google上的地址是:www.google.cn/webmastersB1.网站管理员指南遵循这些指南将有助于Google查找、索引并对网站进行排名。即使选择不采纳这些建议,我们也强烈建议您对“质量指南”多加留意,其中简要说明了一些可能造成网站从Google索引中彻底删除的违禁行为。网站被删除之后,Google.com或Google所有合作伙伴网站的搜索结果中都不会再显示该网站。

B2.网站准备就绪后

将其他相关网站链接到您的网站上。

将其提交给Google,网址为:http://www.google.com/addurl.html。

将Sitemap作为Google Sitemaps(测试版)项目的一部分进行提交。Google Sitemaps使用Sitemap了解您的网站的结构,并提高我们对您的网页的利用率。

确保应了解您的网页的所有网站都知道您的网站已处于在线状态。

将您的网站提交给相关的目录,例如,Open Directory Project和Yahoo!以及其他特定行业的专业网站。

B3.设计与内容指南

网站应具有清晰的层次结构和文本链接。每个网页应至少可以通过一个静态文本链接打开。

为用户提供一个网站地图,列出指向网站重要位置的链接。如果网站地图上的链接超过或大约为100个,则需要将网站地图拆分为多个网页。

网站应具有实用性且信息丰富,网页文字应清晰、准确地表述要传达的内容。

要考虑到用户会使用哪些字词来查找您的网页,确保网站上确实包含了这些文字。

尽量使用文字而不是图像来显示重要的名称、内容或链接,因为Google抓取工具无法识别图像中所含的文字。

确保TITLE和ALT标记具有说明性且表达精准无误。

检查链接是否损坏,并确保HTML格式正确。

如果采用动态网页(即网址中包含字符),请注意并非每一个搜索引擎Spider都能像抓取静态网页一样抓取动态网页。动态网页有助于缩短参数长度并减少参数数目。

将给定网页上的链接限制在合理的数量内(少于100)。

B4.技术指南

由于大部分搜索引擎Spider查看网站的方式与Lynx一样,所以可使用Lynx一类文本浏览器来检查您的网站。如果因为应用了JavaScript、Cookie、工作阶段ID、框架、DHTML或Flash等复杂技术,而导致在文本浏览器中无法看到网站的所有网页,则搜索引擎Spider在抓取您的网站时可能会遇到麻烦。

允许搜索漫游器抓取您的网站,同时不采用工作阶段ID或参数跟踪其在网站上的浏览路径。这些技术对跟踪单个用户的行为非常有用,但漫游器的访问模式却完全不同。如果采用这些技术,则可能会导致对网站的检索不完整,因为漫游器可能无法排除那些看上去不同,但实际却指向同一个网页的网址。

确保您的网络服务器支持If-Modified-Since HTTP标头。通过该功能,您的网络服务器可以告诉Google自上次抓取您的网站以来,内容是否已发生变化。该功能可以节省带宽和开销。

利用网络服务器上的robots.txt文件,该文件会告诉抓取工具可以抓取哪些目录。确保该文件是网站的最新版本,以免意外拦截Googlebot抓取工具。请访问http://www.robotstxt.org/wc/faq.html,了解如何在漫游器中浏览您的网站时对其进行指示。可以使用Google Sitemaps中的robots.txt分析工具测试robots.txt文件,以确保正确使用该文件。

如果贵公司购买了内容管理系统,请确保该系统能导出您的内容,以便搜索引擎Spider可以抓取您的网站。

请勿使用“id=”作为您网址的参数,因为我们不会在索引中包含这些网页。

B5.质量指南

质量指南涵盖了最常见的作弊形式或操纵行为,对于此处未列出的其他误导行为(例如,通过注册知名网站的错拼形式来欺骗用户),Google仍可予以拒绝。不要抱有侥幸心理,认为某种欺骗手段未在本页中列出,Google就会认可该手段。作为网站管理员,与其花费大量时间寻找漏洞加以利用,不如尽其所能维护基本原则,以便为用户带来更好的体验,从而使网站获得更高的排名。如果您认为其他网站正在滥用Google质量指南,请通过http://www.google.com/contact/spamreport.html举报该网站。Google希望能开发出灵活的自动解决方案来解决上述问题,因而尽量避免一一处理违禁行为。我们收到的垃圾邮件报告将用于创建灵活的算法以识别并阻止以后的垃圾邮件。

B6.质量指南——基本原则

设计网页时应该考虑的是用户,而不是搜索引擎。不要欺骗用户,或提交给搜索引擎一种内容,而显示给用户另一种内容。这种做法通常称为“隐藏”。

请不要为了提高搜索引擎排名而弄虚作假。一个简单分辨是非的方法是:您是否可以坦然地跟竞争对手网站解释您对网站所做的事情。另一个有用的测试即扪心自问:“这能否给我的用户带来帮助?如果不存在搜索引擎,我是否还会这样做?”

请不要参与旨在提高您的网站排名或PageRank的链接方案。尤其要避免链接到违禁的网站或“恶邻”,因为您自身的排名可能受到这些链接的负面影响。

请不要使用未授权的计算机程序提交网页、检查排名等。这些程序会耗用计算机资源并违反我们的服务条款。Google不建议使用WebPosition Gold?这类产品向Google发送自动查询或用程序编写的查询。

B7.质量指南——具体指南

请不要使用隐藏文本或隐藏链接。

请不要采用隐藏真实内容或欺骗性重定向手段。

请不要向Google发送自动查询。

请不要使用无关用语加载网页。

请不要创建包含大量重复内容的多个网页、子域或域。

请不要创建安装病毒(如特洛伊木马)或其他有害软件的网页。

请不要采用专门针对搜索引擎制作的“桥页”,也不要采用如联属计划这类原创内容很少或几乎没有原创内容的“俗套”(cookie cutter)方式。

如果您的网站参加联属计划,请确保您的网站可为其增添价值。请提供独特而相关的内容,使用户有理由首先访问您的网站。

如果网站不符合我们的质量指南,则可能会将其排除在索引之外。如果认为您的网站不符合这些指南,可进行修改使其满足要求,然后请求重新加入。

B8.如何将您的网站加入Google搜索结果包含在Google搜索结果中不需要付费,并且非常容易执行;不需要将网站提交到Google。Google是一个完全自动化的搜索引擎,它使用称为“Spider”的软件定期搜索网络并找到可添加到Google索引的网站。事实上,列入索引的绝大多数网站都不是人工提交的,而是Spider抓取网络时找到并自动添加进来的。

要判断您的网站目前是否包含在Google索引中,只需对您的网站网址执行搜索。例如,搜索[site:www.google.com】将返回结果:http://www.google.com/search?hl=zh_CN&q=site 3Awww.google.com+虽然Google可抓取超过几十亿个网页,但丢失几个网站也在所难免。造成Spider丢失网站的常见原因有:

此网站未通过多个链接牢靠连接到网络的其他网站。

在Google的最近一次抓取后此网站才启动。

网站的设计使Google很难有效抓取其内容。

执行抓取时网站暂时不可用。

公平、准确地展示互联网内容是我们的宗旨。为实现此目标,我们提供了建立便于抓取网站的指南。虽然我们无法保证Spider能找到某特定网站,但遵循以下指南应该可以增加网站在搜索结果中显示的机会。

您需要:

在网页上提供高品质的内容,尤其是主页。这是您要做的最重要的工作。如果您的网页包含有用的信息,其内容就可以吸引许多访问者,并使网站管理员乐于链接到您的网站。要创建具有实用性且信息丰富的网站,网页文字应清晰、准确地表述要传达的主题。想一想,用户会使用哪些字词来查找您的网页,然后尽量在网站上使用这些字词。

确保有网站链接到您的网站上。链接可帮助我们的抓取工具找到您的网站,并提高您的网站在搜索结果中的展示机率。返回搜索结果时,Google会将PageRank(对网页重要性的评测)与先进的文字匹配技术合并使用,以显示对每个搜索结果都兼具重要性与相关性的网页。Google会计算一个网页收到的投票数量,以确定其PageRank,其计算方法是将从网页A指向网页B的链接解释为由网页A对网页B所投的一票。自身“重要”的网页所投的票会更具分量,有助于提高其他网页的“重要性”。请注意,网站在搜索结果中的排名完全自动,我们不会人为地为网站指定关键字。

以合理的链接结构建立您的网站,每个网页应至少可以通过一个静态文本链接打开。

使用文本浏览器(如Lynx)检查您的网站。大部分Spider查看网站的方式与Lynx一样。如果因为应用了JavaScript、Cookie、会话ID、框架、DHTML或Macromedia Flash等技术,而造成在文本浏览器中无法看到整个网站,则Spider在抓取此网站时可能也会遇到麻烦。

考虑创建动态网页的静态复本。虽然Google索引中包括动态网页,但它们只占索引的一小部分。如果您怀疑动态生成的网页(例如,包含问号的网址)给我们的抓取工具带来了麻烦,可以为这些网页创建静态复本。如果要创建静态复本,不要忘记将动态网页添加到您的robots.txt文件,防止我们将其当成重复内容。

请考虑使用Google Sitemaps创建并提交关于网页的详细网站地图。Google Sitemaps是您向Google索引提交所有网址,并详细了解您的网页在Google可见度的一条捷径。通过Google Sitemaps,我们始终可以自动地得到您的当前网页及其更新的所有信息。请注意,提交Sitemaps并不能保证网站中的所有网页都能够被抓取或包含在搜索结果中。要了解有关Google Sitemaps的详情,请访问http://www.google.com/webmasters/sitemaps/about?hl=zh_CN。

需要避免的事项:

不要使用关键字列表填写网页、“遮蔽”网页或建立“仅供抓取”的网页。如果您的网站上包含您不希望访问者看到的网页、链接或文字,Google会认为这些内容具有欺诈性并可能忽略您的网站。

您不一定非要购买搜索优化服务,有些公司声明可以“保证”您的网站在Google搜索结果中享有高排名。合法的咨询公司可以改善网站的流量和内容,但其他公司会采用欺骗性手段来骗过搜索引擎,请务必小心。如果您的网域与这些欺诈性服务相关,我们可能禁止其加入我们的索引。要了解有关搜索引擎优化服务商的详情。

不要使用图片来显示重要名称、内容或链接,我们的抓取工具无法识别图形中所含的文字。如果网页上的重要内容和关键字不能以普通的HTML格式显示,请使用ALT标记。

不要为不同网址下的一个网页创建多个复本。许多网站提供纯文本或易于打印的网页,其内容与相应的图形丰富的网页不相上下。为了确保您首选的网页包括在我们的搜索结果中,请使用robots.txt文件拦截Spider抓取到的重复内容。有关使用robots.txt文件的详情,请访问关于拦截Googlebot的信息。

同类推荐
  • 计算机网络技术与应用

    计算机网络技术与应用

    本书共8章,系统地介绍了计算机网络的发展和基本原理体系结构、局域网、广域网、网络服务、网络安全、典型网络的结构特点等内容。除第8章外,其他各章都附有练习题。为了加强学习效果,本书围绕知识点的典型性,精选了6个实验。此外,在本书的第8章,我们综合各章知识设计了“办公局域网组建设计”和“中小型企业局域网组建设计”这两个常用的计算机网络技术应用实例,供学生学习和参考。本教材适合作为本科非计算机专业学生的计算机网络教材。
  • 学校计算机实用技术

    学校计算机实用技术

    本书由杭州市上城区教育学院编著,他们邀请了众多信息技术教育教学的一线专家,认真细致地筛选了学校计算机应用方面的常见问题,提出了解决问题的具体操作方案,旨在帮助一线教育工作者解决可能面临的种种问题,为广大教师提供便捷服务。
  • 信息技术教育大全-计算机网络

    信息技术教育大全-计算机网络

    信息技术教育大全-计算机网络信息技术教育大全-计算机网络信息技术教育大全-计算机网络信息技术教育大全-计算机网络信息技术教育大全-计算机网络信息技术教育大全-计算机网络信息技术教育大全-计算机网络
  • 高校校园网管理与网上引导工作研究

    高校校园网管理与网上引导工作研究

    在当今的信息化潮流之下,我们不可否认互联网的出现,绝不仅仅是传送手段的变化,更重要的是它代表着一种新的社会形态——网络社会的来临。互联网已经以一种前所未有的方式渗透到现代社会的各个层面和领域,成为现代社会前进和发展的动力和工具,它推动了社会经济、文化政治实现所谓的“数字化转变”。
  • 微软360度

    微软360度

    本书是由微软总部华人协会组织编写的第二本书,是《微软360度——企业和文件》一书的姐妹篇,本书将着重向你呈现微软总部的华人专家是如何一步一步地走向成功的及在微软总部成功的心路历程,以及如何应对挑战,揭示了微软成功的最重要秘密之一——人才至上,读者读后收获更多的是这些成功人士的成功经验,从而为自己的成功做出更好的规划。就让我们一起通过此书来看看微软公司人才至上管理的方方面面,聆听微软的心声,感觉微软的脉动吧。
热门推荐
  • 异世独尊

    异世独尊

    一张神秘图让燕离意外重生,更获得混元神功,从此有了傲视天下的资本!成熟的心智,恐怖的修炼速度,强大的混元神力,让他能够碾压一切强敌!门派大比?我只要第一!秘境寻宝?我只要神器!血魔剑在手,至尊之路谁能挡我!然而上一世重生的隐情,却又让他陷入了更大的漩涡……
  • 心证

    心证

    因为一场意外的庭审,法官认出了多年前的初恋恋人,由此展开了一串曲折的故事。既有法官父亲当年的水晶之恋,又有儿子当时的复杂情感,同时也展示了母亲慈爱的光辉,读后催人泪下。作品中有大篇幅的庭审描写,目前同类创作较为少见,随着依法治国的深入,作品也告诉人们,只有用良心才能书写可歌可泣的爱情;只有真情才能感化麻木的心灵。
  • 龙战——黎明的曙光

    龙战——黎明的曙光

    远古巨龙即将苏醒,人类该何去何从?神秘的斯莱尔学院、诡异的银发少年。人类与龙族的对决,友情与爱情的抉择,废柴沐枫又将何去何从?是坠落深渊还是背起屠龙的重担?一切尽在——龙战I·黎明的曙光
  • 情迷总裁:Boss放开我妈咪

    情迷总裁:Boss放开我妈咪

    三杯伏特加引发他俩一生的纠缠。醉酒的她,推开那扇不该推开的门,是偶然,也是必然。在葬送初夜后,她面红耳赤的带着种子落慌而逃。是命运的安排?六年后,她空降他的公司,足足分了他一半的权,他早已忘记曾在膝下承欢的她。本就性格不对盘的在两人新一轮的战斗中,又擦出怎样的火花?
  • 灵魂交错:俏皮小妞,你跑不了

    灵魂交错:俏皮小妞,你跑不了

    温翰玥刚帮芮薇买了杂志回来,就看到芮薇在调戏美人!这就是温翰玥英雄救美的结果,灵魂互换,不安分的女人,居然第N用温翰月的身体,调戏美女。真的是受够了,温翰玥快走两步,将杂志扔给芮薇,然后双手捧着芮薇的脸,直接吻了上去!“啊!”一旁的美女吃惊的大叫着!“他是我的男人明白吗?”温翰玥霸道的说道,美女掩面而走…“温翰玥,你干什么!”芮薇怒气冲冲的说道!“芮薇我警告你,现在你的身体是我的,你的灵魂也是我的!”
  • 乱世之仙龙苏醒

    乱世之仙龙苏醒

    玄武三百二十五年,冬,六国开战,尸横遍野,血流成河,数十万将士血渐沙场,六国百姓苦不堪言。六国君主对持不下之时,一名白衣女子迎着万里暴雪,踏马而来,只挥了挥衣袖,沙场中正奋勇厮杀的士兵们便被大雪包围,顿时被定在原地不得动弹,剩下一支身披银甲,撑着北燕军旗的士兵们,直冲都城,一举拿下六国中最中心,最肥沃的土地。自此,玄武王朝不复存在,北燕迁居玄武都城,更名,燕都。北燕二百六十九年,冬,群雄四起,五国君主皆野心勃勃,位于中心的燕都无疑是四面楚歌,四国联合攻打燕都,意图攻下瓜分燕都的城池与土地,守城将士筋疲力尽,已是寥寥无几。眼看燕都即将破城,又是白衣女子从天而降,踏雪而来,长袖挥舞,随之带来的是漫天的风雪,极速骤降的大雪将整个燕都包裹起来,形成一片自然的屏障,试图攻城的士兵被这道无色的屏障弹出几丈之外,面对这强大的力量,四国将士损伤大半,无奈退兵,战事,就此平息。自此,民间传出几句朗朗上口的童谣,“雪山之巅,雪女长眠,乱世而出,得此得权。”有人曾问她,“玄武王朝实力如此雄厚,为何单单扶燕都君主为王?”女子却只莞尔一笑,“我也不知。”
  • 凡尘仙踪

    凡尘仙踪

    大地流转,花开花落,人力何以回天。苍天不知苦!仙人顶上指手问苍天。白驹过隙,白衣苍狗,世事变幻莫测;他仙袂飘飘,弑魔顶战天斗地。然而天地万物不过浮云尔尔,金阳没夜,冰轮挂天;人之力又岂能力斗上天?万物的匆忙,世间的疾苦,人心的险恶。白若松能否克服眼前丛丛叠嶂?
  • 重生之魔法时代

    重生之魔法时代

    洛离重生了。重生回自己的初中时期。莫名其妙的是,这里的人都会魔法。洛离内牛满面!他发现自己重生的外挂根本没用,这个世界已经变得面目全非。而且还要从头开始学习全新的魔法知识,这可比前世的数理化还要难学。这是一个以魔法为主的魔法时代。各种魔法,各种魔导士,各种剧情。
  • 梦吹角连营

    梦吹角连营

    何可心穿越,陪伴李杰,(李敏,改李晔),后期李晔渐渐喜欢上了万翠儿,朝政腐败。虽然男主想力挽狂澜但是一人之力,也是回天乏力。被朱温篡夺皇位后幽禁中的李晔被杀,何可心不知是悲是欢,时局动荡朱温退举先让何可心孩子登基,改变不了现状然后被迫让位。死于退位毒酒
  • 乐翩三牵之桁谣情

    乐翩三牵之桁谣情

    夜幕,墨黑的天如同一个大窟窿,装着世间的所有事物。但其实,海天之外,还有另一番天地……一个个痴心绝对,默默的付出没有换回来什么,一次次的误会又让自己都摸不清自己的心。原来,又有多少人能分清爱、喜欢和占有欲呢。有时感觉并不是就完全正确,听听自己的心吧……乐神未定,碧沧夕菩早已是暗流涌动,一个个都贪婪地望着那最高的位置……