存档

‘SEO教程’ 分类的存档

百度对中文URL的收录测试结果

2010年4月13日 2 条评论

大约在2010-3-10日左右,本博客做了改版。

之前的链接全是英文。

改版后的日志标题都已经更换成了中文。包括一些分类,tag都做成了中文URL。

改版后 百度于3-17日左右开始重新收录

点击这里查看示例:http://www.baidu.com/s?bs=site%3Awww.gosoa.com.cn&f=8&wd=site%3Awww.gosoa.com.cn+%CD%B7%CF%FB%CF%A2

本站编码是UTF8。百度中显示的也非乱码。(但在以前,据我记忆在09年3月以前都是乱码)

同时,上述例子中“ 头消息” 关键词  在URL中也是高亮显示。

注意,URL中出现的关键词也是排名计算因数之一。

之前 我的某地产网也做过类似的测试。中文URL在百度中表现也非常好。

个人结论(仅是我个人测试的结论):

1、中文URL对于页面内关键词的密度有影响。

比如 有一个页面,有如下链接地址:

http://www.xxx.com/category/php开发/1.html

http://www.xxx.com/category/php 开发/2.html

http://www.xxx.com/category/php 开发/3.html

http://www.xxx.com/category/php 开发/…….html

这样,PHP开发 这个关键词在该页面就有了很好的密度。同时该关键词的权重也会相应的提高。(注意,如果你非要在页面内堆砌关键词,那结果就XX了)

2、百度以前收录中文路径大多是乱码。如今已经解决了这个问题。说明百度也在向着更好的用户体验发展。

百度在呈现搜索结果的时候,有三个部分,标题,描述和URL。 如何通过这三部分就让用户非常明了搜索结果,这是百度的工程师们在经常研究的功课。

请问: http://www.xxx.com/category/php 开发/ 这样的URL更友好呢    还是
http://www.xxx.com/category/?id=12
或者
http://www.xxx.com/category/12/
或者
http://www.xxx.com/category/php develop/

当然 第一个和最后一个 更加清晰明了。

那他们两个谁更好呢?

请问:如果你不懂英文,哪个对你更明了呢?

注意,URL中出现的关键词也是排名计算因数之一哦。

3、我在网上看到有人说: “ 很多人不建议用中文路径。”  至少我还没看到“不建议使用中文路径”的具体测试数据。以及都是哪些人不建议的。

分类: SEO教程 标签: , ,

昨天新注册了seosemfree.com域名

2010年3月5日 没有评论

看到N多人对SEO,SEM感觉到非常神秘。

于是乎,有了N多人开始培训SEO,SEM。结果越讲越玄乎。

so,昨天新注册了seosemfree.com域名,准备完全免费介绍SEO,SEM相关知识。

而且免费提供SEO,SEM方案。免费提供网络营销方案。

free,free,free. Everything is free .

NND,那些把SEO,SEM说的那么玄乎的人,让人很恶。

分类: SEO教程 标签:

大型网站的SEO策略

2010年3月4日 没有评论

 

很多大型网站的页面权重都很高。甚至二级频道,分站的权重也很高。PR都到了6,7甚至8。但流量也好,收入也罢,都达到了一个瓶颈。此时业绩急需一个质的飞跃。站在SEO的角度,就需要找到SEO的一个突破口,让流量和业绩都有另一个新高。这就需要调整SEO策略。

很多公司,都基本有自己的SEO团队,SEO技术也都很好。但公司业绩不佳。打个比方,一个PHP开发团队,技术实力雄厚,个个都是N人,他们的产品性能很优,用户体验也很好,但就是不挣钱。为什么呢?因为产品不能给用户带来价值,没有人用。这就是产品方向,产品策略出了问题。SEO同理。

SEO只是网站推广的一种方式,网站推广只是网络营销的一种方式,网络营销只是产品经营的一种方式,产品经营才是根本的目的。所以,SEO的根本目的是为了产品经营,而非仅仅是流量。

抓住这一点再做SEO,效果就应该会比较明显了。

我们拿房产类网站来说。(我们只说新房,二手房和租房暂不考虑)

这个策略,我们从何开始呢?当然是从关键词开始,同时兼有行业特性。

一、热门关键词。

比如 房产,房价,房子,新房,楼盘,住宅,写字楼等等,这些词语,意义不大。太宽泛。因为房产行业有一个特性,就是地域性。比如北京房产,苏州房产等。所以,该类词可以不考虑。地域热门关键词

二、地域热门关键词

比如 北京房产,深圳房产信息,苏州楼盘,西安房价……等等,这类地域性的热门关键词。这类关键词,竞争也比较大。SEM也非常多。那这类词怎么做呢?其一,通过SEM手段。其二,SEO之外链。我们可以通过大量的外链来做这类关键词。

三、地域+物业类型

比如 北京住宅,深圳经济适用房,上海商铺(别墅,公寓,写字楼等,再分的细一些,比如花园洋房,两限房,商住两用等等)等等。这类关键词衍生出了上千个关键词。

四、地域+城区+(楼盘/房价/…)

比如 北京海淀房价,西安东郊房价等。这又衍生出来成百上千个关键词了。

五、楼盘名称

比如 紫薇田园都市,奥林匹克花园,中海国际社区,万达广场等等。这类词语基本上很精确了,用户精准度也很高。这类关键词可算是海量了。是需要着重来做的。

六、地域+楼盘名称

这类关键词和第五类类似。不过更加精确。可以和第五类合并。一起来做。

七、地域+楼盘名称+(价格/评论/……)

这类关键词,是在第五类和第六类基础上衍生而来。又衍生出来百万甚至千万个关键词。

 

       这七类,基本涵盖了房产类网站SEO的各个方面(当然,也有其他一些没有包含进来)。在我看来,这第五,六,七类关键词是SEO的突破口。至于第二,三,四类关键词一些大型网站基本都做的差不多的。

 

       我们再来看王通针对中青旅做的一个SEO案例。

 

 

第一类:热门词

例如china tours 、travel to china、china hotel等等热门词,这类词虽然热门,但是日检索量有限,同时竞争非常的厉害,所以不是考虑的重点。

第二类:旅游景点

例如 长城的英文写法,great wall of china这个词每天搜索量上万次。甚至每天搜索长城有多长的老外也有几百人。所以把所有的景点都当做关键词,也是一个不小的量。

第二类:地名+travel 

例如:travel to beijing 、travel to shanghai … …   这样立刻产生的了几千个关键词

第三类:地名+hotels  

例如:beijing hotels、guangzhou hotels… …  这类词有几百个关键词出现了

第三类:cheap + 地名+Flights 

例如:cheap beijing flights、cheap shanghai flights 这样几百个关键词又有了

第四类:这是真正的爆破点, “城市名 to 城市名 cheap flights”  

这个量有多大呢?保守一点来计算,500个城市组合,就是25万个关键词。

这个策略制定之后,然后就是来设计这些关键词网页的模版,在模版中直接把关键词布局和内部链接构架设计好,接着用程序搞定web界面,几十万关键词网页就建好了。有了这几十万个关键词网页,不费吹灰之力,三个月后,中青旅英文站流量增长了15倍。

 

 

在这个大逻辑之下,在寻找网站的SEO突破点的时候,一定要结合网站运营策略、网络营销策略、其他网站推广方法。例如针对某一个B2B网站做SEO 的时候,我们重点的引爆点就是放到了他们对会员的培训让,促使每一个会员都主动和其他网站交换链接,使其在短短时间内,获得了非常多的反向链接。SEO效果也是火箭速度的快升。

那么,发觉一个大型网站的SEO引爆点都从哪些方面入手呢?

1、关键词策略

2、网站内容策略;

3、链接构架策略;

4、关键词布局策略;

5、反向链接建设策略;

6、站内搜索引擎优化策略……

 

 

总结下:SEO技术不是问题。问题是SEO策略。选择对的SEO策略,才是赢得营销的关键。

 

PS: 那些热门关键词,我们可以通过外链来解决,排在第一页应该问题不大。而剩余的那些关键词,也就是“长尾关键词”,则需要依靠内容,链接架构等来做了。

 

That’s all. Good luck for you .

 

分类: SEO教程 标签: , ,

rel="canonical" 用途

2010年3月2日 没有评论

什么是规范网页?为什么要指定规范网页?

规范网页是一组内容高度相似的网页的首选版本。

对于网站来说,包含多个列有同组产品的网页很正常。例如,一个网页可能按字母表顺序显示产品,而其他网页则按照价格或评分显示相同产品。例如:

http://www.example.com/product.php?item=swedish-fish&trackingid=1234567&sort=alpha&sessionid=5678asfasdfasfd

http://www.example.com/product.php?item=swedish-fish&trackingid=1234567&sort=price&sessionid=5678asfasdfasfd

如果 Google 知道这些网页的内容相同,我们可能只会将搜索结果的一个版本编入索引。我们的算法会选择我们认为可以最好地回答用户查询的网页。不过,现在用户可以通过将 <link> 元素和 rel=”canonical” 属性添加到该网页非规范版本的 <head> 部分,为搜索引擎指定规范网页。添加此链接和属性可以让网站拥有者识别出哪些网页具有相同的内容,从而向 Google 提出建议:”在内容相同的所有网页中,此网页最有用。请将该网页排在搜索结果中靠前的位置。”

如何指定规范网页?

要指定指向网页 http://www.example.com/product.php?item=swedish-fish 的规范链接,请按以下形式创建 <link> 元素:

<link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish"/>

将上述链接复制到该网页所有非规范版本的 <head> 部分,如 http://www.example.com/product.php?item=swedish-fish&sort=price。

如果您在 http://www.example.com/product.php?item=swedish-fish 和 https://www.example.com/product.php?item=swedish-fish 上都发布了内容,则可以指定该网页的规范版本。创建 <link> 元素:

<link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish"/>

将上述链接添加到 https://www.example.comproduct.php?item=swedish-fish 的 <head> 部分。

rel=”canonical” 是建议还是指令?

通过此新选项,网站拥有者可以建议 Google 应将哪个网页版本视为规范版本。在确定哪些网址包含相同的内容以及计算其中关联性最强而要显示在搜索结果中的的网页时,Google 会结合其他信息考虑此建议。

此链接可以是相对的或是绝对的吗?

rel=”canonical” 属性可与相对链接或绝对链接一起使用,但我们建议使用绝对链接,以减少可能出现的混乱或问题。如果您的文档指定了一个基础链接,则所有相对链接都会相对于该基础链接。

一组网页上的内容必须与规范版本的上内容相似吗?

是的。rel=”canonical” 属性只能用来指定包含相同内容(即使存在微小差异,比如排列顺序,也无关紧要)的大量网页的首选版本。

例如,如果某网站有一组网页显示了相同型号的舞蹈鞋,只是每个网页图片中鞋的颜色有所不同,那么您可以将能突出当下最流行色彩的网页设置为规范版本,这样 Google 就比较容易将该网页显示在搜索结果中。不过,如果该网站只是想把凝胶鞋垫的网页排在鞋的网页之前,那么使用rel=”canonical” 就不合适了。

如果 rel=”canonical” 指向了不存在的网页会怎样?或者如果将一组网页中的多个网页指定为规范版本会怎样?

我们会尽力使用算法确定适当的规范网页,就像我们以前所做的那样。

Google 能遵守 rel=”canonical” 的一系列规定吗?

在一定程度上可以,但为了确保达到最佳规范化,我们强烈建议您将链接更新为指向单个规范网页。

rel=”canonical” 可以用来在完全不同的域中建议规范网址吗?

有些情况下,设置重定向网址并非易事。如果需要迁移到新域名,而使用的网络服务器又不能创建服务器端重定向网址,就可能发生这种情况。这种情况下,可以使用 rel="canonical" 链接元素指定想要编入索引的域的确切网址。虽然 rel="canonical" 链接元素被视为一种建议而不是需要绝对服从的指令,但我们确实会尽可能予以遵循。

分类: SEO教程 标签:

我的SEO经验连载(第二节)

2009年12月14日 1 条评论

上一节我们说了搜索引擎怎样权衡一个网页的重要性。今天,我们来说说 链接 。

1、  链接的重要性。

链接对于搜索引擎那可是至关重要的啊。因为蜘蛛是通过链接来抓取内容的。假如一个网页里面没有任何链接,那蜘蛛到了该网页后,蜘蛛就不知道接下来该去哪里了,于是就停止了。再举个例子,在上一节中,我们说到的外联,假如新浪的首页有个链接,到你的网站。那么蜘蛛则会从新浪那里顺着这个链接,来到你的网站。

2、  链接的多元性。

举个例子说吧。比如网易这条新闻

http://tech.163.com/09/1214/03/5QFDN9P9000915BF.html

在该新闻的末尾,我们会看到如下图所示的“关于域名的新闻”。

这就是多元化链接的一个例子。

再举个例子,/ 的首页右侧,我们可以看到有“最近更新”,“阅读排行”,“分类”等链接。这也是多元化链接的一个例子。

通过这个两个最常见的例子,基本能够说明白这个“多元化”了。当然,也可以按照日期对资讯进行归类。这也是一种多元化。

再比如经常可以见到:某篇文章中有些关键词是加了链接的。这也是多元化的一种方式。

我们要做的就是,尽量让网站里面的链接形成一个蜘蛛网,相互交织。而不要简单的形成一个树状结构的链接。

那为什么要这样做呢?因为蜘蛛在爬的时候,喜欢蜘蛛网结构,而不是数状结构。(^_^ 开个玩笑)

3、  链接的规则。

A、一般情况下,url最好是静态网址(也就是说不含有 ? & 等字符的网址。)

比如:/Article/2009-12/2009-12-10-170.html 这个地址,就是一个静态的地址。/vd/?Fu_ID=4 但这个就算是一个动态地址了。

你可以通过生成静态文件来达到效果。或者做 伪静态 都可以。

那伪静态和纯静态哪种好呢?

还拿 /Article/2009-12/2009-12-10-170.html 这个来说,如果这是伪静态的,就不如是纯静态的。因为蜘蛛在抓取的过程中,纯静态的和伪静态的二者抓取的信息是不一样的。纯静态的文件,蜘蛛会抓取到最后修改时间,路径等信息。但伪静态的好像抓不到最后修改时间。因为伪静态的这个文件,实际是不存在的。这也就是为什么一些站点上的 doc  xls 等文件的权重比较高。

B、url的结构化和语义化。

我们来比较三个链接www.test.com/251.htmlwww.test.com/blog.php?id=251

www.test.com/blog/251.html 这三个链接假如结果都是同一个页面。那么第三个效果会好于第二个,第二个会好于第一个。

为什么第二个会好于第一个呢?因为第二个蜘蛛可以读懂,知道是某一篇博客,但第一个蜘蛛都就不懂了。

再比如 http://manuals.gosoa.com.cn/tech/PHP/2/ 这个地址。会比http://manuals.gosoa.com.cn/tech/PHP/2.html这个地址要好。因为这本身就是列表页。

再看一个链接 /Article/2009-12/2009-12-09-167.html 这个链接,蜘蛛也会读懂 是2009-12月的某一篇文章。/Article/ 分类,/2009-12/ 再按日期分,最后再是XXX.html 这样的url就比较友好了。

C、链接与关键词

上面说到了,我们经常可以看到在某篇文章中,某些关键词是带有链接的。这是很好的。

我们再来看个链接

http://manuals.gosoa.com.cn/manuals/PHP教程_PHP手册/php_ref_array.html 在这个url中,

manual(手册的意思)是个关键词 , PHP教程_PHP手册 也是个关键词, php array.也是个关键词。就这一个地址中,出现了如此多的关键词,是非常好的。希望你也能这么处理。

好了,链接就先说到这里。明天继续。。。。

分类: SEO教程 标签:

我的SEO经验连载(第一节)

2009年12月10日 没有评论

 

SEO(Search Engine Optimization),俗称“搜索引擎优化”。SEO重要吗?当然重要。当我们需要查找信息的时候,我们的习惯是,google一下,或者baidu一下。在结果列表中,你的网站排列在自然排名的第几页,第几位呢?这就是所谓的排名,SEO就会对这个排名产生影响。当搜索引擎认为某个页面很重要的时候,就会有很好的排名。

 

说了一堆废话,我们现在开始说SEO怎么做。

首先,我们来说说,搜索引擎都怎样权衡一个网页的重要性呢?这个影响因素非常多。我们只说最重要的几个。

1、内容本身。内容本身首先必须是有意义的,不违法的(比如含有色情信息)。

2、外联。搜索引擎模拟的是现实社会中的关系。举个例子,当有一个人认为 gosoa是比尔盖茨的个人站,你可能不相信。当有第二个人也这样认为,你可能也不相信。但是,当有第三。。。。第100个人都这样认为的时候,你可能会相信了。那现在,假如全球几十个国家的领导人都这么认为,你一定会相信的。(举例不当,别乱拍砖哈。^_^)

搜索引擎和此类似。当有很多的网页,采用同一个关键词,链接到某一个网页的时候,搜索这个关键词,该网页就应该会有很好的排名。比如:有100,1000个网页都以“PHP教程”这个关键词链接到 http://manuals.gosoa.com.cn ,当用户在搜索 “PHP教程”的时候,搜索引擎就会认为http://manuals.gosoa.com.cn 该网页就是“PHP教程”。

在这里,还有个东西要说明。假如最开始就是全球几十个国家领导人认为gosoa就是比尔盖茨的个人站,你即使没有听其他更多的人这么说,你也一定会相信。为什么呢?因为这么多国家领导人,都具有很高的权威性,很高的威望,所以你会相信。

所谓高质量的外联,便是此意。假如网易,搜狐,新浪等这样的权重很高的网站以“PHP教程”关键词链接到http://manuals.gosoa.com.cn 的时候,不需要其他更多的链接,http://manuals.gosoa.com.cn 就会有很好的排名啦。

 

 

今天先说到这里,该工作了。明天继续。。。。

 

 

分类: SEO教程 标签:

由 google趋势(谷歌趋势) 和 baidu指数(百度指数) 分析两个网站的不同

2009年12月9日 1 条评论

 

最近,新弄了个站(http://manuals.gosoa.com.cn),想查查关键词都做哪些。
于是去 google趋势(谷歌趋势)http://www.google.cn/trends 和 baidu指数(百度指数)http://index.baidu.com/ 去查询和分析了一些关键词。

分析结果 很有意思。

PHP手册,在google中排第一,但在百度中却排名倒数第一。
html教程,在google中排名末位,但在百度中却排名第一。

由此可见,使用百度的大多用户,还生活在html时代,而使用google的大多用户,早已步入了 “手册时代” 。

 

===============================
 
 这也是SEO关键词甄选的一个方法。
 
===============================

google 数据

关键词  趋势指数(大约)
php手册  5.2
mysql教程 4.0
css手册  2.5
linux手册 2.3
css教程  2.2
xml教程  2.1
php教程  2.0
javascript教程 1.0
linux教程 1.0
sql教程  0.8
html教程 0.5

 

baidu  数据

关键词  日搜索量(大约)
html教程 900
php教程  800
css教程  600
javascript教程 400
linux教程 400
mysql教程 260
xml教程  210
sql教程  160
css手册  150
php手册  140

 

 

我的SEO经验之谈

2009年1月20日 没有评论

 

一、链接

        网站的链接(内联和外联)都很重要。搜索引擎会根据链接的数量和质量来评估网站的重要性。这和我们的现实生活非常相似。假如网站就是一个人,首先要让家里人和亲戚们都认识他(内联),还要让朋友们都认识他(外联)。如果他的朋友们都是社会上流人士,这样我们可以看出这个人的重要性是蛮高的。如果他的朋友们都是地痞流氓,我们也可以看出这个人的品质是很差的。搜索引擎也是如此判断的。

        鉴于此,有的人就疯狂的去做外联,去各个论坛疯狂的留下自己的网站名称和链接,或者去别人的blog留言,只留下站点名称和链接,甚至出钱去购买友情链接(有一些导航类的站点,靠出卖友情链接挣钱),这样的做法在早期是可行动,但现在搜索引擎已经很聪明了,很明显你是最作弊,搜索引擎会给予处罚的。严重的话直接K掉你的网站。

        那我们怎么做才会比较好呢?首先,去和权重比较高的网站交换友情链接。其次,我们可以撰写出高质量的文章,文章中可以夹带网站链接。高质量的文章,大家会争相转载,你的权重也就慢慢上来了。

 

二、动态URL和静态URL。

        很早以前就听人说搜索引擎很难收录动态URL。但官方并没有这样的消息。经有关人士测试,发现经过优化的动态URL和静态URL几乎没有差别。当然,静态URL最好不过了。而且最好URL结构也很清晰。比如:http://www.gosoa.com.cn/Article/2009-01/2009-01-15-100.html 搜索引擎会明白是2009年一月的一篇文章。

   什么是经过优化的URL呢?

   1、URL的参数最好不要太多。经测试,一般最好是不大于3个。

   2、URL的参数最好也做到语义化。比如 id=3&type=a

 

三、制作网站地图。

    首先,网站的导航非常重要,而且结构要清晰。

    制作sitemap.xml或者sitemap.html或者urllist.txt.

 

四、有关域名

      我们最好让http://www.gosoa.com.cn  和 http://www.gosoa.com.cn  统一。也就是说当用户访问 http://www.gosoa.com.cn的时候,自动跳转到http://www.gosoa.com.cn。可能针对用户,访问两个地址看到的页面是一样的,但针对搜索引擎而言,两个却不一样。在Apache下,我们可以用.htaccess文件使用301重定向。

 

五、页面的结构

      最好全部采用XHTML+CSS。尽量不要使用嵌套的table。搜索引擎对于深层次的嵌套table读取不是很好。

 

六、页面内容的合理性

      首先,一个页面的关键字keywords要合理,而且很页面的内容具有相关性,最好在页面内容中也会出现该关键字。

      其次,页面的description也要合理,而且言简意赅,100字以内,说明页面的内容。比如:google中搜索“华城国际”,搜房网的描述就很合理且明了:“华城国际清盘销售2期70-96㎡两室,无层差朝向,现阶段均价5000元”

      第三,页面的标题也很重要,而且title的权重是高于description的。

 

七、网站的阅读排行

      点击率高的内容或许不是我们要主推的关键词,但我们要让点击率高的内容点击率更高,并将得到的流量分派下去。

 

八、高质量的原创文章

       SEO只是手段,而且随着搜索引擎的算法的变化,可能SEO的方法就失效了。只有内容才是王道。高质量的原创文章,会让你的网站权重迅速提高。而且高质量的文章,大家会争着去转载。要让你的网站成为内容的提供者,而且原创内容的可操作性很强,我们这时候是具有话语权的。

 

九、创建企业blog

     建立企业的blog,不要在企业blog中大肆宣传公司的产品,可以记录公司的成长历程,宣扬公司的文化,用文化去感染别人,你的产品自然也会卖的好的。

 

Google对 动态、静态、伪静态网址 的 解说

2009年1月18日 没有评论

近日,Google搜索质量组发布文章,详细解说了对于Google搜索引擎,动态、静态、伪静态网址的区别及利与弊(原文/译文)。

Google发布的文章,可能由于翻译过来的原因,加之诸多问题不便言明,感觉一向都很含糊,樂思蜀简明的引用原文如下。

动态、静态、伪静态

  • 动态网址:内容存于数据库中,根据要求显示内容,URL中以 ? # & 显示不同的参数,如:news.php?lang=cn&class=1&id=2
  • 静态网址:纯静态HTML文档,能使用 filetype:htm 查询到的网页。
  • 伪静态网址:使用 Rewrite 将动态网址进行重写,使动态网址看起来像静态网址。

动态、静态、伪静态之间的利与弊(新)

Google此文从Google新的算法、机制出发,解说了三者之间的利与弊,解释了一些错误的认识。

动态网址

首先,动态网址目前对于Google来说,“不能被抓取”的说法是错误的,Google能够很好的处理动态网址并顺利抓取;其次“参数不能超过3个”的说法也不正确,Google能够抓取参数超过3个的动态网址,不过,为了避免URL太长应尽量减少参数。

其次,动态网址有其一定的优势,以上面所说的 news.php?lang=cn&class=1&id=2 为例,网址中的参数准确的告诉Google,此URL内容语言为cn、隶属于分类1、内容ID为2,更便于Google对内容的识别处理。

最后,动态网址应尽量精简,特别是会话标识(sid)和查询(query)参数,容易造成大量相同页面。

静态网址

首先,静态网址具有的绝对优势是其明晰,/product/nokia/n95.html和/about.html可以很容易被理解,从而在搜索结果中可能点击量相对较高。

其次,静态网址未必就是最好的网址形式,上述动态网址中说到,动态网址能够告诉Google一些可以识别的参数,而静态网址如果文档布置不够恰当(如:过于扁平化,将HTML文档全放在根目录下)及其他因素,反而不如静态网址为Google提供的参考信息丰富。

最后,樂思蜀觉得Google此文中是否有其隐藏含义?“更新此种类型网址的页面会比较耗费时间,尤其是当信息量增长很快时,因为每一个单独的页面都必须更改编译代码。”虽然所说的是网站,但在Google系统中是否同样存在这样的问题呢?

伪静态网址

首先,伪静态网址不能让动态网址“静态化”,伪静态仅仅是对动态网址的一个重写,Google不会认为伪静态就是HTML文档。

其次,伪静态可取,但应把重心放在去除冗余参数、规范URL、尽可能的避免重复页上。

最后,伪静态有很大潜大危险,最好在对网站系统、网站结构、内容分布、参数意义熟悉的情况下使用。

在写伪静态规则时,应保留有价值的参数,不要将有价值的参数全部精简掉,如前面例子中的 news.php?lang=cn&class=1&id=2 最好重写为 news-cn-class1-id2.html,而不是过份精简重写为 news-2.html。

再就是伪静态中一定不能包含会话标识(sid)和查询(query)参数,/product.asp?sid=98971298178906&id=1234 这样的动态网址,其中的sid本来Google能够识别并屏蔽,但如果重写为 /product/98971298178906/1234,Google不但无法识别,还在整站中造成无限重复页面(每个会话都会产生一个新的会话ID)。

上面就是Google发布文章内容的简述,文中将动态、静态、伪静态解说的很清楚,有些观点甚至彻底颠覆了之前的认识。建议站长、SEOer多了解搜索引擎最新动态,公布的一些文档,并从中获取已说明的和未明确说明的信息,善加利用。

原文:by 乐思蜀 http://www.lesishu.cn/google/google-url/

Google“重复内容处罚”之 解读

2009年1月18日 没有评论

Google对“重复内容处罚”的官方说法

根本不存在所谓的“重复内容处罚”。

“重复内容处罚”仅包括

  • 完全抄袭并且发布其他网站的内容(最典型的就是内容采集)
  • 没有或者很少原创内容的联盟计划(如:商城的下线,多种样式一套数据库;软件站联盟,子站点全部调用联盟的数据;等等……)
  • 联属计划(联属网站分发全部相同的信息,同一点)

大家所担心的,事实上并不存在的“重复内容处罚”

同一域名下多个URL版本,如:

/news.php?class=123&id=12345

/news.php?id=12345

Google对此的态度是:除非重复内容看起来意在欺骗用户并操纵搜索引擎结果,否则,我们不会对有重复内容的网站采取特别措施。

Google对上述多个URL版本采取的措施为

  1. 当我们探测重复内容时,比如由网址参数造成的衍生网址,我们会将这些相似的网址放在同一组里。
  2. 我们会选择我们认为最能代表这一组的网址在搜索结果里进行展示。
  3. 我们还会对这一组网址的特性进行相应的整理,像链接的受欢迎程度,并将其合并到此代表性网址上。

多个URL版本对Google抓取的影响

重复内容会造成抓取效率低下:当Googlebot在您的网站上发现了十个网址,在它知道这些网址含有完全相同的内容之前(如上所述,也就是在我们能够对他们进行归类之前),它必须对这十个网址逐一进行抓取。Googlebot耗费在抓取重复性内容上的时间和资源越多,它用来抓取其他内容的时间也就相对变少了。

对于多个URL版本,我们能做的

  • Google在应用上述措施时,有可能会无法正确识别,从面“削弱这一特定内容的排名竞争力”,故我们应试尽量避免多个URL版本出现。
  • 当多个URL版本存在时,我们可以挑选常用的一种URL,制作sitemap文件,为Google提供参考。

原文:by 乐思蜀 http://www.lesishu.cn/google/duplicate-content-penalty/