存档

文章标签 ‘SEO’

百度对中文URL的收录测试结果

2010年4月13日 2 条评论

大约在2010-3-10日左右,本博客做了改版。

之前的链接全是英文。

改版后的日志标题都已经更换成了中文。包括一些分类,tag都做成了中文URL。

改版后 百度于3-17日左右开始重新收录

点击这里查看示例:http://www.baidu.com/s?bs=site%3Awww.gosoa.com.cn&f=8&wd=site%3Awww.gosoa.com.cn+%CD%B7%CF%FB%CF%A2

本站编码是UTF8。百度中显示的也非乱码。(但在以前,据我记忆在09年3月以前都是乱码)

同时,上述例子中“ 头消息” 关键词  在URL中也是高亮显示。

注意,URL中出现的关键词也是排名计算因数之一。

之前 我的某地产网也做过类似的测试。中文URL在百度中表现也非常好。

个人结论(仅是我个人测试的结论):

1、中文URL对于页面内关键词的密度有影响。

比如 有一个页面,有如下链接地址:

http://www.xxx.com/category/php开发/1.html

http://www.xxx.com/category/php 开发/2.html

http://www.xxx.com/category/php 开发/3.html

http://www.xxx.com/category/php 开发/…….html

这样,PHP开发 这个关键词在该页面就有了很好的密度。同时该关键词的权重也会相应的提高。(注意,如果你非要在页面内堆砌关键词,那结果就XX了)

2、百度以前收录中文路径大多是乱码。如今已经解决了这个问题。说明百度也在向着更好的用户体验发展。

百度在呈现搜索结果的时候,有三个部分,标题,描述和URL。 如何通过这三部分就让用户非常明了搜索结果,这是百度的工程师们在经常研究的功课。

请问: http://www.xxx.com/category/php 开发/ 这样的URL更友好呢    还是
http://www.xxx.com/category/?id=12
或者
http://www.xxx.com/category/12/
或者
http://www.xxx.com/category/php develop/

当然 第一个和最后一个 更加清晰明了。

那他们两个谁更好呢?

请问:如果你不懂英文,哪个对你更明了呢?

注意,URL中出现的关键词也是排名计算因数之一哦。

3、我在网上看到有人说: “ 很多人不建议用中文路径。”  至少我还没看到“不建议使用中文路径”的具体测试数据。以及都是哪些人不建议的。

分类: SEO教程 标签: , ,

大型网站的SEO策略

2010年3月4日 没有评论

 

很多大型网站的页面权重都很高。甚至二级频道,分站的权重也很高。PR都到了6,7甚至8。但流量也好,收入也罢,都达到了一个瓶颈。此时业绩急需一个质的飞跃。站在SEO的角度,就需要找到SEO的一个突破口,让流量和业绩都有另一个新高。这就需要调整SEO策略。

很多公司,都基本有自己的SEO团队,SEO技术也都很好。但公司业绩不佳。打个比方,一个PHP开发团队,技术实力雄厚,个个都是N人,他们的产品性能很优,用户体验也很好,但就是不挣钱。为什么呢?因为产品不能给用户带来价值,没有人用。这就是产品方向,产品策略出了问题。SEO同理。

SEO只是网站推广的一种方式,网站推广只是网络营销的一种方式,网络营销只是产品经营的一种方式,产品经营才是根本的目的。所以,SEO的根本目的是为了产品经营,而非仅仅是流量。

抓住这一点再做SEO,效果就应该会比较明显了。

我们拿房产类网站来说。(我们只说新房,二手房和租房暂不考虑)

这个策略,我们从何开始呢?当然是从关键词开始,同时兼有行业特性。

一、热门关键词。

比如 房产,房价,房子,新房,楼盘,住宅,写字楼等等,这些词语,意义不大。太宽泛。因为房产行业有一个特性,就是地域性。比如北京房产,苏州房产等。所以,该类词可以不考虑。地域热门关键词

二、地域热门关键词

比如 北京房产,深圳房产信息,苏州楼盘,西安房价……等等,这类地域性的热门关键词。这类关键词,竞争也比较大。SEM也非常多。那这类词怎么做呢?其一,通过SEM手段。其二,SEO之外链。我们可以通过大量的外链来做这类关键词。

三、地域+物业类型

比如 北京住宅,深圳经济适用房,上海商铺(别墅,公寓,写字楼等,再分的细一些,比如花园洋房,两限房,商住两用等等)等等。这类关键词衍生出了上千个关键词。

四、地域+城区+(楼盘/房价/…)

比如 北京海淀房价,西安东郊房价等。这又衍生出来成百上千个关键词了。

五、楼盘名称

比如 紫薇田园都市,奥林匹克花园,中海国际社区,万达广场等等。这类词语基本上很精确了,用户精准度也很高。这类关键词可算是海量了。是需要着重来做的。

六、地域+楼盘名称

这类关键词和第五类类似。不过更加精确。可以和第五类合并。一起来做。

七、地域+楼盘名称+(价格/评论/……)

这类关键词,是在第五类和第六类基础上衍生而来。又衍生出来百万甚至千万个关键词。

 

       这七类,基本涵盖了房产类网站SEO的各个方面(当然,也有其他一些没有包含进来)。在我看来,这第五,六,七类关键词是SEO的突破口。至于第二,三,四类关键词一些大型网站基本都做的差不多的。

 

       我们再来看王通针对中青旅做的一个SEO案例。

 

 

第一类:热门词

例如china tours 、travel to china、china hotel等等热门词,这类词虽然热门,但是日检索量有限,同时竞争非常的厉害,所以不是考虑的重点。

第二类:旅游景点

例如 长城的英文写法,great wall of china这个词每天搜索量上万次。甚至每天搜索长城有多长的老外也有几百人。所以把所有的景点都当做关键词,也是一个不小的量。

第二类:地名+travel 

例如:travel to beijing 、travel to shanghai … …   这样立刻产生的了几千个关键词

第三类:地名+hotels  

例如:beijing hotels、guangzhou hotels… …  这类词有几百个关键词出现了

第三类:cheap + 地名+Flights 

例如:cheap beijing flights、cheap shanghai flights 这样几百个关键词又有了

第四类:这是真正的爆破点, “城市名 to 城市名 cheap flights”  

这个量有多大呢?保守一点来计算,500个城市组合,就是25万个关键词。

这个策略制定之后,然后就是来设计这些关键词网页的模版,在模版中直接把关键词布局和内部链接构架设计好,接着用程序搞定web界面,几十万关键词网页就建好了。有了这几十万个关键词网页,不费吹灰之力,三个月后,中青旅英文站流量增长了15倍。

 

 

在这个大逻辑之下,在寻找网站的SEO突破点的时候,一定要结合网站运营策略、网络营销策略、其他网站推广方法。例如针对某一个B2B网站做SEO 的时候,我们重点的引爆点就是放到了他们对会员的培训让,促使每一个会员都主动和其他网站交换链接,使其在短短时间内,获得了非常多的反向链接。SEO效果也是火箭速度的快升。

那么,发觉一个大型网站的SEO引爆点都从哪些方面入手呢?

1、关键词策略

2、网站内容策略;

3、链接构架策略;

4、关键词布局策略;

5、反向链接建设策略;

6、站内搜索引擎优化策略……

 

 

总结下:SEO技术不是问题。问题是SEO策略。选择对的SEO策略,才是赢得营销的关键。

 

PS: 那些热门关键词,我们可以通过外链来解决,排在第一页应该问题不大。而剩余的那些关键词,也就是“长尾关键词”,则需要依靠内容,链接架构等来做了。

 

That’s all. Good luck for you .

 

分类: SEO教程 标签: , ,

我的SEO经验连载(第二节)

2009年12月14日 2 条评论

上一节我们说了搜索引擎怎样权衡一个网页的重要性。今天,我们来说说 链接 。

1、  链接的重要性。

链接对于搜索引擎那可是至关重要的啊。因为蜘蛛是通过链接来抓取内容的。假如一个网页里面没有任何链接,那蜘蛛到了该网页后,蜘蛛就不知道接下来该去哪里了,于是就停止了。再举个例子,在上一节中,我们说到的外联,假如新浪的首页有个链接,到你的网站。那么蜘蛛则会从新浪那里顺着这个链接,来到你的网站。

2、  链接的多元性。

举个例子说吧。比如网易这条新闻

http://tech.163.com/09/1214/03/5QFDN9P9000915BF.html

在该新闻的末尾,我们会看到如下图所示的“关于域名的新闻”。

这就是多元化链接的一个例子。

再举个例子,/ 的首页右侧,我们可以看到有“最近更新”,“阅读排行”,“分类”等链接。这也是多元化链接的一个例子。

通过这个两个最常见的例子,基本能够说明白这个“多元化”了。当然,也可以按照日期对资讯进行归类。这也是一种多元化。

再比如经常可以见到:某篇文章中有些关键词是加了链接的。这也是多元化的一种方式。

我们要做的就是,尽量让网站里面的链接形成一个蜘蛛网,相互交织。而不要简单的形成一个树状结构的链接。

那为什么要这样做呢?因为蜘蛛在爬的时候,喜欢蜘蛛网结构,而不是数状结构。(^_^ 开个玩笑)

3、  链接的规则。

A、一般情况下,url最好是静态网址(也就是说不含有 ? & 等字符的网址。)

比如:/Article/2009-12/2009-12-10-170.html 这个地址,就是一个静态的地址。/vd/?Fu_ID=4 但这个就算是一个动态地址了。

你可以通过生成静态文件来达到效果。或者做 伪静态 都可以。

那伪静态和纯静态哪种好呢?

还拿 /Article/2009-12/2009-12-10-170.html 这个来说,如果这是伪静态的,就不如是纯静态的。因为蜘蛛在抓取的过程中,纯静态的和伪静态的二者抓取的信息是不一样的。纯静态的文件,蜘蛛会抓取到最后修改时间,路径等信息。但伪静态的好像抓不到最后修改时间。因为伪静态的这个文件,实际是不存在的。这也就是为什么一些站点上的 doc  xls 等文件的权重比较高。

B、url的结构化和语义化。

我们来比较三个链接www.test.com/251.htmlwww.test.com/blog.php?id=251

www.test.com/blog/251.html 这三个链接假如结果都是同一个页面。那么第三个效果会好于第二个,第二个会好于第一个。

为什么第二个会好于第一个呢?因为第二个蜘蛛可以读懂,知道是某一篇博客,但第一个蜘蛛都就不懂了。

再比如 http://manuals.gosoa.com.cn/tech/PHP/2/ 这个地址。会比http://manuals.gosoa.com.cn/tech/PHP/2.html这个地址要好。因为这本身就是列表页。

再看一个链接 /Article/2009-12/2009-12-09-167.html 这个链接,蜘蛛也会读懂 是2009-12月的某一篇文章。/Article/ 分类,/2009-12/ 再按日期分,最后再是XXX.html 这样的url就比较友好了。

C、链接与关键词

上面说到了,我们经常可以看到在某篇文章中,某些关键词是带有链接的。这是很好的。

我们再来看个链接

http://manuals.gosoa.com.cn/manuals/PHP教程_PHP手册/php_ref_array.html 在这个url中,

manual(手册的意思)是个关键词 , PHP教程_PHP手册 也是个关键词, php array.也是个关键词。就这一个地址中,出现了如此多的关键词,是非常好的。希望你也能这么处理。

好了,链接就先说到这里。明天继续。。。。

分类: SEO教程 标签:

我的SEO经验连载(第一节)

2009年12月10日 没有评论

 

SEO(Search Engine Optimization),俗称“搜索引擎优化”。SEO重要吗?当然重要。当我们需要查找信息的时候,我们的习惯是,google一下,或者baidu一下。在结果列表中,你的网站排列在自然排名的第几页,第几位呢?这就是所谓的排名,SEO就会对这个排名产生影响。当搜索引擎认为某个页面很重要的时候,就会有很好的排名。

 

说了一堆废话,我们现在开始说SEO怎么做。

首先,我们来说说,搜索引擎都怎样权衡一个网页的重要性呢?这个影响因素非常多。我们只说最重要的几个。

1、内容本身。内容本身首先必须是有意义的,不违法的(比如含有色情信息)。

2、外联。搜索引擎模拟的是现实社会中的关系。举个例子,当有一个人认为 gosoa是比尔盖茨的个人站,你可能不相信。当有第二个人也这样认为,你可能也不相信。但是,当有第三。。。。第100个人都这样认为的时候,你可能会相信了。那现在,假如全球几十个国家的领导人都这么认为,你一定会相信的。(举例不当,别乱拍砖哈。^_^)

搜索引擎和此类似。当有很多的网页,采用同一个关键词,链接到某一个网页的时候,搜索这个关键词,该网页就应该会有很好的排名。比如:有100,1000个网页都以“PHP教程”这个关键词链接到 http://manuals.gosoa.com.cn ,当用户在搜索 “PHP教程”的时候,搜索引擎就会认为http://manuals.gosoa.com.cn 该网页就是“PHP教程”。

在这里,还有个东西要说明。假如最开始就是全球几十个国家领导人认为gosoa就是比尔盖茨的个人站,你即使没有听其他更多的人这么说,你也一定会相信。为什么呢?因为这么多国家领导人,都具有很高的权威性,很高的威望,所以你会相信。

所谓高质量的外联,便是此意。假如网易,搜狐,新浪等这样的权重很高的网站以“PHP教程”关键词链接到http://manuals.gosoa.com.cn 的时候,不需要其他更多的链接,http://manuals.gosoa.com.cn 就会有很好的排名啦。

 

 

今天先说到这里,该工作了。明天继续。。。。

 

 

分类: SEO教程 标签:

我的SEO经验之谈

2009年1月20日 没有评论

 

一、链接

        网站的链接(内联和外联)都很重要。搜索引擎会根据链接的数量和质量来评估网站的重要性。这和我们的现实生活非常相似。假如网站就是一个人,首先要让家里人和亲戚们都认识他(内联),还要让朋友们都认识他(外联)。如果他的朋友们都是社会上流人士,这样我们可以看出这个人的重要性是蛮高的。如果他的朋友们都是地痞流氓,我们也可以看出这个人的品质是很差的。搜索引擎也是如此判断的。

        鉴于此,有的人就疯狂的去做外联,去各个论坛疯狂的留下自己的网站名称和链接,或者去别人的blog留言,只留下站点名称和链接,甚至出钱去购买友情链接(有一些导航类的站点,靠出卖友情链接挣钱),这样的做法在早期是可行动,但现在搜索引擎已经很聪明了,很明显你是最作弊,搜索引擎会给予处罚的。严重的话直接K掉你的网站。

        那我们怎么做才会比较好呢?首先,去和权重比较高的网站交换友情链接。其次,我们可以撰写出高质量的文章,文章中可以夹带网站链接。高质量的文章,大家会争相转载,你的权重也就慢慢上来了。

 

二、动态URL和静态URL。

        很早以前就听人说搜索引擎很难收录动态URL。但官方并没有这样的消息。经有关人士测试,发现经过优化的动态URL和静态URL几乎没有差别。当然,静态URL最好不过了。而且最好URL结构也很清晰。比如:http://www.gosoa.com.cn/Article/2009-01/2009-01-15-100.html 搜索引擎会明白是2009年一月的一篇文章。

   什么是经过优化的URL呢?

   1、URL的参数最好不要太多。经测试,一般最好是不大于3个。

   2、URL的参数最好也做到语义化。比如 id=3&type=a

 

三、制作网站地图。

    首先,网站的导航非常重要,而且结构要清晰。

    制作sitemap.xml或者sitemap.html或者urllist.txt.

 

四、有关域名

      我们最好让http://www.gosoa.com.cn  和 http://www.gosoa.com.cn  统一。也就是说当用户访问 http://www.gosoa.com.cn的时候,自动跳转到http://www.gosoa.com.cn。可能针对用户,访问两个地址看到的页面是一样的,但针对搜索引擎而言,两个却不一样。在Apache下,我们可以用.htaccess文件使用301重定向。

 

五、页面的结构

      最好全部采用XHTML+CSS。尽量不要使用嵌套的table。搜索引擎对于深层次的嵌套table读取不是很好。

 

六、页面内容的合理性

      首先,一个页面的关键字keywords要合理,而且很页面的内容具有相关性,最好在页面内容中也会出现该关键字。

      其次,页面的description也要合理,而且言简意赅,100字以内,说明页面的内容。比如:google中搜索“华城国际”,搜房网的描述就很合理且明了:“华城国际清盘销售2期70-96㎡两室,无层差朝向,现阶段均价5000元”

      第三,页面的标题也很重要,而且title的权重是高于description的。

 

七、网站的阅读排行

      点击率高的内容或许不是我们要主推的关键词,但我们要让点击率高的内容点击率更高,并将得到的流量分派下去。

 

八、高质量的原创文章

       SEO只是手段,而且随着搜索引擎的算法的变化,可能SEO的方法就失效了。只有内容才是王道。高质量的原创文章,会让你的网站权重迅速提高。而且高质量的文章,大家会争着去转载。要让你的网站成为内容的提供者,而且原创内容的可操作性很强,我们这时候是具有话语权的。

 

九、创建企业blog

     建立企业的blog,不要在企业blog中大肆宣传公司的产品,可以记录公司的成长历程,宣扬公司的文化,用文化去感染别人,你的产品自然也会卖的好的。

 

Google对 动态、静态、伪静态网址 的 解说

2009年1月18日 没有评论

近日,Google搜索质量组发布文章,详细解说了对于Google搜索引擎,动态、静态、伪静态网址的区别及利与弊(原文/译文)。

Google发布的文章,可能由于翻译过来的原因,加之诸多问题不便言明,感觉一向都很含糊,樂思蜀简明的引用原文如下。

动态、静态、伪静态

  • 动态网址:内容存于数据库中,根据要求显示内容,URL中以 ? # & 显示不同的参数,如:news.php?lang=cn&class=1&id=2
  • 静态网址:纯静态HTML文档,能使用 filetype:htm 查询到的网页。
  • 伪静态网址:使用 Rewrite 将动态网址进行重写,使动态网址看起来像静态网址。

动态、静态、伪静态之间的利与弊(新)

Google此文从Google新的算法、机制出发,解说了三者之间的利与弊,解释了一些错误的认识。

动态网址

首先,动态网址目前对于Google来说,“不能被抓取”的说法是错误的,Google能够很好的处理动态网址并顺利抓取;其次“参数不能超过3个”的说法也不正确,Google能够抓取参数超过3个的动态网址,不过,为了避免URL太长应尽量减少参数。

其次,动态网址有其一定的优势,以上面所说的 news.php?lang=cn&class=1&id=2 为例,网址中的参数准确的告诉Google,此URL内容语言为cn、隶属于分类1、内容ID为2,更便于Google对内容的识别处理。

最后,动态网址应尽量精简,特别是会话标识(sid)和查询(query)参数,容易造成大量相同页面。

静态网址

首先,静态网址具有的绝对优势是其明晰,/product/nokia/n95.html和/about.html可以很容易被理解,从而在搜索结果中可能点击量相对较高。

其次,静态网址未必就是最好的网址形式,上述动态网址中说到,动态网址能够告诉Google一些可以识别的参数,而静态网址如果文档布置不够恰当(如:过于扁平化,将HTML文档全放在根目录下)及其他因素,反而不如静态网址为Google提供的参考信息丰富。

最后,樂思蜀觉得Google此文中是否有其隐藏含义?“更新此种类型网址的页面会比较耗费时间,尤其是当信息量增长很快时,因为每一个单独的页面都必须更改编译代码。”虽然所说的是网站,但在Google系统中是否同样存在这样的问题呢?

伪静态网址

首先,伪静态网址不能让动态网址“静态化”,伪静态仅仅是对动态网址的一个重写,Google不会认为伪静态就是HTML文档。

其次,伪静态可取,但应把重心放在去除冗余参数、规范URL、尽可能的避免重复页上。

最后,伪静态有很大潜大危险,最好在对网站系统、网站结构、内容分布、参数意义熟悉的情况下使用。

在写伪静态规则时,应保留有价值的参数,不要将有价值的参数全部精简掉,如前面例子中的 news.php?lang=cn&class=1&id=2 最好重写为 news-cn-class1-id2.html,而不是过份精简重写为 news-2.html。

再就是伪静态中一定不能包含会话标识(sid)和查询(query)参数,/product.asp?sid=98971298178906&id=1234 这样的动态网址,其中的sid本来Google能够识别并屏蔽,但如果重写为 /product/98971298178906/1234,Google不但无法识别,还在整站中造成无限重复页面(每个会话都会产生一个新的会话ID)。

上面就是Google发布文章内容的简述,文中将动态、静态、伪静态解说的很清楚,有些观点甚至彻底颠覆了之前的认识。建议站长、SEOer多了解搜索引擎最新动态,公布的一些文档,并从中获取已说明的和未明确说明的信息,善加利用。

原文:by 乐思蜀 http://www.lesishu.cn/google/google-url/

Google“重复内容处罚”之 解读

2009年1月18日 没有评论

Google对“重复内容处罚”的官方说法

根本不存在所谓的“重复内容处罚”。

“重复内容处罚”仅包括

  • 完全抄袭并且发布其他网站的内容(最典型的就是内容采集)
  • 没有或者很少原创内容的联盟计划(如:商城的下线,多种样式一套数据库;软件站联盟,子站点全部调用联盟的数据;等等……)
  • 联属计划(联属网站分发全部相同的信息,同一点)

大家所担心的,事实上并不存在的“重复内容处罚”

同一域名下多个URL版本,如:

/news.php?class=123&id=12345

/news.php?id=12345

Google对此的态度是:除非重复内容看起来意在欺骗用户并操纵搜索引擎结果,否则,我们不会对有重复内容的网站采取特别措施。

Google对上述多个URL版本采取的措施为

  1. 当我们探测重复内容时,比如由网址参数造成的衍生网址,我们会将这些相似的网址放在同一组里。
  2. 我们会选择我们认为最能代表这一组的网址在搜索结果里进行展示。
  3. 我们还会对这一组网址的特性进行相应的整理,像链接的受欢迎程度,并将其合并到此代表性网址上。

多个URL版本对Google抓取的影响

重复内容会造成抓取效率低下:当Googlebot在您的网站上发现了十个网址,在它知道这些网址含有完全相同的内容之前(如上所述,也就是在我们能够对他们进行归类之前),它必须对这十个网址逐一进行抓取。Googlebot耗费在抓取重复性内容上的时间和资源越多,它用来抓取其他内容的时间也就相对变少了。

对于多个URL版本,我们能做的

  • Google在应用上述措施时,有可能会无法正确识别,从面“削弱这一特定内容的排名竞争力”,故我们应试尽量避免多个URL版本出现。
  • 当多个URL版本存在时,我们可以挑选常用的一种URL,制作sitemap文件,为Google提供参考。

原文:by 乐思蜀 http://www.lesishu.cn/google/duplicate-content-penalty/