用户名: 密 码:
您现在的位置:首页 >> SEO技巧 >> 内容

伪原创真红宝书!

时间:2009/11/20 17:21:17 点击:3647

  核心提示:原创:简单地理解就是第一次在网络上发表的内容。 转载:把被人发布的内容复制到自己的站点;伪原创:就是对原创进行的第二次或者第n次经过修改的转载发表。比如修改标题,增加摘要,转载不完整内容等等。抄袭、剽窃,小心被活劈!!!  先来谈谈转载对于这点各位朋友都应该知道,就是把一些网站的文章直接搬到自己的网...
原创:简单地理解就是第一次在网络上发表的内容。

转载:把被人发布的内容复制到自己的站点;

伪原创:就是对原创进行的第二次或者第n次经过修改的转载发表。比如修改标题,增加摘要,转载不完整内容等等。

 

抄袭、剽窃,小心被活劈!!!

 

  先来谈谈转载对于这点各位朋友都应该知道,就是把一些网站的文章直接搬到自己的网站而且不做任何修改。原创的概念也是比较容易理解的,顾名思义也就是说你的文章是你自己写的,在某个网站第一时间发表的。伪原创的概念就是在某个网站找到N篇文章做N次的修改,然后再将文章发表!那么搜索疫情是怎么样判别你的网站内容是否为原创呢?

  一般来说搜索引擎判别一个网站的原创性是由四个因素来决定的:第一,文章的相似度;第二,网站页面的外链;第三,蜘蛛抓取的日期;第四,快照的日期!我要这么说可能有些笼统,我和大家举个例子假如你在某个网站发表文章日期是下午1点,那么蜘蛛看到你的这篇文章就会将这篇文章第一次看见,那蜘蛛就会很自然的放到数据库里,假如你想让蜘蛛认为你的是原创那你要知道几细节,第一,保证你发布的站是被搜索引擎收录的;第二,网站保持更新;第三,假如你的站文章被转载,那么看转载这篇文章的站更新周期与首次发表这篇文章的站的更新周期哪个更快。

 

   目前很多的站长都在考虑自己的网站,搜索引擎的蜘蛛怎么来判断文章的原创性呢?我们在说之前最好先明确三个概念:转载,原创,伪原创。好了,下面直接切入正题!

 

搜索引擎对于原创的判断是如何进行的呢?


一般来讲有以下几个方面的因素决定:


1、快照日期。


2、蜘蛛抓取日期。


3、页面外链的多少。


4、文章修改的程度。


举例:如果一篇标题为《SEO:了解搜索引擎对于原创内容的判断》的文章在今晚10点第一次发表在http://www.xinxilong.com 上。会有什么结果呢?


    搜索引擎蜘蛛来到这个博客或者网站,发现这个页面,分析内容,放入数据库,并且被确定为首次发现,这肯定就是原创了!

那么这个收录与判断的过程中间有几个细节方面问题:

1、必要条件


——假如这个网站没有被收录,这篇文章会认为是原创吗?


——当然不是!因为它根本不可能出现在搜索数据库里!


——如何让它成为原创内容?


——第一个条件,网站必须有被搜索引擎收录。

——假如这个网站收录了,但是不经常更新呢?


——很简单,如果不经常更新,发表的文章到收录的时候也会认为是原创的。


3、转载与采集


——如果文章被转载了呢?


——如果文章被转载,那么看转载这篇文章的站更新周期与首次发表站的更新周期哪个更快。


——不太明白更新周期。


——比如在a站发表,b站转载,如果蜘蛛先访问了a站,发现了文章,再来到b站发现了文章,很明显的,原创权重归a站。


——采集的情况是否符合这种情况?


——是的,采集的情况一样。如果b采集a,但b收录比a早,b就可能变成原创喽!


4、访问时间


——如果蜘蛛先访问了b站呢?

——当然权重给b站,一般的情况下都会这样!


——如果b站转载的文章带了a站的原文章页面链接呢?

——这就很明白了,刚收录的时候,如果排名,两条结果一起出现,有可能还是b站的排名好一点。
当然,文章转载次数多了以后,a站的链接越多,对a站的文章越有好处,排名会慢慢变成a站在前面。


——如果另外转载的文章带的是b站页面的链接呢?

——这种情况就搞笑了,给搜索引擎开了个玩笑,但它们如果判断不好,就变成了一个链接流行度的比赛了。


不过,如果都有很多外部链接,并且相差不大,那么判断的规则应该回到原点,谁先被收录谁就是原创。


5、快照日期
——快照日期显示时间最早的,一般就是原创了吧!

——不一定,这个说法要在一个更新周期之内,比如说文章发表后一周内,快照时间越早的地址将越有被认可为原创的可能。


但如果文章都发表了几个月了,说不定搜索引擎已经重新获取过快照了,快照的日期就变了!


——还有其它的可能吗?


——有,一般比如百度收录,他可能会有一个收录的数据库,经过过滤后,收录的内容才会到搜索结果里来。在这个期间就有一些问题了,比如a站首次发表,b站转载。蜘蛛先访问a站再访问b站。而后可能先把b站的结果放出来了,而a站还在数据库里。

所以说搜索引擎没有收录并不表示搜索引擎蜘蛛没有访问过这些内容,也许在搜索引擎的库存里已经有记录了,只是你查的时间没有放出来而已,就像25号才放出来的内容,但是快照是20号的,这就是搜索引擎的库存内容,同时这也是检验原创的核心时间点。

这种情况一般出现在新站与老站之间,a站发表,b站转载,但a站在搜索引擎的信任度并不高的时候。不过只要是a站先被访问到的,原创权还是a站的,这是最难分出来的情况,因为我们不知道蜘蛛先访问哪个站,除非你知道两个站的网站空间日志内容,能看到搜索引擎对两个页面的访问时间。

6、伪原创


——伪原创也会被认为是原创?


——大多时候是这样的,搜索引擎蜘蛛智力相当于三岁小孩子一样,不能明确分别这些东西,因为它的思维太程式化了。如果你的标题改过,文章的段落改过,那么蜘蛛将很难确定这篇文章是否有过收录,也许它可以确定有部分内容是重复的,但它也不能因为这些而将这篇文章确认为是转载!当然,随着搜索引擎程式设计的提高,应该会有一个相似度的东西出来,比如文字内容相似度超过百分之几就会被认为是转载。
这样分析下来,相信大家应该了解了吧。只是核桃自己的看法,希望大家吸收自己想要的东西,不认同的了也来提下自己的意见!


    另外提几个建议:


1、如果你的站是新站,权重不高,如何让蜘蛛首页找到你的页面并放入数据库?其实很简单:用网摘、百度收藏这些工具让蜘蛛更快的找到你的页面!

2、大家都有过建议,就是加上自己的版权及内容页面的地址,别人采集的时候你就爽了,收录虽然不会快,但最后链接多了,你依然是原创内容。


3、发表文章等到自己收录以后再去其它的站点进行发表,同时加上自己的原文地址,这种办法很有保障!大站被采的机率很大

 

 

  假如你是一个新站,网站权重不是很高那你就要充分利用网摘、百度收藏等工具,让蜘蛛更快的爬到你的页面上来;假如别人用采集器添加你的网站链接或者文章来源的具体链接地址,这样做收录虽然不会快,但最后链接多了,你依然是原创内容。首先将自己的文章发表到自己的站然后将其发布到一些高权重的站点,这样你的文章被采的几率会很大的。

文章来源:http://www.xinxilong.com

作者:不详 来源:网络
相关评论
发表我的评论
  • 大名:
  • 内容:
  • 论坛群发大师(www.xinxilong.com) © 2008 版权所有 All Rights Resverved.
  • Email:4984672[at]qq.com 沪ICP备12025887号-1
  • Powered by 论坛群发大师