今天晚上研读了百度站长平台lee发布的”谈谈原创项目那点事”,感触很大,让我看到了百度对原创文章的坚定立场(如何写原创文章?),无论面临多大的困难,百度都坚定的走下去,目的是更好的推动中文搜索引擎的良性,健康的发展,同时也是为了提高用户体验,鼓励那些原创作者和原创的站点,提高他们的流量和网站排名,让他们获得该有的收益,这是我对这次原创算法的总结,下面将详细的说说其中的细节问题,值得我们个人站长朋友们好好的学习和分享。
1、搜索引擎重视原创文章的原因是什么
(1)主要是采集内容都快泛滥成灾了,无论是手工的还是用机器采集的,都加大了搜索引擎对原创识别的难度和艰辛。
(2)严重影响了用户体验,海量的采集内容,让用户分不清哪些是真正的原创内容,而且最重要的采集的内容不全面,经常内容没有下文,或者一句话没有说完整,有的是面目全非,段于段落不协调等因素。
(3)在打击采集内容的同时,也要重点的鼓励原创文章,鼓励原创的作者和站点,让他们的流量提高,排名上升,可以让他们获得更多的利益收录,利用这种方式鼓励站长朋友们作出原创文章。
2、识别原创的难度
(1)由于成千上万的网站架构不同,导致搜索引擎在提前他们的一些总要信息(比如,标题,作者,发布时间,用户评论等因素)的时候,比较困难,
(2)让我们更好的认识什么是原创和伪原创这2个概念
原创:要有社会共识价值的,而不是乱编,甚至语句不通的文章。
伪原创:利用自动文章生成器出来的文章,然后随便加一个可以吸引眼球的标题,这样的做法。
3、识别原创的思路
是将采集和原创,内容相似的文章聚合在一起,通过一些因素比如:标题,发布时间,作者等信息来辨别哪一个是原创文章。
4、百度识别原创的艰辛路程和态度
这次算法,看起来百度是下了很大的决心来识别原创,成立了原创识别小组,让更多的人参与这个小组,还做好了打持久战的准备,看来这个路程还是蛮艰辛和长久的,但是百度很坚定,为了推动中文搜索引擎的前进,必须有一个健康,良性发展的互联网搜索引擎,更是为了提高用户体验。
以上只是我个人的一点看法和感悟有不适全面之处请多多的指点。