为什么你每天坚持原创 百度还是不收录你的文章?

发布时间:2017年08月14日 来源:

这个问题其实想要去了解需要了解下百度搜索引擎的工作流程

第一步:爬行

搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链接,像蜘蛛在蜘蛛网上爬行一样,所以被称为“蜘蛛”也被称为“机器人”。搜索引擎蜘蛛的爬行是被输入了一定的规则的,它需要遵从一些命令或文件的内容。

第二步:抓取存储

搜索引擎是通过蜘蛛跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库。其中的页面数据与用户浏览器得到的HTML是完全一样的。搜索引擎蜘蛛在抓取页面时,也做一定的重复内容检测,一旦遇到权重很低的网站上有大量抄袭、采集或者复制的内容,很可能就不再爬行。

第三步:预处理

搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理。

⒈提取文字

⒉中文分词

⒊去停止词

⒋消除噪音(搜索引擎需要识别并消除这些噪声,比如版权声明文字、导航条、广告等……)

5.正向索引

6.倒排索引

7.链接关系计算

8.特殊文件处理

除了HTML 文件外,搜索引擎通常还能抓取和索引以文字为基础的多种文件类型,如 PDF、Word、WPS、XLS、PPT、TXT 文件等。我们在搜索结果中也经常会看到这些文件类型。 但搜索引擎还不能处理图片、视频、Flash 这类非文字内容,也不能执行脚本和程序。

第四步:排名

用户在搜索框输入关键词后,排名程序调用索引库数据,计算排名显示给用户,排名过程与用户直接互动的。但是,由于搜索引擎的数据量庞大,虽然能达到每日都有小的更新,但是一般情况搜索引擎的排名规则都是根据日、周、月阶段性不同幅度的更新。

选择

与网站内容相关

搜索次数多,竞争小

主关键词,不可太宽泛

主关键词,不太特殊

商业价值

提取文字

中文分词

去停止词

消除噪声

去重

正向索引

倒排索引

链接关系计算

特殊文件处理

所以说,你的网站经常更新和能收录其实不是正比的关系,但是你的网站内容是稀缺资源和搜索是正比的关系,我有一篇文章写的是这个,你看下。

“内容价值!”——是的,你的内容对百度、用户的价值,是影响收录和排名的决定性因素!那什么样子的内容是有价值的呢?简单的说就是对用户有用的东西,用户会去搜索的东西,那么百度就能快速的收录,也能快速的给予排名。如果说百度不展示用户感兴趣的东西,那么大家就会去用360,搜搜这样的搜索引擎,度娘当然不会那么做。所以说如何做一个讨度娘欢心的网站,要做的就不单单是原创!原创!原创!你原创的在给力,不是度娘与用户喜欢的类型,那么不好意思,你的网站永远不会放出!那应该如何去做呢?

 

 

一张图鉴是否看到了所有的激情内容呢?

二、 做站前的准备

“战略上藐视敌人,战术上重视敌人”毛爷爷的经典语录,同样我们要在战略上藐视算法的更新,战术上要重视算法。所以说从一开始我们就要有一个详细的计划,逐步的拿下度娘!那么我就说一下我这么多年来是如何”泡度娘“的吧!

第一步:做一个什么样子的网站?和使用的小工具。

这是一个非常艰难的决定,因为你总会觉得自己的内容度娘绝对会喜欢,也会有大量的粉丝,只要您的网站一上线!网站流量就像流水一般的来临了,但是你做的内容真的能吸引用户、吸引百度吗?什么样子的内容才是百度与用户喜欢的内容呢?其实利用几个简单的小技巧就能判断出来的!

1、利用百度下拉框,如果没有下拉窗,说明此关键词实在是太好做了,只要你补充完首页的内容基本就上去了。

2、如果有下拉框,在看相关搜索,比如说你查看了一个下拉窗里面包含的怎么样?比如:一个产品贵不贵的话,那样你就要在你的网站页面做上客户需要的产品,比如说介绍价格,介绍我们的优势,那样我们要做一个FAQ常见问题解答,需要解决的是解决价格的问题。

3、查看网站排在前面的网站有无吸引点;

4、利用百度统计工具查看流量的关键词来源;

5、利用百度推广助手工具查看关键词。

第二步:域名、空间、程序的选择

域名:对于域名来说,我建议使用与内容相关的域名,简单的说:如果我做的网站是百度站长社区,那么我的域名的网址中最少要包含:zhanzhang这样的词组,不单单是为了收录,更多的确实为了用户的记忆。

PS:当然也有人说域名备案后,收录会好一些,我个人对这个看法有一定的赞成。

空间:对于空间的选择比较简单一些,但是还是要提醒大家,尽量的选择大的空间商,如万网,新网等,有很多的网站为了限制流量和赚钱甚至屏蔽了百度蜘蛛,慎重!

PS:我实在是要吐槽一下,不要被便宜所吸引,还有服务器上的安全狗,有时候会进行误杀,慎重!

程序:如果说评选什么程序是最会被攻击的程序的话,我个人认为织梦系统完全可以自己一个人拿100分,没有错!织梦程序绝对是被黑中的战斗机,你不会认为网站每天都被黑,还能给一个好的收录和排名吧?所以说程序的选择也是相当重要的,而且现在百度站长工具对DZ系统和WordPress推出的结构化数据插件还是很给力的,不妨试下。

PS:网站空间的稳定性是决定着网站是否能真正的成为一个“网站”的基本要求!

第三步:内容的准备!

灰常重要的一步,我还是一开始那样的看法,请不要把原创当成百度必须收录的你标准,不是说我原创了,百度一定就收录了,那么你胡乱的打一些代码上去就可以了,这绝对是原创,但是百度会收录吗?显然是不能的!所以你要创造有价值的内容才是关键。

PS:我建议做网站之前,最好有100篇的文章已经预备好了,这个预备会让你的内容不至于在急促的情况下更新不了!

第四步:外链建设

说到这里,你是不是就会问了,我网站都没建设好,我怎么发布外链呢?其实很简单,在你网站预上线的2周内进行外链的发布,就足以让你的网站快速的被收录,注意这不是在作弊,这只是提前把内容推荐给百度而已,当然前提是你要有内容!

三、 建设中的设置

如果说建设前的设置是代表出身的话,那么建设中的设置就代表着你的长相了,为了成为网站内部的“高富帅”你还要做好以下几点!

第一步:常用设置:

简单的设置往往能起到很显著的作用,比如你的网站地图,会让蜘蛛抓取你的网站更加的频繁,那么都有什么基本设置呢?

301重定向:想集中权重?想让用户看到你新网站的内容,那么你去做301吧,你只要有了301,妈妈再也不用担心我的网站会让不带www比带www的排名好了!

404页面:告诉浏览者其所请求的页面不存在或链接错误,同时引导用户使用网站其他页面而不是关闭窗口离开。当然最重要的是告诉搜索引擎,我这里还是有内容的,爷!可以去首页看一下吗!

 

 

这种面包屑导航是最不常见到的。这种面包屑导航和上文所说的童话故事类型很像。他们可以显示访客在到达页面前所访问过的网页的链接。这种面包屑导航不是很受欢迎,因为他们的功能基本上是和前进和后退的按钮是一样的。

面包屑导航适合的网站:

并不是说所有的网站都适合面包屑导航,那什么样子的网站适合面包屑导航呢?

(1)层次较浅的网站,一般的像大网站就不适合这个导航,比如说豆瓣网。

(2)独立不交叉的网站结构,由于面包屑网站导航路径是线性结构的,因此网站内容必须划分的非常清晰,且不存在交叉;否则,面包屑导航的路径就不是唯一的,同一分类可能出现在不同的路径中,让用户感到困惑。

URL问题:

(1)URL的长度百度给的建议是“url的最长长度不超过255byte”;

(2)URL样式:分为动态路径和静态路径,建议还是静态路径;

(3)url要使用绝对路径:可以有效的防止网站被人家把恶意镜像。还有一重要的作用就是,网络中如果有人引用了你的网站内容,你会获得来自外界的导入链接

(4)301一定要做,把权重集合一下。

(5)URL一定要容易记住和栏目相关:好记大家都知道,相关的域名是这样的设置,比如说新闻栏目,应该这样写:xxx/xinwen.html,可以把关键词加上去

(6)404页面等常用的页面要做

(7)静态页面使用动态参数:需要设置:

第二步:网站的细节设置

在这个细节决定成败的时代里,我们每做好一步细节都能是网站的收录与排名上升一个档次,这里只举一个例子!

图片ALT属性:图片一定要添加ALT属性,大到幻灯图,小到一个图标都要添加,描述方法:“例如我有一只黑色的小猫在玩球”(谷歌搜索引擎指南举得例子)。但是不能堆积关键词。

为什么你每天坚持原创 百度还是不收录你的文章?

扫一扫手机访问

发表评论