百度搜索引擎网页质量白皮书 全文

SEO研究
,
浏览次数 149

刚刚大致看了一遍,记住几个挺有意思的地方:

1)关于网页内容质量,百度的一句话说的挺好,内容制作成本越高,质量越高。(所以,能制作视频的去做视频吧)

2)除了内容质量,排版布局、广告数量之类的也很重要。白皮书里说文章页面最好图文并茂。这方面,我的博客很差啊,基本上没图。

3)转载,甚至采集的内容,对百度来说,内容质量算是中等。真正算是差的页面是无效页面,如下架产品等。这个,姑且先这么认为吧。

4)对质量好与坏,白皮书里都举了一些具体例子,这些例子必看,更直观。

还得再多看几遍。

目录

1 引言 ……………………………………………………………………………………………………………………….. 2

2 衡量网页质量的维度 ……………………………………………………………………………………………… 3

2.1 衡量网页质量的维度——内容质量 ……………………………………………………………….. 3

2.2 衡量网页质量的维度——浏览体验 ……………………………………………………………….. 9

2.3 衡量网页质量的维度——可访问性 ……………………………………………………………… 12

3 互联网网页资源现状 ……………………………………………………………………………………………. 15

4 百度搜索引擎给站长的建议 ………………………………………………………………………………… 18
1 引言
网页质量是一个网页满足用户需求能力的衡量,是搜索引擎确定结果排序的重要依据。在网页资源内容与用户需求有相关性的基础上,内容是否完整、页面是否美观、对用户是否友好、来源是否权威专业等因素,共同决定着网页质量的高低。
对于搜索引擎来说,给用户呈现的网页质量直接影响了最终的搜索效果和用户的需求满足;而对于广大的站长来说,整体网页质量的提高有助于在搜索引擎中获得良好的排序和展现,从而吸引更多用户,获得更多流量。 百度搜索综合用户对不同网页的实际感受,制定了一套评判网页质量的标准,基于这个标准,在百度搜索的收录、排序、展现环境进行调整,给高质量的网页更多的收录、展现机会,同时对一些影响用户体验、欺骗搜索引擎的恶劣低质网页进行打压。
目前互联网上的网页,仅有7%可以达到高质量标准,百度作为最大的中文搜索引擎,希望从互联网生态角度出发,跟站长们一起努力建立良好的互联网生态圈,更好地为网民服务,也让内容优质的网站得到更好的发展。
此外,搜索引擎之前相对封闭,一直以来,站长需要通过不断的摸索发现搜索引擎对网页的判断标准,指导站点内容的建设。此次推出《网页质量白皮书》,目的是开放百度在网页质量方面的判断标准,给站长提供参考,希望有更多、更优质的内容产生,满足搜索引擎用户的需求,同时为站长带来流量,实现共赢。

2 衡量网页质量的维度
百度搜索引擎在衡量网页质量时,会从以下三个维度综合考虑给出一个质量打分。下面会一一介绍这些影响网页质量判断的维度特征: 
内容质量 
浏览体验 
可访问性
一个访问流畅,内容质量高且浏览体验好的网页具有较高的质量;反之,任何一个维度出现问题,都会影响网页的整体质量。
下面我们具体介绍下这三个维度
内容质量
网页浏览体验

可访问性

一、衡量网页质量的维度——内容质量
网页主体内容是网页的价值所在,百度主要从以下角度评价网页内容质量:内容制作成本高低;内容是否有效、完整丰富;是否原创;信息是否真实有效;是否权威或投入较多专业的知识和经验;是否存在作弊行为。

①、内容质量高: 内容质量好的网页,花费了较多时间和精力编辑,倾注了大量经验和专业知识,内容清晰、有效、完整且丰富。 例如:专业医疗网站发布的内容丰富的医疗专题页面;、资深工程师发布的完整解决某个技术问题的专业文章、专业B2C网站上,完整有效的商品购买页、权威新闻站原创或经过编辑整理的热点新闻报道、经过网友认真编辑,内容丰富的百科词条。

②、内容满意度中: 能满足用户需求,但未花费较多时间和精力编辑,不能体现出经验和专业知识的完整网页。例如:贴吧里一个普通的帖子、一个普通的百度知道问答结果、 没有进行任何编辑,直接转载其它网站的新闻。

③、主体内容信息量较少或已失效: 主体内容信息量较少,或无任何有效信息,只能起参考作用。例如:论坛中,缺少有价值信息的“水帖”、商品团购等已下架或无货、招聘交易类信息过期;、页面上有明显的过期标记。

④、无有效内容,完全不能满足用户需求: 未经认真编辑整理、粗制滥造或从别处采集的内容。主要表现是:主体内容空洞或不能支撑页面主题,不能满足用户主要需求。例如:问答页,有问无答,或回答完全不能解决问题、内容空短,不能支撑页面的主要意图、站内搜索结果页,但没有给出相关信息、各类作弊网页。

二、衡量网页质量的维度——浏览体验
用户希望看到干净、且易阅读的内容,排版混乱、广告过多会影响用户的阅读体验,影响用户阅读体验的网页,会被降低展现的机率。浏览体验的好坏主要受内容排版、广告这两个因素的影响。

①、浏览体验好:排版合理,浏览顺畅,广告不影响阅读;主要内容突出、明确。 一般具有以下特征:排版合理,版式美观,易于阅读和浏览;用户需要的内容占据网页最重要位置;能够通过页面标签或页面布局十分清楚地区分出哪些是广告;广告不抢占主体内容位置,不妨碍用户对主要信息内容的获取。

②、浏览体验差:页面布局和广告影响了主体内容的获取包括但不仅限于以下情况:

(1)排版布局差: 正文内容不换行或不分段,阅读困难; 字体和背景颜色相近,内容辨别困难; 页面布局不合理,页面首屏看不到任何有价值的主体内容。

(2)广告影响阅读体验: 弹窗广告; 广告与内容混淆,不容易区分; 广告遮挡主体内容;或者在通用分辨率下,首屏都是广告,看不到主体内容; 影响阅读的浮动广告过多。

三、衡量网页质量的维度——可访问性
用户希望快速地获取到需要的信息,我们尽可能为用户提供能一次性直接获取所有信息的内容。 不能直接获取到主体内容的网页,会被降低展现的机率。百度会从资源有效性、主体资源可浏览性等方面判断网页的可访问性。

①、可正常访问的网页:无权限限制,能直接访问所有主体内容的网页。

②、死链&主体资源失效:死链无法提供任何有价值的内容,我们希望网站中的死链,都第一时间通知搜索引擎。比如:

404、403、503等页面;

百度是如何衡量网页质量?

程序代码报错页面;
开后提示内容被删除,或因内容已不存在跳转到首页;

资源下载页上的下载链接不存在或资源失效;

视频播放页视频无效或不存在,无法播放。

③、网页信息主体部分需要权限或需要安装冷门插件:网页主体内容需要权限,提高用户获取信息的成本,百度会降低对其的评价。比如:

论坛附件下载需要权限;

文档全文查看需要权限;

需要安装冷门插件才能正常访问。

不管是百度搜索研发部在谈互联网页面价值的时候就指出的受众群大小、页面稀缺度、页面质量、页面时效性四个要素,还是百度网页搜素质量白皮书给出的内容质量、网页浏览体验、可访问性三个维度。

百度都是从搜索用户的角度出发,要挖掘全方位满足绝大部分用户需求的网页,所有可能会对用户产生价值的页面都是对搜索引擎有价值的,搜索引擎会衡量这些页面的质量,并将这些页面建立索引排序给需求用户。

所以网站的网页需要从各个角度去提高其用户体验的价值,某个价值大放异彩不一定就能在页面排序大战中脱颖而出。

,
我们将在15分钟内联系你

免费提供行业网站方案以及海外推广计划

菜单