Matt Cutts SEO观点整理

Google搜索质量反垃圾组负责人Matt Cutts

Matt Cutts是Google公司资深的高级工程师。他在2000年加入Google,据他自己说他应该是最前100名的Google员工之一。Matt Cutts拥有数学和电脑的博士学位,毕业于北卡罗莱那大学。Google的家庭过滤器(也可以称为成人或色情过滤器,用来过滤掉色情网站内容)就是 Matt Cutts写的。

Matt Cutts虽然工作于技术部门,负责程序的编写,但是长时间以来,他也无形中承担了Google和站长之间的桥梁。在某种意义上来说,充当着技术方面发言 人的角色。这个角色并不是正式的或是官方任命的,而是长久以来因为他经常在著名的站长论坛上发表一些意见,经常代表Google参加在世界各地举办的搜索引擎研讨会等。

从2005年开始,Matt Cutts开始写他自己的博客。在Matt Cutts的博客上,他讨论的内容还是很广泛的,包括旅游,电视,音乐,甚至食物等。当然,由于他的特殊身份,最受人关注的内容还是搜索引擎优化和Google排名算法。

所有的搜索引擎都把他们的排名算法视为极度的商业秘密,外界根本不可能得到任何确定的排名算法的信息。在搜索引擎自己的网站上,你也很难找到明确的细节的关于排名算法的说明。Matt Cutts的个人博客就成了几乎唯一的半官方性质的信息来源。


从他的博客内容当中,我们可以得到以下几方面的好处:

1) 关于Google的排名算法及更新等情况的预告。大家都知道Google经常进行数据和算法更新,而在这些算法更新当中,网站排名会上下波动。如果你很清 楚的知道目前正在更新当中,就不必紧张了。Matt Cutts会在他的博客上面经常预告或者证实这些Google更新,比如Matt Cutts在2006年3月22号提到,不久我们将会看到PR更新。

2)从他的博客当中,我们可以确认某些搜索引擎排名技术。虽然这些技术往往是显而易见的,但是我们却没办法确认。比如说哪些技术被认为是恶意作弊技术,在Matt Cutts的博客里面,他举出了一些非常具体的确实的属于恶意试图操纵搜索结果的技术。

3)另外,我们也能经常从他的博客里看到他的一些暗示。虽然并不能100%的确信,但是经常可以从某一方面验证搜索引擎排名技术。

4)在他的博客里面,尤其是当Google正在更新的时候,他们需要站长的反馈意见来完善他们的算法。如果我们确实看到很严重的问题,也可以在他的博客里提出意见。更重要的是Matt Cutts确实看那些评论,而且会采取行动,比如通知相关部门等。

Matt Cutts的博客是非常重要的信息来源,但他的博客是英文的,因为语言的关系,很少看到中文的对这方面的介绍。我将会翻译他的重要的关于搜索引擎技术的博客,适当的时候加上我的一些看法和评论。


2008

关于付费链接。Matt Cutts说,最好为公司的长远利益着想,信任和名誉更有价值。


关于小工具诱饵

(Zac注:工具诱饵widget bait指的是设计一个小程序,就像博客侧栏经常出现的一些小工具,其他网站使用这个工具,会带上一个链接到工具提供者的网站。)

对Google来说,最重要的是看链接是否是隐藏的?是否是链接到内容不相关的网站?Google是使用算法来鉴别。另外,当人们把这种工具放在他们的网站上时,他们是否真的知道放上去的是什么?带有编辑性质的链接(指的是放链接的人清楚知道放的是什么,而不是把链接藏起来),长久效果更大。


关于搜索结果中出现其他网站的搜索结果

Matt Cutts说,通常搜索引擎并不能填写表格,但是有的时候为了找到其他网站,也会这么做。Danny Sullivan提到Mahalo网站(一个最近挺热门的,人工成分很大的搜索引擎。),Matt Cutts指出,这个网站上的结果实际上包含更多编辑内容,而不是搜索结果。


关于负60和负XX惩罚

Matt Cutts不愿意透露关于这些惩罚的更多细节,只是说他们会呈现更相关的结果。Matt Cutts也说,有的时候SEO们有点考虑得太多了。Danny Sullivan问,是不是有各种不同程度的惩罚?Matt Cutts回答,绝对有,但并没有深入解释。


Google怎样从自然链接中鉴别出付费链接?

他们尝试用算法来鉴别。有的时候买卖链接的方式是挺愚蠢的,留下很多踪迹Google能鉴别。有的时候他们也采取人工行动。

是否所有链接到特定域名的链接都会使这个网站的价值提高?

虽然Danny Sullivan换着方式问了几遍,Matt Cutts都不愿正面回答。


能不能通过放一些垃圾链接指向竞争对手网站,伤害他们的排名?

Matt Cutts说他们非常努力的使这不会发生。(Zac注:言外之意是还是有可能发生,虽然概率极低。)


通过NoFollow控制PR流动的看法

Matt Cutts还是认为与其把精力时间放在控制内部PR流动,还不如花时间在获得更多外部链接上。不过这种方式并不会引起Google的怀疑。


Matt Cutts说大部分情况发言是很自然的。Google有一个很有经验的PR部门,他们认为Matt Cutts等人与站长社区的交流,能帮助站长,同时帮助Google,就放手进行吧。

像Matt Cutts这样与站长社区的交流沟通,不仅帮助站长,也帮助Google提高搜索质量。比如像Webmaster Tools中要求重新收录的表格,以前在提交表格之前,站长必须承认错误,承认使用了不好的手段。但很多情况下,其实站长不一定有什么错误,有可能是别人陷害,或者Google算法本身的错误。这个表格强制站长首先承认错误,才能提交表格,使很多站长大有意见。Google听取了意见,取消了这个必选项。


Matt Cutts也经常参加这类搜索引擎大会,与新老朋友交谈,交流一下八卦,私下问问现在流行什么垃圾黑帽手法。很多人会让Matt Cutts看一下特定网站,通过看这些网站,也可以帮助Google算法的改进。Matt Cutts会留意这些网站,提醒相关部门的人看看,是网站有问题,还是Google算法有问题,是否需要在算法上做改进。

Matt Cutts在很多场合会出现,当网上有对Google的评论和批评时,经常看到Matt Cutts发表言论。Matt Cutts说,在他刚加入Google时,也犯了很多公共关系上的错误。但那时候没什么人注意Google,现在他已经比较有经验了。公共关系部门对Matt Cutts的言论也很开放,觉得Matt Cutts在处理与站长社群的沟通时没问题,不需担心。

Matt Cutts之所以会经常针对批评做出反应,是因为大部分Google员工都是信仰者,信仰帮助用户,帮助站长,使世界变得更好,使世界上的信息能够更容易的被找到。所以有时候看到对Google的批评,Matt Cutts会觉得虽然Google不可能是完美的,但是他们在尽力做,所以Matt Cutts觉得有责任做出反应。

其实不仅Matt Cutts,很多Google员工都在注意倾听和收集对Google的评论。Google员工也会搜索博客评论,也会上Google groups,看网上对Google有什么评价和批评。

Matt Cutts尤其提到Google groups里面的意见,Google都能看到。虽然不一定回复,但站长可以放心,这些意见都已经传达到了。


Matt Cutts的spam team,是搜索质量部门下面的分部门。

关于算法和人工。如果在2000或2001年,问Google员工关于垃圾和算法的问题,所有Google员工都会回答,靠算法解决。但是现在Google也开始认识到,有时候个人对搜索质量也有很大的影响。Google尝试使用人的因素,以某种可扩展的方式起作用。

他举了个例子,就是垃圾举报表格。Google从这些垃圾举报中学到了很多。当看到大量某类相同的举报时,Google就会深入研究,看能不能以算法解决这类问题。

想加入Google Matt Cutts的spam team要什么条件?Matt Cutts没说什么特殊的,无非是执行力,聪明,团队协作精神,沟通能力。如果是电脑专业或数学专业最好,但是也不一定强求,最重要的是能快速学习。


因为Matt Cutts俨然是Google发言人,很多人一有问题自然就先想起Matt Cutts。2007年Matt Cutts也尝试把这个担子分散到更多Google员工身上。很多其他员工在不同场合已经积极和站长沟通,做的也都很好。但是很多人还经常会提到Matt Cutts说什么什么,Matt Cutts会觉得什么手法不好。这已经养成习惯,不容易改了。


三个已经不管用的作弊手法。Matt Cutts特意提到了三个Google已经可以很准确判断的作弊手法:隐藏文字,关键词堆积和JS转向。这已经是很过时的黑帽手法,不要尝试了。


在大爸爸数据中心更新结束后,很多站长发现被收录的网页数急剧下降。有时候能从几万页降到几页,而且补充材料网页越来越多。很多人一直在问,为什么Matt Cutts对这个问题一直不做评论?今天Matt Cutts发了一个很长的帖子,一次性回答大爸爸更新之后的一些问题。帖子很长,下面拣要点翻译一下。

首先Matt Cutts给那些不想读这么长帖子的人两点小结。第一,Google的爬行和索引部门有足够的机器。收录网页数下降并不是因为Google没地方存了。第二,Google继续认真听取站长们的反馈。

 

大爸爸和补充材料结果无关。所以当大爸爸不收录一个网站的网页的时候,补充引擎就可能收录更多的网页。

我和爬行/索引部门一起调节了算法的门槛,以收录更多这种网站。

3月29号,大爸爸更新完全完成,旧系统关闭,从那之后所有的爬行都是由大爸爸控制的。

考虑到程序编码更新的数量,我觉得大爸爸更新是很成功的,只有两个投诉。第一个就是前面提到的,信任度比较低的网站的网页被爬行和收录的比较少,我们对此作出了反应,很快开始收录更多的网页。另一个投诉是Google Adsense爬行的网页开始出现在搜索结果中,实际上这是爬行缓存代理的设计。

总体上来说,我检查的几个网站在这几天都有了更多的被收录的网页。做很多交换链接的网站,可能发现爬行次数少了。如果你的导入链接太少,被爬行的也会比较少。


我的评论:看来大爸爸完成之后,Google确实减少了对很多网站的爬行和收录。原因主要在于链接的质量。做大量交换链接,买卖链接,链接向垃圾网站,链接向无关网站,受影响会比较大。Google发现受影响的网站太多之后,也做了调整。

但是就我目前所看,被收录的网页数非常不稳定。不同数据中心之间的数据很可能还不同步,而且哪些网站会被当作补充材料的选择算法,还有很大问题。


大家都注意到前两天Toolbar(工具条)PR已经更新了。Matt Cutts发了一个帖子,回答一些关于PR和PR更新的问题。

问:我很好奇PR值在内部是怎样存储的?是小数,就像人们猜测的,还是整数?

答:把它想为小数更准确。当然目前我们内部的PR计算比toolbar显示的0-10要长的多。

问:我需要知道这个吗?我知道PR能告诉我什么,我为什么要在乎?也就是说对普通网站来说,PR有什么目的?

答:我想这是一个很健康的态度。如果你不在乎PR,并且你的网站运行的很好,这很好啊

问:那些使用老一点的基础架构的数据中心也会更新,还是我的PR在下面几个月都是不一样的?

答:后者。我认为大部分数据中心都使用新的基础架构,比如对info: related: link:等指令和PR,我相信使用新的基础架构的所有数据中心,都已经输出新的最近的PR值。其他老一点的数据中心,可能会花一两个月的时间,以某种方式转成新的基础架构。

问:很多人问PR是不是从日期X到日期Y?而且反向链接是日期Z的?

答:我不会担心这个。实际上我自己也不很肯定。在某一个时间点上我们把内部PR值简化为0-10的范围,然后输出使大家能在toolbar上看到。如果你为反向链接是哪一天的而烦恼,那么你可能是得了反向链接迷症。你应该停下来做点其他的事情,直到你的反向链接迷症好转。我建议关键词分析研究日志文件,找出应该增加哪些内容,想更多的链接诱饵,使你的网站更有吸引力,研究怎样提高转化率等等。

问:Google只能输出几个月之前的PR值,是非常麻烦的。

答:我以前说过PR是连续不停计算的,我们有机器把输入传给PR算法,计算出PR结果。所以在任何一个时间点,一个URL在Google的系统里有最新的PR值,我们时不时的把内部PR值输出到toolbar上,让大家看到。

问:我好奇你为什么不嫌麻烦告诉我们新的PR更新?这是你第一次这么做吗?

答:问的好。我不是很肯定我是不是被作为PR输出的官方发言人。在Google这不是一件大事。老实说我都不知道这次的PR更新,我在网上看见其他人在谈论,然后去查了一下看是不是真的。在过去几个月里,人们也注意到有时候Google的工程师选一个不太常用的数据中心,做一些实验,比如说反向链接和info:查询。所以我觉得我应该跟大家说一下,这是一次真的PR输出,不是某一个工程师在做实验而已。

问:PR更新会影响搜索结果吗?我们接下来会不会看到搜索结果变化?

答:好问题。在你看到toolbar中的新PR的时候,这些数值已经被考虑在排名算法当中了。所以你可能看着新的PR值很高兴,但是它并不是导致排名结果变化的原因。所以你不会看到因为PR更新导致排名结果的变化,这些排名结果的变化,已经从上一次PR更新就开始计算了。


Matt Cutts前几天又发了一个新帖子,谈Google总体搜索质量和新的基础架构。要点如下。

下面每一点谈的都是不同的基础架构。

大爸爸是Google处理网页爬行(crawl)和一部分网页索引(index)的软件更新,基本上是在今年初期进行和完成的。它使Google蜘蛛的爬行更为智能,包括使用gzip支持和爬行缓存代理,使带宽的使用量下降。

我们用了一个夏天来完成处理补充材料的新的基础架构转换,这个基础架构的核心已经完成了,但是我相信还会看到一些小的改变(比如说使site:指令更准确的反映人们预期要看到的)。

我相信现在在所有Google IP地址,如果你使用site:指令的话,返回的结果数目更加准确了。在夏季中期的时候,有的人注意到site:指令返回的结果数目过高,在夏天中期的时候做了一个改变,使总体搜索结果数目的估计更加准确,尤其是对短的搜索词来说,但是这个改变没有应用在site:指令上。

有另外一个基础架构的改变使总体搜索质量得到提高,同时使site:指令结果数目更加准确。我记得我在以前的视频里面提到过,这个变化应该在夏天结束之前完成,只是个希望,不是承诺。我相信这个基础架构上星期五,2006年10月6号在所有数据中心已经开通,日期也差不多。这个基础架构带来的质量提高将会比较稳定,site:指令返回的结果数目现在也比较准确了。

我们刚刚做了一次PR输出,所以我估计直到新的一年,不会再有新的PR输出了。在工具条中返回PR,link:,info:和类似网页的指令的基础架构也都是新的。我相信这是我以前提到的基础架构中,还没有在所有数据中心完成的唯一一个。这个基础架构范围还比较小,这个新的基础架构在大约2/3的数据中心已经完成,我估计在接下来的一两个月会在其他数据中心完成(同样是希望,不是承诺)。这段时间在访问不同数据中心的时候,你还有可能在工具条中看到不同的PR。

我知道站长们对第四个季度的搜索质量,垃圾站和排名改变都很敏感,因为假期就要临近了。如果我们评估一个改变能够提高质量的话,我们不可能等3个月的时间。但是如果有什么大的事情,我会尽量回答问题,帮助人们知道了解这个改变。我不预期会有排名方面大的改变,但是最好别承诺什么。


站长世界组织的Pubcon上星期在拉斯维加斯召开。Matt Cutts与Brett Tabke做了一个对谈,下面简单翻译一下主要内容。

问:在做链接的时候,应该避免链接向坏邻居。那么怎样鉴别坏邻居呢?
Matt Cutts答:用你的直觉。交换链接是很正常的一件事,但是交换链接太多了,也就太人工了。我的建议是跟随你的直觉,如果你担心对方是个坏邻居,你就用nofollow。


问:Google最近买了g.cn这个域名,能具体解释一下吗?
Matt Cutts答:如果你在中国,而且讲中文,你就知道记住Google这个词,都是很困难的,所以g.cn这个域名就是为了好记。


问:继续中国的一些问题以及反向链接。我看到他们买了很多链接,你们有没有想过,深入调查一下这些国家或者公司?
Matt Cutts答:这是个好问题。有很多垃圾不是中文的,是英文的,但用的是.cn的域名。你查一下反向链接会发现,全都是来自日本的,这种现象的确非常可疑。有的垃圾制造者有来自各种各样域名的链接,我们正在研究这个问题。


问:Google在停放的域名上赚了很多钱,这些域名有很多都是错拼的域名。这些拼错字母的域名,有的时候不一定是合法的,Google的立场是什么?
Matt:这不是我的专长,所以我只能表达自己的意见。以前如果你直接在地址栏里拼错域名,你很有可能就来到了一个有恶意内容的网站。从某种程度上说,Google使与域名有关的广告合法化。当然我们总是能做得更好。我的个人看法是有更多广告渠道是好事。


问:如果我有一个VPS服务器,我有一个邻居在同样的class c IP(指前面数字相同,靠得近的IP地址段)上做一些灰帽黑帽的东西,这会不会影响整段IP地址?
Matt:黑帽很聪明。当他们的域名被惩罚的时候,就放弃这个IP地址,然后一个无辜的人就可能使用这个IP。这不会伤害你,这些数据都很快过时,所以我们并不看重这些。唯一需要考虑的是,如果有很多同一个subnet的IP地址,都在做着灰帽黑帽的东西,那我们可能要采取行动。


问:如果我有一个网站,有很多文件需要做转向,那么在一个链条上,最多可以做多少个301转向。
Matt:据我所知,没有什么限制。你可以做一个301转向,两个礼拜以后拿掉,不会有什么影响。我不会建议把301转向做成嵌套(意思是一个301接着一个301转来转去)。不要让Google蜘蛛太累了,太复杂就容易出错。如果可以的话,做一个301直接转到最终点的那个URL。


问:怎么区分付费链接和广告呢?
Matt:就看是不是传递PR。我们希望有一个干净的索引库和准确的搜索结果,我们不想让这些东西影响Google的收入。为Adsense而建的网站,对用户并不是好事。


问:在更换服务器IP地址的时候,有没有一个要保持旧服务器运行的最短时间?
Matt:首先降低DNS TTL到,比如说5分钟,在新服务器新IP上开通网站,把域名指向新服务器,旧服务器上的网站继续开通着。一旦你看到Google蜘蛛来爬新IP地址就可以了,通常这只需要一到两天。


问:你怎么看待那些收费审查网站的目录,值得提交吗?Google会不会有一天,也阻止这些网站目录传递权重?
Matt:检查一下这些目录,看看目录背后是什么人?背景怎么样?如果你查不出来是谁的目录,并且目录里面有坏邻居的网站,就别登录。如果付费的全都能被收录,这种目录就没有什么质量,不值得登录。


《SEO实战密码》序

— Matt Cutts, Google反垃圾组负责人

早在2007年我愉快地与Zac做过一次关于搜索引擎优化(SEO)的访谈。Zac不仅问了很好的问题,他也在这些年来为无数人提供了有益、扎实的建议。所以当Zac请我为他的SEO书写序时,我很高兴地说Yes。

我认为学习SEO对任何从事网上工作的人都是好事。不仅设计师和程序员,CEO和普通用户如果更多了解搜索引擎怎样排名、为什么有的网页比其它的排名更高,都能受益良多。

SEO能以很合理的方式进行,既照顾到用户需求,又创造出有用的、符合搜索引擎质量指南的网站。SEO是个强有力的工具,既帮助网站排名提高,也使网站容易使用。

有的人认为SEO只意味着发垃圾和欺骗性的手段,这是不正确的。SEO可以包括为用户设计一个清晰易用的网站,电脑也可以通过跟踪链接发现新的页面。关注SEO可以发现用户寻找产品或网页时输入的关键词,然后你可以在页面上自然融入这些词。学习SEO使你了解人们需要高质量的信息,并且喜欢有用的服务和资源。学SEO的人也能学习到提高认知度并且为网页带来更多链接的各种网站推广方法。

事实表明,中文网络与英文或德文网络不同。不同国家的网站有不同链接结构,更不要说不同的流行关键词。不同国家也有不同的独立域名和出现在论坛或电子公告板的内容组合。因此,有一本专门为中国市场写的SEO书是很有帮助的。很高兴Zac写了这样一本书。


全世界SEO人都热爱的Matt Cutts刚刚发了博客帖子,宣布已于2016年12月31号正式从Google辞职。在这之前,他已经休假长达2年半了。

Matt Cutts是Google最资深的工程师之一,据说工号在100以内。他长期担任Google搜索部门反垃圾组的负责人,在某种意义上说,与SEO们是对手。

对SEO行业影响更大的是,他也是SEO们的朋友。很早以前,记不得是哪年了,Matt Cutts开始在webmasterworld.com以GoogleGuy这个账号回答SEO和站长们关于Google和SEO的问题。也许是因为Google内部政策的关系,一直没有人正式确认GoogleGuy这个账号是Matt Cutts。但大家都知道GoogleGuy就是Matt Cutts,至少是以他为主的。就像百度Lee当初是以王淘为主。

2005年,Matt Cutts开了自己的博客:https://www.mattcutts.com/blog/ ,经常发帖回答SEO问题、发布Google算法最新消息。前些年,Matt Cutts也频繁参加SES、SMX、 Pubcon等SEO相关大会

可以说,Matt Cutts是Google面对站长和SEO界的发言人。我们今天知道的很多SEO知识都来自于Matt Cutts。没有他,我们可能还要在黑暗中探索更久。

2007年,我有幸与Matt Cutts及中日韩文字负责人朱建飞做过一次关于中国搜索和SEO的访谈,全文翻译在这里。这应该是至今为止,中国SEO行业唯一一次与Google工程师的对谈。鉴于目前大家都懂的形势,下一次不知远在什么时候。

三四年前,Matt Cutts和Google大概都有意让Matt Cutts作为SEO代言人的角色淡化,把和SEO界沟通的任务分散到更多人身上,所以他渐渐减少了参加大会和发帖。2014年7月,Matt Cutts开始休假,虽然偶尔还发些关于SEO和Google的帖子,但基本上大家都预感到,他大概不会再回到Google了,不然哪有休这么长假的。

Matt Cutts的帖子透露,几个月前,他开始参与“美国数字服务”机构(US Digital Service)的项目,本来预期参加3个月,后来延长到6个月。现在则正式加入了US Digital Service,担任工程总裁,并且将在现在的总管理人下台后(现任管理人是政治任命,川普上任后需要总辞?好像是这个意思)担任执行管理人。

US Digital Service负责美国医保等政府网站的数据服务,貌似偏向网络安全方面。

以后不能常常听到Matt Cutts给我们SEO建议了。感谢这些年来Matt Cutts对SEO行业的热情参与和巨大贡献。

, , ,
我们将在15分钟内联系你

免费提供行业网站方案以及海外推广计划