百度惊雷算法漏洞初试

当然我不去用自己的主网站以身试法。惊雷算法是惩罚刷点击的。

导读:用户点击和分享某个关键词所在页面会对该页面关键词排名产生影响,这个大家都有所耳闻,也都相信百度统计和百度分享这些东东会对网站排名带来一定的好处,但是有多少同学从技术层面进行过深入研究?有多少同学研究过搜索结果页面的参数?恐怕少之又少吧。有幸在seowhy论坛看到有位同学分享这方面的一些文章,斗胆摘录过来,分享给大家。

首先百度搜索结果的每个链接上都添加了onmousedown,看来也是用来进行统计的。有大神解释说onmousedown属于HTML DOM语法,意思是:事件会在鼠标按键被按下时发生执行。常用于JS事件中。

首先:现在是2018年一月,百度搜索外贸建站,imaiko出现在第一位。但是点击链接,百度并不是直接进入imaiko.com,而是这个网址:https://www.baidu.com/link?url=LOIZywhTy7Pa5Vw-hmZ4VCaQboW36NkKBj7twc6NaQS&wd=&eqid=d8ef17e40000dff6000000025a5749ef

 

我们现在把页面上的其他地址拿来比较。

https://www.baidu.com/link?

url=LOIZywhTy7Pa5Vw-hmZ4VCaQboW36NkKBj7twc6NaQS

&wd=&eqid=d8ef17e40000dff6000000025a5749ef

http://www.baidu.com/link?

url=yXB4xebiDpDclX2sfiIzLggCwBKa4qu-9zEfg2gMdsjJS-gYUYDNUdiMgnIZo33w

http://www.baidu.com/link?url=NRn5tTULkwbRWd6nGNDuGunlZlH3TpKLJhJmHCRWZ97VDfn3kO4XCDMw5tpUhtjA

这一串URL代表的是地址。

然后将链接贴入到地址栏,看下跳转的代码。

其中的cookie可以研究下。
Cookie:

  • BAIDUID=D428537E0E8BA3282788A9EEBE29AA98:FG=1;
  • BIDUPSID=D428537E0E8BA3282788A9EEBE29AA98;
  • PSTM=1504099398;
  • ispeed_lsm=2;
  • sug=3;
  • sugstore=0;
  • ORIGIN=0;
  • bdime=0;
  • SFSSID=u9322nlliqf7l763tdm485g391;
  • FP_UID=79f03b4ac35539ba8a6413b7c720256d;
  • SIGNIN_UC=70a2711cf1d3d9b1a82d2f87d633bd8a02656827966;
  • uc_login_unique=96fbd903c943635cb494382c241dbec5;
  • uc_recom_mark=cmVjb21tYXJrXzI0ODI3MTY4;
  • BD_HOME=0;
  • BD_CK_SAM=1;
  • PSINO=2;
  • H_PS_PSSID=25638_25313_1443_24565_21124_17001_20719;
  • BD_UPN=12314353;
  • H_PS_645EC=9ac4K%2FUW%2FDIIv5xYkjy4dKyx6iHPZ649rTsdiMqZL0A3UTdSQBPP85aNK0U;
  • BDORZ=B490B5EBF6F3CD402E515D22BCDA1598;
  • BDSVRTM=0

我通过判断搞清楚了多数参数的含义,但没有明白百度记录那么多真实点击数据是如何影响排名的,seo又能否从中找到哪些提升排名的方式?

问题大致如下:

百度对自家产品与普通网站是不同对待的,

百科fm参数是albk 贴吧是altb 新闻是alns 普通网站则是as,我没猜出fm是什么参数,估计是(from)之类用于判断结果类别的

注: fm 是数据返回的格式(format)

F、F1、F2、F3都不知道是什么参数,本来以为是16进制的ip,转换后发现不对,而且与ip无关,一般是不变的,也有变得,有兴趣可以看下我上面发的,

注:F、F1、F2、F3 是SERP(搜索结果页)的每个结果与查询词对应的记录

T是linux时间戳,title,url就不用说了,p1是排名,y也是未知参数个个不同。

注::T 是服务器返回搜索结果时间(Time),title 是百度给搜索结果链接加的标题(不等同网页标题),url 是搜索结果链接,p1 是百度搜索结果当前页全部排名,y 不清楚。然后百度又在这2年把p1改为百度阿拉丁开放平台在搜索结果页的排名,用p5代替原先的p1。

 

 

c函数将这一系列的参数合成一个链接,赋给图片地址,通过浏览器加载图片的方式向服务器反馈信息具体的类似于:

百度每个搜索结果都有一个onmousedown事件,谁知到这个具体它在服务器端做什么处理呢!?肯定对排名有影响的,这就不用说了

注:

q 查询词

fm 数据返回的格式

F 查询词与搜索结果标题、描述、链接的匹配方式

F1 似乎是结构化数据

F2 搜索结果链接标题来源

F3 优先级排序(主域名>子域名>详情页)

T 服务器返回搜索结果时间

title 百度给搜索结果链接加的标题(由F2提供)

url 搜索结果链接(由F3提供)

p1 百度搜索结果当前页全部排名

y 不清楚

rsv_sid 样本ID

cid 点击ID

qid 查询ID

t 本地电脑点击搜索结果链接的时间

path 后面的url我已经在 weixingon。com/tool 得到了较好的解决。

wd 关键词

pn 搜索结果偏移量(偏移量offset),用于翻页

rsv_page=1 经过翻页搜索


反向来解读这些代码跟解密码的程度差不多,非常难。那我们换一个思路,只要做一个程序,搜索关键词,然后查找目标网站,找到之后点击,然后在页面随便浏览几个网页,退出,IP切换中,下一个。

Bingo,回头用imacros试试

关注微信公众号

上一篇文章
百度搜索引擎网页质量白皮书 全文
下一篇文章
外贸建站公司 —— 威海麦客网络技术有限公司 专业外贸建站
菜单