核心提示:先分析一下在一个完整的搜索过程中,百度在用户的后台都做了些什么。 一、首先,打开百度的主页,对数据包进行截包分析,发现在下载主页时有一个cookie产生外,还下载了一个js文件,先来看看cookie:如图 下载的js文件,如图: 这个js文件的地址是: http://www.baidu.c...
先分析一下在一个完整的搜索过程中,百度在用户的后台都做了些什么。
一、首先,打开百度的主页,对数据包进行截包分析,发现在下载主页时有一个cookie产生外,还下载了一个js文件,先来看看cookie:如图
下载的js文件,如图:
这个js文件的地址是: http://www.baidu.com/js/bdsug.js?v=1.1.0.3
这个文件起什么作用呢,可以打开看一下,如果对脚本熟的话可以分析出它的作用,初步判断百度在用户后台的动作就是靠它了,包括关键词输入时的联想提示,用户的点击操作监控等,下面我们再具体来分析一下。
二、输入关键词,并点击搜索,表面上是出现了搜索结果,但在这个后面发生了什么,经过观察,发现在搜索结果出来之前,百度是先让用户让它的s.baidu.com这台服务器发送了一串数据,这串数据中的各项参数是记录用户行为的,包括关键词,原来的cookie,如图:
除了向s.baidu.com发送数据包,还向c.baidu.com发送数据,如图:
最后才是向www.baidu.com发送搜索要求,并返回可见结果。
三、在搜索结果出来后,用户点击相应搜索结果时,发现百度对用户的这个点击动作也作了记录,在后台向s.baidu.com这台服务器发送了一串的参数,如图:
那么,在搜索结果出来后,用户点击结果页面下方的相关词时百度又会是怎样的反应呢,经过观察,发现首先会向www.baidu.com发送一个新的搜索请求,这个请求和前面的不一样,它是带参数的,带了当前的关键词和排位情况的,如图:
然后像前面一样,分别向s.baidu.bom和c.baidu.com发送用户行为数据。