百度对网页搜索用户鼠标点击的监控

10月 30th, 2009

今刚发现,百度也开始对部份用户(当前环境:Winxp+IE6、北京ip|Firefox下无此现象)的搜索结果页的鼠标点击行为进行了监控。它在每个链接<a>标签中,添加了一段如下命令,通过第39-61行的代码进行解析,将包括用户查询命令的参数“q”、包括联盟来源的参数”tn”、以及Linux时间参数”T”跟”t”,当然也少不了用户点击那个页面的URL,以及百度当前页面的URL。

以下为<a>标签中的统计插针案例:

<table border=”0″ cellpadding=”0″ cellspacing=”0″ id=”1″><tr><td class=f><a  onmousedown=”return c({’fm’:'as’,'F’:'779317CA’,'F1′:’9D73F1E4′,’F2′:’4CA6DF6A’,'F3′:’54E5243F’,'T’:'1256885850′,’title’:this.innerHTML,’url’:this.href,’p1′:1,’y':’EF6BFDBB’})” href=”http://map.mapbar.com/”  target=”_blank” ><font size=”3″>【<font color=”#c60a00″>中国地图</font>】_图吧<font color=”#c60a00″>中国地图</font></font></a><br><font size=-1>图吧中国行政区划地图,为您提供<font color=”#c60a00″>中国地图</font>、全国各省市、地区等电子地图。<br><font color=”#008000″>map.mapbar.com/ 82K 2009-10-29  </font> - <a href=”http://cache.baidu.com/c?m=9f65cb4a8c8507ed4fece763104984240e54f73c6f9580463fc3933fc239045c5323befb712d0772d7d20a6516df424b9e832173471450b08cbe825daccd85585e&p=cb769a469d9f11a05abccf2247&user=baidu”  target=”_blank”  class=”m”>百度快照</a> <br></font></td></tr></table>

鼠标右击时向服务器传送交内容:

http://s.baidu.com/w.gif?q=%D6%D0%B9%FA%B5%D8%CD%BC&fm=as&F=779317CA&F1=9D73F1E4&F2=4CA6DF6A&F3=54E5243F&T=1256885850&title=%E3%80%90%E4%B8%AD%E5%9B%BD%E5%9C%B0%E5%9B%BE%E3%80%91_%E5%9B%BE%E5%90%A7%E4%B8%AD%E5%9B%BD%E5%9C%B0%E5%9B%BE&url=http%3A//map.mapbar.com/&p1=1&y=EF6BFDBB&path=http://www.baidu.com/s?wd=%D6%D0%B9%FA%B5%D8%CD%BC&word=%D6%D0%B9%FA%B5%D8%CD%BC&tn=sitehao123&cid=0&qid=86ca588d0391fb02&t=1256886037546

鼠标左击时向服务器传送交内容:

http://s.baidu.com/w.gif?q=%D6%D0%B9%FA%B5%D8%CD%BC&fm=as&F=779317CA&F1=9D73F1E4&F2=4CA6DF6A&F3=54E5243F&T=1256885850&title=%E3%80%90%E4%B8%AD%E5%9B%BD%E5%9C%B0%E5%9B%BE%E3%80%91_%E5%9B%BE%E5%90%A7%E4%B8%AD%E5%9B%BD%E5%9C%B0%E5%9B%BE&url=http%3A//map.mapbar.com/&p1=1&y=EF6BFDBB&path=http://www.baidu.com/s?wd=%D6%D0%B9%FA%B5%D8%CD%BC&word=%D6%D0%B9%FA%B5%D8%CD%BC&tn=sitehao123&cid=0&qid=86ca588d0391fb02&t=1256886070406

页面中的控制第39-61行代码:

<script>
function bq(form){
form.wd.value = ‘中国地图 ‘ + form.wd.value;
form.submit();
}
function h(obj,url){obj.style.behavior=’url(#default#homepage)’;obj.setHomePage(url);}
if (top.location != self.location){top.location = self.location}
function ga(o,e){if (document.getElementById){a=o.id.substring(1); p = “”;r = “”;g = e.target;if (g) { t = g.id;f0 = g.parentNode;if (f0) {p = f0.id;h = f0.parentNode;if (h) r = h.id;}} else{h = e.srcElement;f0 = h.parentNode;if (f0) p = f0.id;t = h.id;}if (t==a || p==a || r==a) return true;window.open(document.getElementById(a).href,’_blank’)}}
function ss(w){window.status=w;return true;}
function cs(){window.status=”;}

function c(q){var p=window.document.location.href,sQ=”,sV=”,img=window[”BD_PS_C”+(new Date()).getTime()]=new Image();for(v in q){switch (v){case “title”:sV=encodeURIComponent(q[v].replace(/<[^<>]+>/g,”"));break;case “url”:sV=escape(q[v]);break;default:sV=q[v]}sQ+=v+”=”+sV+”&”} img.src=”http://s.baidu.com/w.gif?q=%D6%D0%B9%FA%B5%D8%CD%BC&”+sQ+”path=”+p+”&cid=0&qid=86ca588d0391fb02&t=”+new Date().getTime(); return true}
function al_c(A){while(A.tagName!=”TABLE”)A=A.parentNode;return A.getAttribute(”id”)}
function al_c2(n,c){while(c–){while((n=n.parentNode).tagName!=”TABLE”);};return n.getAttribute(”id”);}

另外搜索列的统计代码:

<script>c({’fm’:’se’,'T’:'1256883100′,’y':’F3DADFFF’});if(navigator.cookieEnabled && !/sug?=0/.test(document.cookie)){document.write(’<script src=http://www.baidu.com/js/bdsug.js?v=1.1.0.3><\/script>’)};window.onunload=function(){};window.onload=function(){document.forms[0].reset();}</script>

开复离开后的Google

9月 26th, 2009

呵呵,开复离开后的Google,品牌推广成了重要功课。

1.   搜索结果前出现“Google LOGO与G.cn”品牌与推广广告;有了点山寨霸王风范,很好很强大!

google.jpg

2.    另外,从九月初开始,SOSO已撤下Google搜索接口,使得Google隐性市场占有率(毕竟即没出GG-ADWords,又不显示GG-URL)——–下降不少,还无形中添加了一个强劲的对手。

开复的离开以及目前的市场环境,对脆弱的GG来说, 前途依然是一片坎坷!~

WebTrends安装调试的辛路历程

5月 5th, 2009
  1. 曲指算了,前前后后花在WebTrends安装上面的时间,已有超过七个完整工作日了。如果再加上,几年前的非正式的测度,恐怕已有十多天之久了。——这应该是我有史以来安装调试最大,耗时最久的项目了。
  2. 它涉及到了Apache的配置、域帐户下的使用、虚拟主站的使用、软件本身的后台配置、生成报表格式、SDC服务的建立、软件分析过程中的计划任务、服务的配置+服务端品的配置+数据库的配置… …天啦!~回想起来头都大了。
  3. 在此将我所遇到的若干问题,分享,以供大家参考对照:3.1  域帐户问题:建议平时用域帐户登录系统的用户,首先退出域再进行安装。如果安全必非常高,必需域帐户,必需保持安装过程与安装后登录后台时的帐户属高度一制,包括域登录状态。该问题导致我软件至少重装了五次以上。

    3.2  SDC的安装:SDC(SmartSource Data Collector)即用来收集用户信息的服务,类似于Google Analytics中的www.google-analytics.com服务。用于收集用户客户端信息(IP、分辨率、浏览器街)、用户访问页面信息(URL、用户点击、交互行为)、用户来源信息(Referer)。SDC的服务是非默认安装的,只有在选择本项目后,才会出现SDC的安装过程。同时SDC服务是独立于WebTrends后台Apache的,它会默认安装到“C:\Program Files\Apache2”下面,但它的发布目录,却依然在\%WebTrendsROOT%\modules\sdc\util\content下面,而SDC的日志则保存在”sdc/weblog/”目录下。

    3.3  SDC探针的生成SDC探针,其实就是Google Analytics、CNZZ等统计站点中的统计代码。该段代码有两个作用一方面获取用户的相关信息;将用户信息/探针自身ID(即下文件DCSID)传递给服务器;Administration >> Data Sources >> New Data Source >>选择 Web: SmartSource Data Files >> 然后依照流程依次填写即可。

    3.3  SDC的配置:而最最重要的一点是需要将DCSID,即每个SDC对应统计项目的ID号,添加到“webtrendssites.lst”列表中。而这个DCSID相当于Google Analytics中的“uacct”参数例如:“_uacct = “UA-164364-12″”。
    另一个SDC配置中重要的事项为:用于获取用户信息的JS脚本。WT后台生成的“WebTrends JavaScript Tag” ,在实际使用是需以“文字字符串”形式予以保存,具体表现形式,可参考HC网的hc360_dcs_tag.js文件。

  4. WebTrends的使用前的注意事项:
    在WebTrends正式分析SDC的log文件前,有一个问题使用者需要清晰的分辨:全站使用一个配置文本,还是针对每个产品/子域/二级域名,使用单独的配置文本。这在GA中也是一样。
    一个全站一个配置文本:将使用全站总的独立访问用户数相对准确,但在权限分配、各产品独立分析等问题上,会存在麻烦;
    每个子域设置一个单独的配置文件:在全站用户数量分析、以及用户在不同产品线之间的切换比例等分析方面,存在麻烦。

后续在WT的使用中,再陆续将一些使用心得与大家分享!~
注:更多的数据分析请点击:Web Analytics|网站流量分析