Archive for the ‘数据分析|Web Analytics’ Category

百度对网页搜索用户鼠标点击的监控

星期五, 10月 30th, 2009

今刚发现,百度也开始对部份用户(当前环境:Winxp+IE6、北京ip|Firefox下无此现象)的搜索结果页的鼠标点击行为进行了监控。它在每个链接<a>标签中,添加了一段如下命令,通过第39-61行的代码进行解析,将包括用户查询命令的参数“q”、包括联盟来源的参数”tn”、以及Linux时间参数”T”跟”t”,当然也少不了用户点击那个页面的URL,以及百度当前页面的URL。

以下为<a>标签中的统计插针案例:

<table border=”0″ cellpadding=”0″ cellspacing=”0″ id=”1″><tr><td class=f><a  onmousedown=”return c({’fm’:'as’,'F’:'779317CA’,'F1′:’9D73F1E4′,’F2′:’4CA6DF6A’,'F3′:’54E5243F’,'T’:'1256885850′,’title’:this.innerHTML,’url’:this.href,’p1′:1,’y':’EF6BFDBB’})” href=”http://map.mapbar.com/”  target=”_blank” ><font size=”3″>【<font color=”#c60a00″>中国地图</font>】_图吧<font color=”#c60a00″>中国地图</font></font></a><br><font size=-1>图吧中国行政区划地图,为您提供<font color=”#c60a00″>中国地图</font>、全国各省市、地区等电子地图。<br><font color=”#008000″>map.mapbar.com/ 82K 2009-10-29  </font> - <a href=”http://cache.baidu.com/c?m=9f65cb4a8c8507ed4fece763104984240e54f73c6f9580463fc3933fc239045c5323befb712d0772d7d20a6516df424b9e832173471450b08cbe825daccd85585e&p=cb769a469d9f11a05abccf2247&user=baidu”  target=”_blank”  class=”m”>百度快照</a> <br></font></td></tr></table>

鼠标右击时向服务器传送交内容:

http://s.baidu.com/w.gif?q=%D6%D0%B9%FA%B5%D8%CD%BC&fm=as&F=779317CA&F1=9D73F1E4&F2=4CA6DF6A&F3=54E5243F&T=1256885850&title=%E3%80%90%E4%B8%AD%E5%9B%BD%E5%9C%B0%E5%9B%BE%E3%80%91_%E5%9B%BE%E5%90%A7%E4%B8%AD%E5%9B%BD%E5%9C%B0%E5%9B%BE&url=http%3A//map.mapbar.com/&p1=1&y=EF6BFDBB&path=http://www.baidu.com/s?wd=%D6%D0%B9%FA%B5%D8%CD%BC&word=%D6%D0%B9%FA%B5%D8%CD%BC&tn=sitehao123&cid=0&qid=86ca588d0391fb02&t=1256886037546

鼠标左击时向服务器传送交内容:

http://s.baidu.com/w.gif?q=%D6%D0%B9%FA%B5%D8%CD%BC&fm=as&F=779317CA&F1=9D73F1E4&F2=4CA6DF6A&F3=54E5243F&T=1256885850&title=%E3%80%90%E4%B8%AD%E5%9B%BD%E5%9C%B0%E5%9B%BE%E3%80%91_%E5%9B%BE%E5%90%A7%E4%B8%AD%E5%9B%BD%E5%9C%B0%E5%9B%BE&url=http%3A//map.mapbar.com/&p1=1&y=EF6BFDBB&path=http://www.baidu.com/s?wd=%D6%D0%B9%FA%B5%D8%CD%BC&word=%D6%D0%B9%FA%B5%D8%CD%BC&tn=sitehao123&cid=0&qid=86ca588d0391fb02&t=1256886070406

页面中的控制第39-61行代码:

<script>
function bq(form){
form.wd.value = ‘中国地图 ‘ + form.wd.value;
form.submit();
}
function h(obj,url){obj.style.behavior=’url(#default#homepage)’;obj.setHomePage(url);}
if (top.location != self.location){top.location = self.location}
function ga(o,e){if (document.getElementById){a=o.id.substring(1); p = “”;r = “”;g = e.target;if (g) { t = g.id;f0 = g.parentNode;if (f0) {p = f0.id;h = f0.parentNode;if (h) r = h.id;}} else{h = e.srcElement;f0 = h.parentNode;if (f0) p = f0.id;t = h.id;}if (t==a || p==a || r==a) return true;window.open(document.getElementById(a).href,’_blank’)}}
function ss(w){window.status=w;return true;}
function cs(){window.status=”;}

function c(q){var p=window.document.location.href,sQ=”,sV=”,img=window[”BD_PS_C”+(new Date()).getTime()]=new Image();for(v in q){switch (v){case “title”:sV=encodeURIComponent(q[v].replace(/<[^<>]+>/g,”"));break;case “url”:sV=escape(q[v]);break;default:sV=q[v]}sQ+=v+”=”+sV+”&”} img.src=”http://s.baidu.com/w.gif?q=%D6%D0%B9%FA%B5%D8%CD%BC&”+sQ+”path=”+p+”&cid=0&qid=86ca588d0391fb02&t=”+new Date().getTime(); return true}
function al_c(A){while(A.tagName!=”TABLE”)A=A.parentNode;return A.getAttribute(”id”)}
function al_c2(n,c){while(c–){while((n=n.parentNode).tagName!=”TABLE”);};return n.getAttribute(”id”);}

另外搜索列的统计代码:

<script>c({’fm’:’se’,'T’:'1256883100′,’y':’F3DADFFF’});if(navigator.cookieEnabled && !/sug?=0/.test(document.cookie)){document.write(’<script src=http://www.baidu.com/js/bdsug.js?v=1.1.0.3><\/script>’)};window.onunload=function(){};window.onload=function(){document.forms[0].reset();}</script>

WebTrends安装调试的辛路历程

星期二, 5月 5th, 2009
  1. 曲指算了,前前后后花在WebTrends安装上面的时间,已有超过七个完整工作日了。如果再加上,几年前的非正式的测度,恐怕已有十多天之久了。——这应该是我有史以来安装调试最大,耗时最久的项目了。
  2. 它涉及到了Apache的配置、域帐户下的使用、虚拟主站的使用、软件本身的后台配置、生成报表格式、SDC服务的建立、软件分析过程中的计划任务、服务的配置+服务端品的配置+数据库的配置… …天啦!~回想起来头都大了。
  3. 在此将我所遇到的若干问题,分享,以供大家参考对照:3.1  域帐户问题:建议平时用域帐户登录系统的用户,首先退出域再进行安装。如果安全必非常高,必需域帐户,必需保持安装过程与安装后登录后台时的帐户属高度一制,包括域登录状态。该问题导致我软件至少重装了五次以上。

    3.2  SDC的安装:SDC(SmartSource Data Collector)即用来收集用户信息的服务,类似于Google Analytics中的www.google-analytics.com服务。用于收集用户客户端信息(IP、分辨率、浏览器街)、用户访问页面信息(URL、用户点击、交互行为)、用户来源信息(Referer)。SDC的服务是非默认安装的,只有在选择本项目后,才会出现SDC的安装过程。同时SDC服务是独立于WebTrends后台Apache的,它会默认安装到“C:\Program Files\Apache2”下面,但它的发布目录,却依然在\%WebTrendsROOT%\modules\sdc\util\content下面,而SDC的日志则保存在”sdc/weblog/”目录下。

    3.3  SDC探针的生成SDC探针,其实就是Google Analytics、CNZZ等统计站点中的统计代码。该段代码有两个作用一方面获取用户的相关信息;将用户信息/探针自身ID(即下文件DCSID)传递给服务器;Administration >> Data Sources >> New Data Source >>选择 Web: SmartSource Data Files >> 然后依照流程依次填写即可。

    3.3  SDC的配置:而最最重要的一点是需要将DCSID,即每个SDC对应统计项目的ID号,添加到“webtrendssites.lst”列表中。而这个DCSID相当于Google Analytics中的“uacct”参数例如:“_uacct = “UA-164364-12″”。
    另一个SDC配置中重要的事项为:用于获取用户信息的JS脚本。WT后台生成的“WebTrends JavaScript Tag” ,在实际使用是需以“文字字符串”形式予以保存,具体表现形式,可参考HC网的hc360_dcs_tag.js文件。

  4. WebTrends的使用前的注意事项:
    在WebTrends正式分析SDC的log文件前,有一个问题使用者需要清晰的分辨:全站使用一个配置文本,还是针对每个产品/子域/二级域名,使用单独的配置文本。这在GA中也是一样。
    一个全站一个配置文本:将使用全站总的独立访问用户数相对准确,但在权限分配、各产品独立分析等问题上,会存在麻烦;
    每个子域设置一个单独的配置文件:在全站用户数量分析、以及用户在不同产品线之间的切换比例等分析方面,存在麻烦。

后续在WT的使用中,再陆续将一些使用心得与大家分享!~
注:更多的数据分析请点击:Web Analytics|网站流量分析

Firefox Download Day

星期日, 7月 6th, 2008

2008-06-17是Mozilla约定的“Firefox Download Day”,由于Blog与相关网站的大力传播,当天下载量达到,创吉尼斯记录的,日下载8,002,530次,全球记录。

根据官方网站提供的数据显示:

1. 美国、德国、日本分别为下载国别中的前三强,三者占总下载量的40.28%,其中美国以8,580,651的总量,占全球27.06%的比例,位居第一位。

2. 中国大陆在这次全球活动,中位居第十位, 下载总量为818,337,占全球比例2.58%。如果加上香港(188872、0.60%)、台湾(278563、0.88%)的话,中国达到1285772,4.06%的份额,可列第五的位置。

3.  如果参考”联合国公布的全球网民数” (全球网民:12亿、中国网民:1.62亿、美国网民:2.1亿),中国占全球13.5%的网民,下载了2.58%的FF3;美国17.5%的网民,下载了27%的FF3。
(呵呵,看来,GG没有告诉广大站长们:下载FF3,也是可以给美刀的)

4.   据中国大陆部份千万级别用户数据统计,IE还是以95.93%位居首位,FF以3.5%位居其次。在IE阵营中IE7,已经占据了30%的份额;但与之相对应的FF3在FF阵营中,才一个月时间也已占据20%的比例。

综上所看:
A、“GG+FF+付费+个人站长”的模式,还是斗不过“MS+IE+番茄花园+‘中关村’”的模式。
B、IE在中国的雄居天下,有以下几个因素支撑:
a) Windows+IE的捆绑策略,从全球来看,都是如此;
b) 用户群体消费的层次、文化层次保障使得盗版在国内还将存在很大、很长的市场,
c) 各种利益团体在维护着Windows+IE的生命周期,比如番茄花园、共享软件、甚至百度的站长联盟体系都成了产业链中的一环。
d) 罗门非一日建成的,IE的龙头优势,也非三两天建立的,FireFox在没有绝对的技术优势、超高的营销技巧,打持久战的心理准备,是不会有更大成果的。

所幸的是,目前我们看到的这个“Firefox Download Day”,就已实现了一次全球性反击战的胜利,虽说只是一次局部的胜利。

附图:下载排名前十个地区:
FireFox_Download_Top10