<span id="blogname">载入中。。。</span>
载入中。。。
载入中。。。
Modisied by Leslie-Cheung.com
 
2006-8-18 23:54:00
IPTV内容访问模型(1)-zipf定律 
 

对于CDN的内容管理,有一个基本定律,就是大家常说对于内容的访问遵循80/20原则,也就是20%的内容,会占有80%的访问量。

这是一个定性的原则,定量来说,内容访问近似符合Zipf定律(Zipf's law), 这个定律是美国语言学家Zipf发现的,他在1932年研究英文单词的出现频率时,发现如果把单词频率从高到低的次序排列,每个单词出现频率和它的符号访问排名存在简单反比关系:

这里 r 表示一个单词的出现频率的排名,P(r)表示排名为r的单词的出现频率.

(单词频率分布中 C约等于0.1, a约等于1)

后人将这个分布称为齐夫分布,这个分布是一个统计型的经验规律,描述了这样一个定理:只有少数英文单词经常被使用,大部分的单词很少被使用。这个定理也在很多分布里面得到了验证,比如人们的收入,互联网的网站数量和访问比例,互联网内容和访问比例(其他分布两个常数有所不同,a越大,分布越密集,对于VOD来说某些时候符合双zipf分布)。

下面是某个系统VOD内容的访问分布,第一幅图是访问频率曲线,Y轴是内容的访问次数,X轴是内容根据访问次数的排名, 我们可以看到,多数访问集中于少量内容上:

第二幅图是对数轴的访问频率曲线,源数据和上图一致,可以看到近似为一条直线:

从曲线的斜率可以计算出,这里的内容访问频率分布,a约等于0.6(不同种类的内容a的大小也不一样)。

 
By 瓜少  阅读全文 | 回复(5) | 引用通告 | 编辑

2007-10-8 8:25:00
体味简洁的质感和异国气息
 
PANSWDPLW(游客)变化能非常灵敏的反应出来
 
By PANSWDPLW(游客)  个人主页 | 引用 | 返回 | 删除 | 回复

2007-3-27 17:19:00
Re:IPTV内容访问模型(1)-zipf定律
 
hui_lin(游客)thank you
 
By hui_lin(游客)  个人主页 | 引用 | 返回 | 删除 | 回复

2006-12-14 16:33:00
Re:IPTV内容访问模型(1)-zipf定律
 
淡然girl(游客)<P>受益匪浅 ,谢谢阿</P>
 
By 淡然girl(游客)  个人主页 | 引用 | 返回 | 删除 | 回复

发表评论:
载入中。。。
 
Calendar

载入中。。。

Login

载入中。。。

Bulletin
载入中。。。
Recent Entries
载入中。。。
Comments
载入中。。。
Messages
载入中。。。
Information
载入中。。。
Links


 
Powered by Oblog.