首页 > 代码库 > 微博用户行为分析
微博用户行为分析
通过强过滤之后的用户数目283178个,微博数目431726条:
1,原始数据
1 240085 1 240085 5.3803650272 28475 2 28475 4.4544637333 4279 3 4279 3.6313422864 2748 4 2748 3.4390167285 1461 5 1461 3.1646502166 364 6 364 2.5611013847 174 7 174 2.2405492488 123 8 123 2.0899051119 73 9 73 1.8633228610 40 10 40 1.60205999111 38 11 38 1.57978359712 18 12 18 1.25527250514 17 13 17 1.23044892115 15 14 15 1.17609125913 10 15 10 120 8 16 8 0.90308998716 8 17 8 0.90308998717 6 18 6 0.7781512537 5 19 5 0.69897000419 5 20 5 0.69897000418 5 21 5 0.69897000426 3 22 3 0.47712125523 3 23 3 0.47712125530 2 24 2 0.30102999624 2 25 2 0.30102999622 2 26 2 0.30102999621 2 29 2 0.30102999643 1 30 1 042 1 33 1 038 1 35 1 035 1 37 1 033 1 38 1 029 1 42 1 025 1 43 1 0 第一列和第二列是原始数据 第四列和第五列是更正排序之后的数据() 第一列用户活跃度 第二列该活跃度下的用户数 第三列更正之后的用户活跃度 第四列为错误的用户活跃的数目 第五列是对第四列求导数
最终得到的用户活跃度图形是
这张图中横坐标是用户活跃度(用户评价的节目数量),纵坐标是该活跃的的用户数目进行求导
用户活跃度的双对数曲线如下:
除了开始部分,其它倒是符合双对数的时候为一条直线的情况
和预期有差别的原因
1)商品数据(这里是节目数据)太少,用户活跃度<46
2)超过90%的用户都是只发一条微博
关于用户的流行度,处理之后的原始数据
套马杆 11446天耀中华 9210想你的365天 8656在那遥远的地方 7922野蜂飞舞 6374同光十三绝 5133符号中国 4979答案 4554扰民 4368我的要求不算高 4184老阿姨 3786万泉河水 3733剑心书韵 3559说你什么好 2605英雄赞歌 2301空空拜年 2284康定情歌 2135魔幻三兄弟 2081梦蝶 2051人到礼到 2031青春舞曲 2018小马欢腾 1997站在高岗上 1770团圆饭 1481最好的夜晚 1390英雄组歌 1377我就这么个人 1070张灯结彩 932百花争妍 774光荣与梦想 728年味儿 594欢歌 501练兵舞 468天下黄河九十九道弯 387我的中国梦 148舌尖上的春晚 53
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。