可视化代码如下。
- def create_follows(df):
- """
- 生成评论用户关注数情况
- """
- df = df.drop_duplicates('id')
- follows = df['follows']
- bins = [0, 10, 20, 50, 100, 200, 500, 1000, 2000, 5000, 10000, 20000]
- level = ['0-10', '10-20', '20-50', '50-100', '100-200', '200-500', '500-1000', '1000-2000', '2000-5000', '5000-10000', '10000以上']
- len_stage = pd.cut(follows, bins=bins, labels=level).value_counts().sort_index()
- # 生成柱状图
- attr = len_stage.index
- v1 = len_stage.values
- bar = Bar("评论用户关注数分布情况", title_pos='center', title_top='18', width=800, height=400)
- bar.add("", attr, v1, is_stack=True, is_label_show=True, xaxis_interval=0, xaxis_rotate=30)
- bar.render("评论用户关注数分布情况.html")
04 评论用户粉丝数分布

这里发现粉丝数为「0-10」的用户不少,估摸着应该是水军在作怪了。
粉丝数为「50-100」的用户最多。
可视化代码如下。
- def create_follows(df):
- """
- 生成评论用户关注数情况
- """
- df = df.drop_duplicates('id')
- follows = df['follows']
- bins = [0, 10, 20, 50, 100, 200, 500, 1000, 2000, 5000, 10000, 20000]
- level = ['0-10', '10-20', '20-50', '50-100', '100-200', '200-500', '500-1000', '1000-2000', '2000-5000', '5000-10000', '10000以上']
- len_stage = pd.cut(follows, bins=bins, labels=level).value_counts().sort_index()
- # 生成柱状图
- attr = len_stage.index
- v1 = len_stage.values
- bar = Bar("评论用户关注数分布情况", title_pos='center', title_top='18', width=800, height=400)
- bar.add("", attr, v1, is_stack=True, is_label_show=True, xaxis_interval=0, xaxis_rotate=30)
- bar.render("评论用户关注数分布情况.html")
05 评论时间分布

潘老师是在17时发出微博的,但是那时并没有大量的评论出现,,那个小时一共有1237条评论。
直到蔡徐坤在18时评论后,微博的评论一下就上去了,24752条。
而且目前一半的评论都是在蔡徐坤的回复底下评论,点赞数多的也大多都在其中。
不得不说蔡徐坤的粉丝力量真大,可怕可怕~ (编辑:威海站长网)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|