加入收藏 | 设为首页 | 会员中心 | 我要投稿 威海站长网 (https://www.0631zz.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营中心 > 网站设计 > 教程 > 正文

用数据分析网络暴力有多可怕

发布时间:2019-04-02 00:44:38 所属栏目:教程 来源:小F
导读:这应该是一篇拖得蛮久的文章。 故事源于潘长江在某个综艺节目上没认出蔡徐坤,然后潘长江老师的微博评论区就炸锅了。 最后搞得两边都多多少少受到网络暴力的影响。 直至今日,这条微博的评论区还在更新着。 不得不说微博的黑粉,强行带节奏,真的很可怕。

06 评论词云

用数据分析网络暴力有多可怕

大体上言论还算好,没有很偏激。

可视化代码如下。

  1. from wordcloud import WordCloud, ImageColorGenerator 
  2. import matplotlib.pyplot as plt 
  3. import jieba 
  4.  
  5.  
  6. def create_wordcloud(df): 
  7.     """ 
  8.     生成评论词云 
  9.     """ 
  10.     words = pd.read_csv('chineseStopWords.txt', encoding='gbk', sep='t', names=['stopword']) 
  11.     # 分词 
  12.     text = '' 
  13.     for line in df['comment']: 
  14.         line = line.split(':')[-1] 
  15.         text += ' '.join(jieba.cut(str(line), cut_all=False)) 
  16.     # 停用词 
  17.     stopwords = set('') 
  18.     stopwords.update(words['stopword']) 
  19.     backgroud_Image = plt.imread('article.jpg') 
  20.     wc = WordCloud( 
  21.         background_color='white', 
  22.         mask=backgroud_Image, 
  23.         font_path='C:WindowsFonts华康俪金黑W8.TTF', 
  24.         max_words=2000, 
  25.         max_font_size=150, 
  26.         min_font_size=15, 
  27.         prefer_horizontal=1, 
  28.         random_state=50, 
  29.         stopwords=stopwords 
  30.     ) 
  31.     wc.generate_from_text(text) 
  32.     img_colors = ImageColorGenerator(backgroud_Image) 
  33.     wc.recolor(color_func=img_colors) 
  34.     # 高词频词语 
  35.     process_word = WordCloud.process_text(wc, text) 
  36.     sort = sorted(process_word.items(), key=lambda e: e[1], reverse=True) 
  37.     print(sort[:50]) 
  38.     plt.imshow(wc) 
  39.     plt.axis('off') 
  40.     wc.to_file("微博评论词云.jpg") 
  41.     print('生成词云成功!') 

五、总结

最后,照例来扒一扒哪位用户评论最多。

用数据分析网络暴力有多可怕

这位男性用户,一共评论了90条,居于首位。

(编辑:威海站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读