首页 > 代码库 > 用词云图分析一带一路峰会哪3个词说的最多
用词云图分析一带一路峰会哪3个词说的最多
前言
最近几日关注度最高的新闻莫过于一带一路峰会相关的消息,会议结束后,一带一路峰会联合公告已经公布出来了。
本文通过词云分析,了解本次公告以及习大大在峰会开幕式上主要都讲了哪些关键内容。
1 一带一路峰会联合公告词云图
5月17日公布的一带一路峰会联合公告的词云分析结果图,如下:
词云图上,字体越大表示该词语在文件中出现的次数越多。
从上图可以看出,出现次数最多的3个词语为“合作”、“我们”以及“加强” ,基本可以看出,本次峰会是一个新的起点,今后需要做的事情还很多,需要各方务实合作,哈。
2 一带一路峰会开幕式上习大大的讲话词云图
分析开幕式上习大大的讲话内容,得到词云图如下:
从上图可看出,出现次数最多的几个词语为“一带一路”、“合作”、“我们”以及“发展”等。
3 用python制作词云图
下面主要来介绍下用python制作这个词云图的过程,主要分为如下几个步骤:
- 从txt文件读取需要分析的文本内容
- 使用jieba分词工具进行中文分词
- 选取合适的显示图形
- 用wordcloud进行词云图显示
- 保存图片
一带一路峰会联合公告词云图实现的代码如下:
# -*- coding: utf-8 -*-"""Created on Wed May 17 2017@author: lemon"""import jiebafrom wordcloud import WordCloud, ImageColorGeneratorimport matplotlib.pyplot as pltimport osimport PIL.Image as Imageimport numpy as npwith open(‘ydyl_gb.txt‘, ‘rb‘) as f:# 读取一带一路峰会联合公报的内容# with open(‘yidaiyilu.txt‘, ‘rb‘) as f: text = f.read() f.close()# 首先使用 jieba 中文分词工具进行分词wordlist = jieba.cut(text, cut_all=False) # cut_all, True为全模式,False为精确模式wordlist_space_split = ‘ ‘.join(wordlist)d = os.path.dirname(__file__)alice_coloring = np.array(Image.open(os.path.join(d,‘colors.png‘)))my_wordcloud = WordCloud(background_color=‘#F0F8FF‘, max_words=100, mask=alice_coloring, max_font_size=300, random_state=42).generate(wordlist_space_split)image_colors = ImageColorGenerator(alice_coloring)plt.show(my_wordcloud.recolor(color_func=image_colors))plt.imshow(my_wordcloud) # 以图片的形式显示词云plt.axis(‘off‘) # 关闭坐标轴plt.show()my_wordcloud.to_file(os.path.join(d, ‘ydyl_gb_colors_cloud.png‘))
更多精彩内容请关注微信公众号:
“Python数据之道”
?
用词云图分析一带一路峰会哪3个词说的最多
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。