首页 > 代码库 > python练习册 每天一个小程序 第0004题
python练习册 每天一个小程序 第0004题
1 #-*-coding:utf-8-*- 2 __author__ = ‘Deen‘ 3 ‘‘‘ 4 题目描述:任一个英文的纯文本文件,统计其中的单词出现的个数。 5 参考学习链接: 6 re http://www.cnblogs.com/tina-python/p/5508402.html#undefined 7 collections http://blog.csdn.net/liufang0001/article/details/54618484 8 ‘‘‘ 9 import re,collections 10 with open(‘english.txt‘,‘r‘) as fp: 11 text=fp.read().strip(‘,‘) 12 s=re.compile(r‘\w+\b‘) 13 words=s.findall(text) 14 b=list() 15 dic=collections.defaultdict(lambda :0) 16 for word in words: 17 dic[word.lower()] +=1 18 19 print dic 20 21 ‘‘‘ 22 import collections,re 23 import sys 24 def cal(filename = ‘english.txt‘): 25 print ‘now processing:‘ + filename + ‘......‘ 26 f = open(filename,‘r‘) 27 data = http://www.mamicode.com/f.read()>28 dic = collections.defaultdict(lambda :0) 29 data = http://www.mamicode.com/re.sub(r‘[/W/d]‘,‘ ‘,data)>30 data = http://www.mamicode.com/data.lower()>31 datalist = data.split(‘ ‘) 32 for item in datalist: 33 dic[item] += 1 34 del dic[‘‘] 35 return dic 36 try: 37 print sorted(cal().items()) 38 except: 39 print ‘no input file‘ 40 ‘‘‘
python练习册 每天一个小程序 第0004题
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。