首页 > 代码库 > 一本英文小说的词频统计

一本英文小说的词频统计

对《达芬奇密码(The Da Vinci Code)》统计了各单词的出现次数(人名地名不参与统计)。

全书约12.5万字(words),出现了10240个单词,其中只有1559个单词出现了10次以上。

 

出现2000次以上的单词,4个:the, of, to, and

出现1000次以上的单词,12个。

出现500次以上的单词,22个。

出现100次以上的单词,148个。

出现50次以上的单词,333个。

出现30次以上的单词,551个。

出现20次以上的单词,808个。

出现10次以上的单词,1559个。

出现5次以上的单词,2886个。

出现3次以上的单词,3447个。

出现2次以上的单词,6014个。

出现1次以上的单词,10240个。

 

详细结果在 这里 下载,可以用来背单词用。