首页 > 代码库 > python NLTK 环境搭建

python NLTK 环境搭建

这里是我之前亲自操作过安装nltk,安装成功了。当时记得是参考这篇博文:http://www.tuicool.com/articles/VFf6Bza

其中,nltk安装时,遇到模块未找到,依次根据提示对应下载了四五个模块,才成功安装。后来装语料库,也是离线安装的。

 

1.安装Python(我安装的是Python2.7.8,目录D:\Python27)

2.安装NumPy(可选)

到这里下载: http://sourceforge.net/projects/numpy/files/NumPy/1.6.2/numpy-1.6.2-win32-superpack-python2.7.exe

注意Py版本

下载之后执行exe文件(程序会自动搜索python27目录)

3.安装NLTK(我下载的是nltk-2.0.3)

到这里下载: http://pypi.python.org/pypi/nltk

把nltk-3.0.0解压到D:\Python27目录

打开cmd,进到D:\Python27\nltk-3.0.0目录(输入:cd D:\Python27\nltk-3.0.0)

输入命令:python setup.py install

这时出现 Import error :no module named setuptools windows 默认没有安装setuptool模块,自己下载这个模块.exe ( http://www.cr173.com/soft/40214.html#address )

4.安装PyYAML:

到这里下载: http://pyyaml.org/wiki/PyYAML

注意Py版本

下载之后执行exe文件(程序会自动搜索python27目录)

5.打开IDLE,输入import nltk,没有错误的话,就说明安装成功了。

到这里,NLP所需的基本python模块都已经安装好了,然后要安装NLTK_DATA了

下载NLTK_DATA有好几种方法,这里我只介绍一种

6.继续第五步,已经import nltk了,然后输入nltk.download(),这样就可以打开一个NLTK Downloader(NLTK下载器)

7.注意下载器下边的Download Directory,我设置的是C:\nltk_data

8.在计算机-属性-高级系统设置-高级-环境变量-系统变量-新建:上边:NLTK_DATA,下边:C:\nltk_data

9.选择你要下载的包(语料库、模块),可以一次性下载(我在下载过程中总是出现out of date),也可以逐个下载(这样速度比较快,整体下载速度很慢)

10.成功安装包之后怎么测试呢?输入下边的语句就可以。

>>> from nltk.corpus import brown>>> brown.words()[‘The‘, ‘Fulton‘, ‘County‘, ‘Grand‘, ‘Jury‘, ‘said‘, ...]

还有一个python经典画图库matplotlib的安装: http://blog.csdn.net/huruzun/article/details/39395343

这些环境搭建好,基本常用的python需要的工具包之类的就已经完成啦!

python NLTK 环境搭建