首页 > 代码库 > python NLTK 环境搭建

python NLTK 环境搭建

1.安装Python(我安装的是Python2.7.8,文件夹D:\Python27)

2.安装NumPy(可选)

到这里下载:http://sourceforge.net/projects/numpy/files/NumPy/1.6.2/numpy-1.6.2-win32-superpack-python2.7.exe

注意Py版本号

下载之后运行exe文件(程序会自己主动搜索python27文件夹)

3.安装NLTK(我下载的是nltk-2.0.3)

到这里下载:http://pypi.python.org/pypi/nltk

把nltk-3.0.0解压到D:\Python27文件夹

打开cmd,进到D:\Python27\nltk-3.0.0文件夹(输入:cd D:\Python27\nltk-3.0.0)

输入命令:python setup.py install

这时出现Import error :no module named setuptools windows 默认没有安装setuptool模块,自己下载这个模块.exe (http://www.cr173.com/soft/40214.html#address)

4.安装PyYAML:

到这里下载:http://pyyaml.org/wiki/PyYAML

注意Py版本号

下载之后运行exe文件(程序会自己主动搜索python27文件夹)

5.打开IDLE,输入import nltk,没有错误的话。就说明成功安装了。

到这里。NLP所需的基本python模块都已经安装好了,然后要安装NLTK_DATA了

下载NLTK_DATA有好几种方法。这里我仅仅介绍一种

6.继续第五步,已经import nltk了,然后输入nltk.download(),这样就能够打开一个NLTK Downloader(NLTK下载器)

7.注意下载器下边的Download Directory。我设置的是C:\nltk_data

8.在计算机-属性-高级系统设置-高级-环境变量-系统变量-新建:上边:NLTK_DATA,下边:C:\nltk_data

9.选择你要下载的包(语料库、模块)。能够一次性下载(我在下载过程中总是出现out of date)。也能够逐个下载(这样速度比較快,总体下载速度非常慢)

10.安装成功包之后怎么測试呢?输入下边的语句就能够。

>>> from nltk.corpus import brown
>>> brown.words()
[‘The‘, ‘Fulton‘, ‘County‘, ‘Grand‘, ‘Jury‘, ‘said‘, ...]

另一个python经典绘图库matplotlib的安装:http://blog.csdn.net/huruzun/article/details/39395343

这些环境搭建好,基本经常使用的python须要的工具包之类的就已经完毕啦!

 

python NLTK 环境搭建