pythonnltk安裝
1. 安裝了NLTK後 啟動報錯「ImportError: No mole named nltk」
Anacandon訪問的是附帶的nltk,python的IDE當然訪問不到。你把Anacandon內置的nltk拷貝到python的包目錄下,就可以了。
1.找到Anacandon裡面找到nltk的存儲路徑
importnltk
print(nltk.__file__)
2.找到python默認包目錄存儲路徑
importsys
print(sys.path)
3.手動拷貝
2. windows下如何安裝NLTK,並使用模塊nltk
你裝的是什麼版本的python。
如果你是2.7版本,並且電腦是64位機器。建議你按照如下步驟進行安裝
Install Python: http://www.python.org/download/releases/2.7.3/
安裝Numpy (optional): http://www.lfd.uci.e/~gohlke/pythonlibs/#numpy
安裝Setuptools: http://pypi.python.org/packages/2.7/s/setuptools/setuptools-0.6c11.win32-py2.7.exe
安裝 Pip: Start>Run... c:\Python27\Scripts\easy_install pip
安裝PyYAML and NLTK: Start>Run... c:\Python27\Scripts\pip install pyyaml nltk
測試: Start>All Programs>Python27>IDLE, then type import nltk
如果還是有問題,可能原因是Win7的許可權管理,可以將python重新安裝,安裝的時候選擇只為當前用戶而不是所有用戶。
如果還有問題的話,展開注冊表,依次打開HEKY_CURRENT_USER -> Software -> Python -> pythonCore ->2.7(註:這里看你裝的是哪個版本,我裝的是2.7),看有沒有PythonPath項,沒有則創建一個PythonPath項,再在PythonPath項中新建二進制數據,將值設為你的python安裝目錄(如我的:D:\Program Files (x86)\python2.7;C:\Program Files (x86)\python2.7\Lib\;D:\Program Files (x86)\python2.7\DLLs\)完成後,重新執行第3步驟即可安裝成功。
3. annacoda怎麼安裝python模塊
Anaconda是一個和Canopy類似的科學計算環境,但用起來更加方便。自帶的包管理器conda也很強大。
首先是下載安裝。Anaconda提供了Python2.7和Python3.4兩個版本,同時如果需要其他版本,還可以通過conda來創建。安裝完成後可以看到,Anaconda提供了Spyder,IPython和一個命令行。下面來看一下conda。
輸入 conda list 來看一下所有安裝時自帶的Python擴展。粗略看了一下,其中包括了常用的 Numpy , Scipy ,
matplotlib 和 networkx 等,以及 beautiful-soup , requests , flask , tornado
等網路相關的擴展。
奇怪的是,里邊竟然沒有 sklearn ,所以首先裝一下它。
conda install scikit-learn
如果需要指定版本,也可以直接用 [package-name]=x.x 來指定。
conda的repo中的擴展不算太新,如果想要更新的,可能要用PyPI或者自己下載源碼。而conda和pip關聯的很好。使用pip安裝的東
西可以使用conda來管理,這點要比Canopy好。下圖是我用pip安裝的 nltk , jieba 和 gensim 。
我對這個科學計算環境的另一個要求就是能夠多個Python版本並存,尤其是2.x和3.x的並存。這個通過 virtualenv 可以做到。Anaconda也正是通過其實現的。
下面用conda創建一個名叫python2的版本為python2.7的環境。
conda create -n python2 python=2.7
這樣就會在Anaconda安裝目錄下的envs目錄下創建python2這個目錄。
向其中安裝擴展可以:
直接用 conda install 並用 -n 指明安裝到的環境,這里自然就是 python2 。
像 virtualenv 那樣,先activate,然後在虛擬環境中安裝。
這里突然有一個問題,怎樣在IDE中使用創建出來的環境?如果是PyCharm等IDE,直接設置Python安裝目錄就可以了。那spyder呢?其實spyder就是一個Python的擴展,你需要在虛擬環境中也裝一個spyder。
最後就是spyder的主界面。變數查看窗口很好用。
4. 如何在centos上安裝nltk
所有python的軟體,都要放在英文的目錄里,而且目錄名中不要有空格。這是基本原則。有些軟體幸運可以不受限制。但是萬一受限制你就麻煩了。 然後確認你是否是操作系統的管理員。 以及你的安裝版本是否可用。 如果不能用就換老版本安裝。
5. 安裝gensim需要安裝nltk嗎
安裝步驟。
1.下載
(1)python27
(2)numpy182.exe
(3)scipy120.exe
(4)setuptools541.zip
(5)pymssql210.exe,
然後將(1)-(3),(5)先裝上,並在環境變數的path欄位添加上c:\python27
2.將setuptools541.zip解壓縮,然後從cmd窗口進入解壓縮後目錄,輸入命令python
ez_setup.py,開始安裝easy_install
3.在環境變數path中輸入c:\python27\Scripts,這時候可以在cmd中使用easy_install命令了,不過需要注意,一定要把cmd窗口關閉後重新打開才能使用easy_install
4.然後開始安裝gensim,不過使用easy_install -U gensim命令時候總是報錯,錯誤信息如dict object
has no attribute numpy_setup,谷歌一直沒有有價值的信息,後來在gensim官網上看到一條:
you have downloaded and unzipped the tar.gz source for
gensim (or you』re installing gensim from
github), you can
run:
python setup.py install
於是下載下來tar.gz 包,解壓縮後使用上述命令跑了下,成功
第二天,在導入pymssql 時候,idle總是自動重啟,很奇怪,後來更換到早期版本1.0.0,解決問題
6. NLTK 在python上 對文本文件內容進行停詞處理
Nltk是python下處理語言的主要工具包,可以實現去除停用詞、詞性標注以及分詞和分句等。
安裝nltk,寫python一般使用的是集成環境EPD,其中有包管理,可以在線進行安裝。如果不是集成環境,可以通過pip install nltk安裝。
》pip install nltk #安裝nltk
》nltk.download() #彈出一個選擇框,可以按照自己需要的語義或者是功能進行安裝
一般要實現分詞,分句,以及詞性標注和去除停用詞的功能時,需要安裝stopwords,punkt以及
當出現LookupError時一般就是由於缺少相關模塊所導致的
7. nlp和python有什麼關系
nlp的很多工具都有python版本
nlp是研究領域,python是語言工具。
8. nlp連接失敗
由於nltk文件過大,第一次下載失敗後,以後每次打開都顯示「由於連接方在一段時間後沒有正確答復或連接的主機沒有反應,連接嘗試失敗」,讓我很是苦惱。
於是,我按照上面博客所說,到github下載了nltk壓縮包,並解壓。
把packages里的文件復制到D:\Ancoada3\nltk_data文件夾下
(packages里的每個文件夾下還有壓縮包,也都要「解壓到當前文件夾」下)。
在pycharm下運行下面代碼:
from nltk.book import *
登錄後復制
運行以後報錯了:
根據錯誤信息,我到IDLE里輸入以下命令:
>>>import nltk
>>>nltk.download('gutenberg')
登錄後復制
又出現了以下錯誤:
註:如果import nltk提示「找不到」的話,打開cmd,到安裝python的根目錄下輸入pip install nltk。
我按照網上說的關閉代理伺服器,但還是沒有解決。
我又重新看了一次報錯信息,注意到:
發現它是到以上目錄搜索nltk_data,於是我把nltk_data文件夾移動到D盤根目錄下。
pycharm下重新運行from
9. python中的nltk是什麼
nltk(natural
language
toolkit)是python的自然語言處理工具包。自然語言是指人們日常交流使用的語言,如英語,印地語,葡萄牙語等。「自然語言處理」(Natural
Language
Processing
簡稱NLP)包含所有用計算機對自然語言進行的操作,從最簡單的通過計數詞出現的頻率來比較不同的寫作風格,到最復雜的完全「理解」人所說的話,至少要能達到對人的話語作出有效反應的程度。