您好,登錄后才能下訂單哦!
本來想通過python調用Java實現Hanlp的使用,參考文章:http://t.cn/RUrIF7z
##########python可以用easy_install安裝一些軟件############
1.JPype使用介紹
參考:http://michael-paul.iteye.com/blog/1055786
Python 作為一種靈活的軟件開發語言在當今被廣泛使用。在軟件開發過程中,有時需要在 Python 項目中利用既有的 Java 代碼,已達到節省時間和開發成本的目的。因此,找到一個 Python 代碼調用 Java 代碼的橋梁是非常有意義的。 JPype 就是這樣的一個工具,利用它可以使 Python 程序方便的調用 Java 代碼,從而擴充 Python 語言的能力,彌補 Python 語言的不足。本文介紹了如何利用 JPype 整合 Python 程序和 Java 程序的一些基本方法。
下面是一個簡單的 python 程序,通過 JPype 調用 Java 的打印函數,打印出字符串。
清單 1. hello world
import jpype
jvmPath = jpype.getDefaultJVMPath()
jpype.startJVM(jvmPath)
jpype.java.lang.System.out.println( “ hello world! ” )
jpype.shutdownJVM()
運行該例程的時候,getDefaultJVMPath()找不到默認的jvm路徑,檢查發現在命令行下輸入java和javac都是沒問題,而且已經配置好環境變量。找到jpype官方文檔給的例程(http://jpype.sourceforge.net/doc/user-guide/userguide.html),使用說明(http://blog.csdn.net/niuyisheng/article/details/9002926)發現歷程中jdk中jre文件有client文件夾,而現在版本只有server文件夾,然后找一篇文章介紹jvm中client模式和server模式的區別(http://ryxxlong.iteye.com/blog/1696537),發現他們用的都是jdk1.6,而現在的版本是jdk1.8,猜想新版本已經沒有該功能了,把jdk換成1.6版本還是發現沒有client文件夾,放棄在python中調用java包Hanlp,直接在java程序中使用hanlp。
11大Java開源中文分詞器的使用方法和分詞效果對比:
http://my.oschina.net/apdplat/blog/412921?fromerr=jF95Yz4r
2.關于HanLP
HanLP是一個致力于向生產環境普及NLP技術的開源Java工具包,支持:
中文分詞(N-最短路分詞、CRF分詞、索引分詞、用戶自定義詞典、詞性標注),
命名實體識別(中國人名、音譯人名、日本人名、地名、實體機構名識別),
關鍵詞提取,自動摘要,短語提取,拼音轉換,簡繁轉換,文本推薦,依存句法分析(MaxEnt依存句法分析、神經網絡依存句法分析)。
Hanlp的安裝和入門說明:http://hanlp.linrunsoft.com/doc/_build/html/getting_started.html#hanlp
HanLP 中的數據分為 詞典 和 模型 ,其中 詞典 是詞法分析必需的, 模型 是句法分析必需的
官網demo:https://github.com/hankcs/HanLP/tree/master/src/test/java/com/hankcs/demo
文章來源于zhangqiang1104的博客
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。