为生存而奔跑
::
首页
::
联系
::
聚合
::
管理
271 Posts :: 0 Stories :: 58 Comments :: 0 Trackbacks
留言簿
(5)
给我留言
查看公开留言
查看私人留言
我参与的团队
随笔分类
Algorithm(73)
C#(19)
Design Pattern(16)
Effective STL / C++ (12)
Information Retrival / Data Mining(13)
Java(25)
Linux kernel(2)
MFC(16)
Python(5)
TopCoder(1)
Ubuntu&Linux(56)
技术(12)
无聊(2)
杂(22)
随笔档案
2011年5月 (1)
2011年4月 (6)
2011年3月 (21)
2011年2月 (9)
2011年1月 (12)
2010年12月 (2)
2010年11月 (3)
2010年10月 (6)
2010年8月 (13)
2010年7月 (11)
2010年6月 (7)
2010年5月 (21)
2010年4月 (15)
2010年3月 (16)
2010年1月 (5)
2009年12月 (18)
2009年11月 (18)
2009年10月 (19)
2009年9月 (8)
2009年8月 (42)
2009年7月 (15)
2009年4月 (3)
相册
Girl
搜索
积分与排名
积分 - 323389
排名 - 74
最新评论
1. re: Invoke与BeginInvoke
讲得很好,清晰明了
--YJJ
2. re: Invoke与BeginInvoke
讲的这么好, 为啥没有人顶呢
--zhouandke
3. re: 数组分割问题
转载请注明
--呵呵
4. re: HDU 3415 单调队列
话说,sum数组为什么只开10W就能过,如果n=100000,k=100000,明显要开20W啊
--KissLL
5. re: GDB 单步调试
文章太强大了。
--kangear
阅读排行榜
1. GDB 单步调试(33279)
2. Emacs教程(20776)
3. 解决“windows无法连接到选定网络 网络可能不在区域中”(11443)
4. Invoke与BeginInvoke(9556)
5. Eclipse下搭建SWT开发环境(7937)
评论排行榜
1. C/C++没有数组(12)
2. HDU 3415 单调队列(8)
3. Ubuntu Linux常见中文输入法汇总(7)
4. word画图里自选图形里面的连接符不能用(5)
5. VMware Tools installation cannot be started manually while Easy Install is in progress.(3)
NLP常用工具
各种工具包的有效利用可以使研究者事半功倍。
以下是NLP版版友们提供整理的NLP研究工具包。
同时欢迎大家提供更多更好用的工具包,造福国内的NLP研究。
*NLP Toolbox
CLT
http://complingone.georgetown.edu/~linguist/compling.html
GATE
http://gate.ac.uk/
Natural Language Toolkit(NLTK)
http://nltk.org
MALLET
http://mallet.cs.umass.edu/index.php/Main_Page
OpenNLP
http://opennlp.sourceforge.net/
*English Stemmer
Snowball
http://snowball.tartarus.org/
*English POS Tagger
Stanford POS Tagger
http://nlp.stanford.edu/software/tagger.shtml
TreeTagger
http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/
TnT
http://www.coli.uni-saarland.de/~thorsten/tnt/
*English&Chinese Parser
Stanford Parser
http://nlp.stanford.edu/software/lex-parser.shtml
Berkeley Parser
http://nlp.cs.berkeley.edu/Main.html#Parsing
*English Keyphrase Extractor
KEA
http://www.nzdl.org/Kea/index_old.html
*English Name Entity Recognizer
Stanford NER
http://nlp.stanford.edu/software/CRF-NER.shtml
*Chinese Word Segmentator
中科院ICTCLAS
http://www.nlp.org.cn/project/project.php?proj_id=6
Stanford Word Segmenter
http://nlp.stanford.edu/software/segmenter.shtml
*Topic Modeling Tools
Matlab
http://psiexp.ss.uci.edu/research/programs_data/toolbox.htm
GibbsLDA++
http://gibbslda.sourceforge.net/
GLDA
http://code.google.com/p/glda/
*Conditional Random Fields
FlexCRFs
http://flexcrfs.sourceforge.net/
含有MPI并行版本。
CRF++
http://crfpp.sourFceforge.net/
CRF Package
http://crf.sourceforge.net/
CRF Matlab
http://www.cs.ubc.ca/~murphyk/Software/CRFall.zip
CRFSuit
http://www.chokkan.org/software/crfsuite/
SGD with CRF
http://leon.bottou.org/projects/sgd
HCRF
http://sourceforge.net/projects/hcrf/
*Support Vector Machine
LIBSVM
http://www.csie.ntu.edu.tw/~cjlin/libsvm/
LIBLINEAR
http://www.csie.ntu.edu.tw/~cjlin/liblinear/
Pegasos
http://www.cs.huji.ac.il/~shais/code/index.html
*Search Engines
Lucene
http://lucene.apache.org/
中科院FirteX
http://www.firtex.org/
*Machine Learning and Data Mining Toolbox
Weka
http://www.cs.waikato.ac.nz/ml/weka/
posted on 2010-10-08 09:01
baby-fly
阅读(5052)
评论(0)
编辑
收藏
引用
所属分类:
Information Retrival / Data Mining
只有注册用户
登录
后才能发表评论。
【推荐】100%开源!大型工业跨平台软件C++源码提供,建模,组态!
相关文章:
转自水木NLP,duckyaya版主总结的关于文本分类的若干资源。
NLP常用工具
List of English stop words
[Lucene.Net] 基本用法
WordNet-based semantic similarity measurement
Java WordNet API
Lucene索引中term的频率
【转】Lucene 搜索引擎倒排索引原理
Querying DBpedia
实战 Lucene,第 1 部分: 初识 Lucene 转自IBM
网站导航:
博客园
IT新闻
BlogJava
知识库
博问
管理
Copyright @ baby-fly
Powered by:
.Text
and
ASP.NET
Theme by:
.NET Monster