Nick9Gu
posted on 2009-06-06 12:00 Nick9Gu 阅读(1621) 评论(5) 编辑 收藏 引用 所属分类: {IR-NLP-Data Mining} 、{论文看看看}
看看SIGHAN的论文吧! 回复 更多评论
是哪几篇文章,能给出处吗? 回复 更多评论
你的描述中都没有涉及到特征的选取,更没有涉及模型。而这两个方面对于现在的概率分词是关键中的关键。至于第二个问题,如果满足一阶马尔可夫性质,都可以使用Viterbi解码,解码的复杂度是O(nk^2),这里n是句子的长度,对于简单的分词为2(当然可以更大)。SIGHAN的论文可以在网上找到。 回复 更多评论
http://aclweb.org/anthology-new/sighan.html 回复 更多评论
@argmax对,最近都在看,只是还没更新上去,呵呵~那篇论文相对早的了,没太复杂。 回复 更多评论