继建立同义词库后的新任务,读文献,然后找出问题的解决方案。几篇文献都是研究句子与句子的相似度计算,我们的关键是词语与句子的相似度计算。据说FAQ是自然语言处理领域研究的热点。看了几篇论文,感觉都是大同小异。
因为是第一次接触这些东西,所以有很多陌生的词汇,就自己动手查了查。
关于HowNet,见http://www.keenage.com/zhiwang/c_zhiwang.html
FAQ自动问答系统的核心问题是如何快速地将客户所提问题与FAQ数据库的问题比较,进而确定与其最相似的问题,如果有,则将对应的答案作为结果回复给客户。
FAQ系统结构图
相似度流程的计算就是先计算义原相似度,然后是概念相似度,接着词语相似度,最后就是句子相似度。
/Files/sunrise/相似度.doc这里公式不能显示就相似度计算就插在附件中了。
FAQ差不多就进行到这里了。程序小白的小白文章,小白将继续小白下去。