2.关于文本主题挖掘算法
2.2 基于线性代数的主题挖掘算法 概要:LSA (latent semantic analysis) 利 用 SVD (singular value
decomposition)的降维方法来挖掘文档的潜在结构 (语义结构),在低维的语义空 间里进行查询和相关性分析,通过SVD等数学手段,使得这种隐含的相关性能够被 很好地挖掘出来.
优点:语义空间的维度类似人类语义理解的维度,便于人类的理解,将表面信息转化为深层次的抽象.
缺点:未能解决文本的“一词多义”问题;使得主题的理解并不直观.
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库基于MB-LDA模型的微博主题挖掘(9)在线全文阅读。
相关推荐: