
网站首页 > 专利信息
本发明公开了一种基于加权LDA和改进Single‑Pass聚类算法的热点话题检测方法,包括以下步骤:对文本数据进行预处理,包括中文分词、去除停用词和特征词加权;利用加权LDA主题模型对文本数据进行建模,通过挖掘其中的隐主题信息实现特征降维,并对向量化的结果进行过滤去噪;将经特征词加权的LDA主题模型处理后的文本向量化结果使用改进Single‑Pass聚类算法进行聚类;利用话题簇规模和话题簇紧密度计算话题簇的热度值,识别热点话题。本发明检测方法具有算法复杂度低、对文本输入时间顺序依赖性较低等优点。
联系电话:028-87659663 028-85404682 028-85460925 邮箱:cdjz617@126.com
办公地址:四川省成都市武侯区科华街10号四川大学国家高新技术孵化平台609
成都川大技术转移集团有限公司
蜀ICP备11025552号-1
Copyright © 2007-2011 技术支持:成都网络公司-三以网络