
网站首页 > 专利信息
本发明为一种针对生物医学文本多义词的语义消歧方法。主要包括:利用Word2Vec对生物医学文本进行词语的向量化表示,基于双向LSTM模型对词向量语言模型构建上下文句子的向量化表示,再利用句向量空间相似度的关系,结合标签传递法将已有标注医学数据的标签依概率传递给最相似无标注数据,最终结合所有标注数据对生物医学文本进行语义消歧。由于生物医学数据具有专业性强,术语多等特点,人工对医学数据进行处理耗时耗力且易出错,使用本发明则可以大大减少人工标记成本,同时相较于传统的机器学习方法,能有效的提高语义消歧的准确度。
联系电话:028-87659663 028-85404682 028-85460925 邮箱:cdjz617@126.com
办公地址:四川省成都市武侯区科华街10号四川大学国家高新技术孵化平台609
成都川大技术转移集团有限公司
蜀ICP备11025552号-1
Copyright © 2007-2011 技术支持:成都网络公司-三以网络