跳过内容
SBMI水平徽标

通过领域知识和无监督功能学习,专利中的化学命名实体识别

此页面提供了高管专利文本的化学命名实体识别系统的文件。

该系统是使用由专利文本(Chemdner-Patents)释放的合并培训和开发数据集培训的,该曲目由2015年Biocreative V Challenge(Chemptents)培训。http://www.biocreative.org/tasks/biocreative-v/track-2-chemdner/)。我们的参与者系统在Chemdner-Patents挑战中取得了最高的表现。该系统基于条件随机场的算法。除了命名实体识别的常见语言特征外,还采用了域知识和无监督学习(单词嵌入和棕色聚类)产生的特征。

带有JAR文件的同一文件夹中的readme.txt文件提供了详细的用法信息。

参考:

Zhang Y,Xu J,Wang J,Wu Y,Parkasam M,Xu H. Uth-CCB@ Biocreative v Track 2:在专利中识别化学实体。在2015年第五次生物挑战评估研讨会的论文集。

Baidu