跳过内容
SBMI Horizontal Logo

Interactive Machine Learning Package

INTRODUCTION:

Statistical natural language processing methods often require large annotated clinical corpora. However, it is time-consuming and costly to create such corpora in the medical domain. Therefore, methods that can efficiently integrate domain knowledge with machine learning processes to quickly build high-quality statistical models with minimum annotation cost would be highly desirable for clinical text processing.

在这项研究中(临床自然语言处理的交互式机器学习方法,授予NO:NLM 2RM01LM010681-05),我们建议调查交互式机器学习(IML)方法以应对这些挑战(由我们确定(在先前的赠款中)和其他人确定在临床NLP中的现场)。我们将为三个相关任务制定IML框架,包括单词感官歧义,命名实体识别和临床项目的主要目标是开发用于临床单词sense sense disamamemanigation(WSD)的IML方法和系统,然后扩展这些方法指定实体识别和临床。

数据集:

一旦发布相关论文,将在项目中生成的数据集被列出并可以下载。

SOFTWARE:

We developed Active LEARNER, an AL-enabled annotation system for NER, which is integrated into CLAMP (https://clamp.uth.edu/)。

演讲:

2016年,AMIA:实时应用积极学习到临床缩写歧义

2015年,AMIA:实时学习临床命名实体识别的实时积极学习研究

2014年,AMIA:在实时环境中应用主动的学习词理解歧义

POSTER ABSTACTS:

  1. Moon,S。Cohen,T。Xu,H。生物医学概念之间的语义相关性和相似性。美国医学信息学协会年度研讨会,2016年。
  1. Wei,Q,Chen,C,Moon,S,Cohen,T,Xu,H。对文档级别命名实体识别的主动学习的研究。协会年度研讨会,2016年。
  1. Wu, Y. Xu, J. Zhang, Y. Xu, H. What Can Neural Networks Learn from Unlabeled Clinical Narratives. American Medical Informatics Association Annual Symposium, 2016. Accepted

会议论文:

  1. 2015, ACL-IJCNLP: Clinical Abbreviation Disambiguation Using Neural Word Embeddings.

出版物列表:

  1. Xu J,Zhang Y,Wang J,Wu Y,Jiang M,Soysal E和Xu H. Uth-CCB:Semeval 2015挑战赛的参与 - 任务14.第9国际语义评估研讨会的会议记录(Semeval 2015),2015年6月4日至5日,科罗拉多州丹佛市第311-314页。 [[NIHMSID: NIHMS947088; PMCID Pending]
  2. Jiang M, Huang Y, Fan JW, Tang B, Denny J, Xu H. Parsing clinical text: how good are the state-of-the-art parsers? BMC Med通知Decis Mak。2015;15 Suppl 1 ((Suppl 1)S2. doi:10.1186/1472-6947-15-S1-S2. Epub 2015 May 20. PMID: 26045009; PMCID: PMC4460747.
  3. Wu Y,Denny JC,Rosenbloom ST,Miller RA,Giuse DA,Song M,Xu H.实时对临床缩写歧义的初步研究。 Appl临床告知。2015年6月3日; 6 ((2)364-74. doi:10.4338/aci-2014-10-RA-0088。PMID:26171081;PMCID:PMC4493336。
  4. Wu Y,Xu J,Zhang Y,Xu H.使用神经词嵌入的临床缩写歧义。计算语言学协会。 BioNLPworkshop, 2015. [[PMCID待处理]
  5. Wu Y,Xu J,Jiang M,Zhang Y,Xu H.对临床文本中指定实体识别的神经单词嵌入的研究。Amia Annu Symp Proc。2015年11月5日; 2015:1326-33。PMID:26958273;PMCID:PMC4765694。
  6. Xu J, Wu Y, Zhang Y, Wang J, Lee HJ, Xu H. CD-REST: a system for extracting chemical-induced disease relation in literature. Database (Oxford). 2016 Mar 25;2016BAW036。 doi:10.1093/database/baw036. PMID: 27016700; PMCID: PMC4808251.
  7. Xu J,Wu Y,Zhang Y,Wang J,Liu R,Wei Q和Xu H. Uth-CCB@Biocreative V CDR任务:识别生物医学文本中化学诱导的疾病关系。第五次生物挑战评估研讨会的论文集2015 [NIHMSID:NIHMS800810;PMCID待处理]
  8. Chen Y,Lasko TA,Mei Q,Denny JC,Xu H.临床文本中指定实体识别的主动学习方法的研究。J BioMed信息。2015年12月 ;58:11-18. doi:10.1016/ j。 JBI 2015.09.010。EPUB 2015年9月15日。PMID:26385377;PMCID:PMC4934373。
  9. Chen Y, Sun J, Huang LC, Xu H, Zhao Z. Classification of Cancer PrimarySites Using Machine Learning and Somatic Mutations. Biomed Res Int. 2015;2015:491502. doi:10.1155/2015/491502. Epub 2015 Oct 11. PMID: 26539502; PMCID: PMC4619847.
  10. Wu Y, Denny JC, Rosenbloom ST, Miller RA, Giuse DA, Wang L, Blanquicett C, Soysal E, Xu J, Xu H. A long journey to short abbreviations - developing an open-source framework for clinical abbreviation recognition and disambiguation (CARD). JAMIA. 2017 Apr 1;24 ((E1)e79-e86. PubMed PMID: 27539197. [[PMCID Journal – In Progress]
  11. Zhang Y,Jiang M,Wang J,Xu H.临床文本的语义角色标记:比较句法解析器和特征。Amia Annu Symp Proc。2017年2月10日; 2016:1283-1292。PMID:28269926;PMCID:PMC5333340。
  12. Hee-Jin Lee, Yaoyun Zhang, Jun Xu, Sungrim Moon, Jingqi Wang, Yonghui Wu and Hua Xu. Uthealth在Semeval-2016任务12:从临床注释中提取时间信息的端到端系统。2016年发表于:第10届国际语义评估研讨会(Semeval-2016);2016年6月16日至17日;美国加利福尼亚州圣地亚哥。 [[NO PMCID]
  13. Lee HJ, Zhang Y, Roberts K, Xu H. Leveraging existing corpora for de-identification of psychiatric notes using 域适应。Amia Annu Symp Proc。2018年4月16日; 2017:1070-1079。PMID:29854175;PMCID:PMC5977650。
  14. Zhang Y, Xu J, Chen H, Wang J, Wu Y, Prakasam M, Xu H. 化学named entity recognition in patents by domain knowledge and unsupervised feature learning. Database (Oxford). 2016 Apr 17;2016BAW049。 doi:10.1093/database/baw049. PMID: 27087307; PMCID: PMC4834204.
  15. Chen Y, Lask TA, Mei Q, Chen Q, Moon S, Wang J, Nguyen K, Dawodu T, Cohen T, Denny JC, Xu H. An active learning-enabled annotation system for clinical named entity recognition. BMC Med通知Decis Mak。2017年7月5日; 17 ((Suppl 2)82。 doi:10.1186/s12911-017-0466-9。PMID:28699546;PMCID:PMC5506567。
  16. Wu Y, Jiang M, Xu J, Zhi D, Xu H. Clinical Named Entity Recognition Using Deep Learning Models. AMIA Annu Symp Proc. 2018 Apr 16;2017:1812-1819. PMID: 29854252; PMCID: PMC5977567.
  17. Ji Z, Zhang Y, Xu J, Chen X, Wu Y, Xu H. Comparing Cancer Information Needs for Consumers in the US and China. Stud Health Technology Inform. 2017;245:126-130. PMID: 29295066; PMCID: PMC5805146.
  18. Wang Y,Zheng K,Xu H,Mei Q.互动医学单词感官歧视通过知情学习。J AM Med告知协会。2018 Jul 1;25 ((7)800-808. doi:10.1093/ jamia/ocy013. PMID: 29584896; PMCID: PMC6658868.
  19. Du J, Zhang Y, Luo J, Jia Y, Wei Q, Tao C, Xu H. Extracting psychiatric stressors使用深度学习从社交媒体自杀。BMC Med通知Decis Mak。2018年7月23日; 18 ((Suppl 2)43. doi:10.1186/s12911-018-0632-8。PMID:30066665;PMCID:PMC6069295。
  20. Lee HJ,Zhang Y,Jiang M,Xu J,Tao C,Xu H.从临床注释中确定时间和事件之间的直接时间关系。BMC Med通知Decis Mak。2018年7月23日; 18 ((Suppl 2)49。 doi:10.1186/s12911-018-0627-5。PMID:30066643;PMCID:PMC6069692。
  21. Li,J.,Zheng,K.,Xu,H.,Mei,Q。 andWang,Y.,2019年6月。最弱的监督的优势:使用类标签的主题分类。在计算语言学协会北美分会2019会议论文集:学生研究研讨会(第22-28页)。beplay苹果手机能用吗 [[PMCID待处理]
  22. Ji Z, Wei Q, Franklin A, Cohen T, Xu H. Cost-sensitive Active Learning for Phenotyping of Electronic Health Records.AMIA Jt Summits Transl Sci Proc。2019年5月6日; 2019:829-838。 eCollection2019. PMID: 31259040; PMCID: PMC6568101
  23. Wei Q, Chen Y, Salimi M, Denny JC, Mei Q, Lasko TA, Chen Q, Wu S, Franklin A, Cohen T, Xu H. Cost-aware active learning for named entity recognition in clinical text.J AM Med告知协会。2019年7月11日。 pii:ocz102. doi:10.1093/ jamia/OCZ102。PMID:31294792;PMCID:PMC6798575
  24. Xu J, Li Z, Wei Q, Wu Y, Xiang Y, Lee HJ, Zhang Y, Wu S, Xu H. Applying a deep learning-based sequence labeling approach to detect attributes of medical concepts in clinical text.BMC MedInform Decis Mak。2019 19 ((补充5)236. PMID:31801529;PMCID:PMC6894107
  25. Wei Q, Ji Z, Li Z, Du J, Wang J, Xu J, Xiang Y, Tiryaki F, Wu S, Zhang Y, Tao C, Xu H. A study of deep learning approaches for medication and adverse drug event extraction from clinical text.J AM Med告知协会。2019年5月28日。 pii:OCZ063。 doi:10.1093/ jamia/ocz063. PMID: 31135882; PMCID: PMC6913210
  26. Wu Y, Warner JL, Wang L, Jiang M, Xu J, Chen Q, Nian H, Dai Q, Du X, Yang P, Denny JC, Liu H, Xu H. Discovery of Noncancer Drug Effects on Survival in Electronic Health Records of Patients With Cancer: A New Paradigm for Drug Repurposing.JCO Clin Cancer Inform。2019年5月 ;3:1-9。 doi:10.1200/cci.19.00001。PMID:31141421;PMCID:PMC6693869

Baidu