背景技术在生物医学信息提取中,事件提取起着至关重要的作用。 生物事件用于描述生物实体(例如蛋白质和基因)之间的动态效应或关系。 事件提取通常分为触发检测和参数识别。 触发检测的性能直接影响事件提取的结果。 通常,传统方法用于将触发检测作为分类任务来解决,以及使用机器学习或规则方法来构造触发器,从而构造许多功能来改善分类结果。 此外,分类模型仅识别由单个单词组成的触发器,而对于多个单词,结果并不令人满意。结果我们模型的语料库是MLEE。 如果我们仅使用生物医学LSTM和CRF模型而没有其他功能,则F分数将达到约78.08%。 将实体与词性(POS)进行比较,我们发现实体特征更有助于提高检测性能,F评分可能达到80%。 此外,我们还对其他三个语料库(BioNLP 2009,BioNLP 2011和BioNLP 2013)进行了实验,以验证模型的一般性。 因此,F分数可以达到60%以上,优于比较实验。结论基于序列注释模型的触发器识别方法不需要初始的复杂特征工程,只需要简单的标记机制即可完成训练。 因此,与其他传统模型相比,我们模型的泛化性更好。 其次,该方法可以识别多词触发器,从而提高了触发