《基于命名实体识别的医疗文本零水印方案》是一篇探讨信息安全领域中针对医疗文本内容保护的零水印技术的文章。零水印技术是一种在不改变原始文本内容的前提下,通过提取文本特征来创建水印的方法,它具有隐藏性和安全性等优点。在医疗文本的保护中,由于医疗文本含有大量的专业术语,这些术语可以作为构建零水印的有效特征。
文章提出了一种利用双向长短期记忆网络(BiLSTM)和条件随机场(CRF)训练的命名实体识别(NER)模型来处理医疗文本的方案。通过BiLSTM-CRF模型识别医疗文本中的特定实体,如疾病名称、药物名称等,并根据实体类别进行分类。接着,利用识别出的实体名称、实体顺序和实体长度等信息作为构建医疗文本零水印的特征。设计的零水印生成算法能将这些特征转化为隐藏的水印,然后将生成的零水印发送至第三方认证机构进行注册和保存。
为了验证方案的有效性,文章进行了模型性能评估,结果表明命名实体识别技术能够有效地从医疗文本中提取实体。同时,通过一系列攻击实验,包括文本格式攻击以及实体的添加、删除、替换和句子移位攻击,证明了该方案的鲁棒性和可行性。
关键词:文本零水印、医疗文本、命名实体识别、实体特征,强调了本文的核心研究方向。文章的中图分类号为TP309.7,文献标识码为A,DOI为10.13868/j.cnki.jcr.000396,表明这是一篇关于信息安全技术的学术论文。作者团队来自杭州电子科技大学的网络空间安全学院和计算机学院,通信作者为姚晔。
总结来说,这篇研究提供了医疗文本零水印的新方案,利用命名实体识别技术增强对医疗文本的保护,确保医疗数据的安全性和完整性,对于医疗信息管理和信息安全领域具有重要意义。