三、实验过程
1. 提取数据
定义一个函数 extract_data_xml 用于从输入的 xml 文件中提取所需的数据。
在 从 每 个 输 入 xml 文 件 中 提 取 所 需 数 据 之 后 , 将 其 存 储 在 有 序 字 典
extracted_data 中。然后将此字典传递给 elasc_index 函 数 , 该 函 数 将 索 引
Elascsearch 中的数据。
处理 clinicaltrials 中的数据集,从中读取数据,并将数据存储在有序字典中,
键 作 为 字 段 名 , 值 作 为 提 取 的 数 据 , 提 取 的 字 段 有 : Brief
Title 、 Descripon 、 MeSH Terms 、 Inclusion
Criteria、brief_summary、condion、minimum_age、maxmum_age
从 xml 文件中读取数据,保存在 input_#les 变量中,代码如下:
提取相关信息,并将数据保存在字典 extracted_data 中,代码如下:
评论0
最新资源