SDTMIG学习总结.pdf
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
SDTM学习总结.pdf 本文档总结了CDISC SDTM学习笔记的要点,涵盖了SDTM数据集与一般数据集的区别、元数据、变量名标准化、变量取值标准化、域定义、域模型、变量筛选、变量顺序、文本数据大小写、缺失值和分类变量等知识点。 SDTM数据集与一般数据集的区别: 1. 数据集个数不同:SDTM数据集按照数据变量的不同来源分为不同的域,而一般的临床试验只有一个或少量几个数据集。 2. 个人记录与事件记录:SDTM数据集每个人的每个事件、每次用药或每次不良反应一条记录,而一般数据集每个人一条记录。 3. 变量的数量减少,记录的条数增多:SDTM数据集每个受试者每次访视每个时间点可能有许多条观测记录。 4. 由于变量之间存在关联,所以SDTM有关联数据集。 元数据: 元数据是关于数据的数据,按照一定的标准,从信息资源中抽取出相应的特征,组成一个特征元素集合。包括描述一个具体对象所需要的数据项集合、各项数据语义定义、规则和语法定义。元数据标准的制定为提高数据库建库质量,使诗句加工达到规范化、标准化,促进科学数据标准化,加强数据交流。 变量名标准化和变量取值标准化: 变量名标准化和变量取值标准化是SDTM的核心概念,旨在提供统一的变量名和变量取值标准,确保数据的一致性和可重复性。 域定义: 域是指一组具有共同主题并在逻辑上相关的观测结果集合。每个域采用唯一的两字符(英文缩写)代码加以区别,如不良时间域(AE,Adverse Event)。域名和变量名是固定不能变的。在所有域中使用SDTM规定的变量标签,研究中只需提交实际采集的域,具体采集哪些数据由研究内容决定,而不是基于SDTM。 域模型: 域模型可以分为五类:Special-Purpose Domains、General Observation Class(包括Interventions、Events、Findings)、Finding about、Trial Design、Relationship Datasets。每个域中有各种变量,研究者应按需要选择合适的变量。域中的变量按照需求的不同可分为必需变量、预期变量和许可变量。 变量顺序: 变量顺序是指在General Observation Class中的变量顺序,应先按标识变量、主题变量、修饰语变量到时间变量依次排列,每种变量类型内按照SDTM表中变量描述排序。 文本数据大小写: 建议大写文字形式递交文本数据(如果是英文的话),长文本或标签文本及已经是大小写的受控术语除外。 缺失值: 单个数据项缺失以空来表示,如果有—STAT变量和—REASND变量则还需在—STAT中录入NOT DONE,在—REASND中录入原因。 分类变量: 分类变量包括CAT、SCAT、GRPID、SPID、REFID等,用于受试者之间分组。CAT和SCAT在采集之前就已知,是固有属性,而GRPID通常在数据采集之后由申办者指定。
剩余26页未读,继续阅读
- 粉丝: 0
- 资源: 9万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助