SDTMIG学习总结.pdf资源-CSDN文库

版权申诉

122 浏览量 2022-01-13 13:49:56 上传评论收藏 1.46MB PDF 举报

SDTM学习总结.pdf 本文档总结了CDISC SDTM学习笔记的要点，涵盖了SDTM数据集与一般数据集的区别、元数据、变量名标准化、变量取值标准化、域定义、域模型、变量筛选、变量顺序、文本数据大小写、缺失值和分类变量等知识点。 SDTM数据集与一般数据集的区别： 1. 数据集个数不同：SDTM数据集按照数据变量的不同来源分为不同的域，而一般的临床试验只有一个或少量几个数据集。 2. 个人记录与事件记录：SDTM数据集每个人的每个事件、每次用药或每次不良反应一条记录，而一般数据集每个人一条记录。 3. 变量的数量减少，记录的条数增多：SDTM数据集每个受试者每次访视每个时间点可能有许多条观测记录。 4. 由于变量之间存在关联，所以SDTM有关联数据集。元数据：元数据是关于数据的数据，按照一定的标准，从信息资源中抽取出相应的特征，组成一个特征元素集合。包括描述一个具体对象所需要的数据项集合、各项数据语义定义、规则和语法定义。元数据标准的制定为提高数据库建库质量，使诗句加工达到规范化、标准化，促进科学数据标准化，加强数据交流。变量名标准化和变量取值标准化：变量名标准化和变量取值标准化是SDTM的核心概念，旨在提供统一的变量名和变量取值标准，确保数据的一致性和可重复性。域定义：域是指一组具有共同主题并在逻辑上相关的观测结果集合。每个域采用唯一的两字符（英文缩写）代码加以区别，如不良时间域（AE，Adverse Event）。域名和变量名是固定不能变的。在所有域中使用SDTM规定的变量标签，研究中只需提交实际采集的域，具体采集哪些数据由研究内容决定，而不是基于SDTM。域模型：域模型可以分为五类：Special-Purpose Domains、General Observation Class（包括Interventions、Events、Findings）、Finding about、Trial Design、Relationship Datasets。每个域中有各种变量，研究者应按需要选择合适的变量。域中的变量按照需求的不同可分为必需变量、预期变量和许可变量。变量顺序：变量顺序是指在General Observation Class中的变量顺序，应先按标识变量、主题变量、修饰语变量到时间变量依次排列，每种变量类型内按照SDTM表中变量描述排序。文本数据大小写：建议大写文字形式递交文本数据（如果是英文的话），长文本或标签文本及已经是大小写的受控术语除外。缺失值：单个数据项缺失以空来表示，如果有—STAT变量和—REASND变量则还需在—STAT中录入NOT DONE，在—REASND中录入原因。分类变量：分类变量包括CAT、SCAT、GRPID、SPID、REFID等，用于受试者之间分组。CAT和SCAT在采集之前就已知，是固有属性，而GRPID通常在数据采集之后由申办者指定。

资源推荐

资源详情

资源评论