- -
1、 简述大数据的来源与数据类型
大数据的来源非常多,如信息管理系统、网络信息系统、物联网系统、科学实验系统等,其数据类型包括构造化
数据、半构造化数据和非构造化数据。
2、大数据产生的三个阶段
〔1〕被动式生成数据
〔2〕主动式生成数据
(3) 感知式生成数据
3、大数据处理的根本流程
1.数据抽取与集成
2.数据分析
3.数据解释
4、大数据的特征
4V1O Volume,Variety,Value,Velocity,On-Line
5、适合大数据的四层堆栈式技术架构
6、大数据的整体技术和关键技术
大数据的整体技术一般包括:数据采集、数据存取、根底架构、数据处理、统计分析、数据挖掘、模型预测和结
果呈现等。
大数据处理关键技术一般包括:大数据采集、大数据预处理、大数据存储及管理、开发大数据平安大数据分析及
挖掘、大数据展现和应用〔大数据检索、大数据可视化、大数据应用、大数据平安等〕。
7、新一代数据体系的分类
新一代数据体系中,将传统数据体系中没有考虑过的新数据源进展归纳与分类,可将其归纳到线上行为数据与容
数据两大类别。
8、EDC 系统的定义
临床试验电子数据采集〔Electric Data Capture,EDC〕系统,在临床试验中的应用可以有效解决纸质 CRF 存在的问
题。EDC 是通过互联网从试验中心〔Sites〕直接远程收集临床试验数据的一种数据采集系统。
9、EDC 系统的根本功能
数据录入、数据导出、试验设计、编辑检查、操作痕迹、系统平安、在线交流、医学编码和支持多语言。
10、EDC 系统的优点
〔1〕提高了临床研究的效率,缩短了临床研究周期
. -可修编-