国家中医药管理局办公室关于印发《国家中医临床研究基地中医医疗与临床科研信息共享系统建设基本要求》(试行)的通知
各省、自治区、直辖市卫生厅局、中医药管理局,局各直属单位,北京中医药大学,各国家中医临床研究基地建设单位,国家中医临床研究基地督导组成员:
为创新中医药临床科研组织模式,构建适合中医自身特点的研究方法,进一步提高国家中医临床研究基地中医临床研究的能力和效率,按照2011年国家中医临床研究基地业务建设工作的总体部署,我局组织制定了《国家中医临床研究基地中医医疗与临床科研信息共享系统建设基本要求》(试行)(以下简称《要求》),现印发给你们,并就有关事项通知如下:
一、请各基地建设单位紧密结合本单位实际,认真进行调查研究,按照《要求》内容,制定详细的工作计划,确定具体工作目标和实施步骤,切实落实工作责任,加强共享系统建设,并于7月20日前将有关安排报我局科技司。
二、请各基地及时与中国中医科学院联系,共同研究推进信息共享系统建设。在方案实施过程中有何意见和建议,请及时反馈我局科技司。
三、基地业务建设督导组将依据《要求》适时对各基地落实情况进行督导检查,务求2012年年底前至少要在重点病种研究方面应用共享系统。
四、联系人及电话:
科技司中医科技处(基地办公室)
王思成 陈 军(010-59957712)
中国中医科学院
谢 琪(010-64014411转2401)
二○一一年七月六日
国家中医临床研究基地中医医疗与临床科研信息共享系统建设基本要求
(试行)
总则
第一条 为了加强和推进国家中医临床研究基地(以下简称“基地”)业务建设,充分利用临床实践中产生的大量信息开展高质量研究,根据《重点中医医院建设与发展规划》和《中医临床研究基地建设指导意见》,特制定中医临床研究基地中医医疗与临床科研信息共享系统建设基本要求(以下简称“基本要求”)。
第二条 基地中医医疗与临床科研信息共享系统(以下简称“共享系统”)是基于临床科研一体化理念,遵循临床流行病学与循证医学的原则,充分利用现代信息技术,在标准化、规范化的基础上,充分整合计算机、数理统计、数据挖掘、人工智能等方法构建的中医临床研究的技术平台。
第三条 共享系统建设的目标是遵循中医临床研究特点,针对基地利用临床实际数据开展研究中的关键技术问题,构建临床数据采集、管理与利用的技术支撑体系,实现医疗与临床科研信息共享,整体提高基地中医临床研究能力和效率,使基地成为在国家中医药服务和科技创新体系中,发挥龙头作用的现代化、高水平中医临床研究机构。
第四条 基地共享系统建设应由医院主要领导负责,配备专职人员,安排专项经费,统筹规划,协同推进。
建设原则
第五条 统筹规划,分步实施。国家中医药管理局提出共享系统建设的基本要求与技术指南;各基地根据医院信息化的状况,作出共享系统建设的实施方案并组织分步实施。最终形成能够满足基地临床研究需求的共享系统。
第六条 需求主导,务求实效。以重点病种的临床研究需求为导向,充分利用信息技术、计算机技术与数理统计等方法,为形成高质量、国内外同行认可的临床研究数据提供技术支撑。
第七条 整合资源,优化配置。共享系统建设应以医院信息系统为基础,与检验、图像等管理系统等紧密结合,充分利用已有资源,优化配置,系统集成,技术共享,避免出现新的信息孤岛。
组织与实施
第八条 国家中医药管理局与各基地所在省级管理部门在提出总体要求的基础上,将定期对各基地共享系统建设进度与质量进行检查。
第九条 由国家中医药管理局成立的国家中医医疗与临床科研信息共享系统专家指导小组,为基地共享系统建设的实施方案把关,为系统建设提供技术咨询和业务指导。
第十条 中国中医科学院为基地提供共享系统的共性产品及技术服务;参加项目的整体部署和人员培训;参与并指导制定建设规划方案;不断深入研究并解决共享系统的关键技术问题。
第十一条 基地应按照专家组审定的实施方案和进度计划组织实施,确保基地共享系统建设任务按期完成。
第十二条 医院应加强信息系统建设,实现与共享系统有机融合,确保共享系统在临床中的有效应用,形成院内数据共享,并充分利用海量临床数据开展高层次的临床研究。
标准化与知识产权
第十三条 信息标准化工作是共享系统建设的重要组成部分,各基地应有固定人员1-2名,负责信息标准应用与质量保障等相关工作。
第十四条 在基地共享系统建设中应积极推行相关的国家和行业标准,执行由国家中医药管理局组织专家编制的“基地信息化建设标准体系表”,保证共享系统的规范化建设。
第十五条 各基地要不断的完善基地重点病种及其相关方面规范术语的应用体系,严把质量关,努力形成高质量的临床数据。
第十六条 严格执行国家知识产权保护规定,建立数据库、数据仓库使用权限及管理办法,保护相关单位、部门和个人的知识产权。
共享系统的功能要求
第十七条 中医医疗与临床科研信息共享系统包括临床术语集与术语字典、数据采集系统、数据转换存储与管理、数据仓库与数据挖掘分析等部分。各部分有机联系,共同完成临床病历书写与管理以及高质量临床数据产生与利用的功能。
(一)临床术语集与术语字典
1、中医临床术语集是中医、西医规范术语有机汇集,是临床术语字典、临床数据挖掘利用的基础和规范术语的主要来源和支撑;也是共享系统建设可持续发展的基础。术语字典是在数据采集系统中,中医临床规范术语应用的工具,是临床数据采集模板与病历书写的术语来源。
共享系统建设,要求采用统一的中医临床术语集和主要来自中医临床术语集的术语字典。
2、各基地要根据临床医疗与研究的需求,为术语的不断充实、完善提供支持。
(二)临床数据采集
1、为了保证临床研究数据的质量,采集系统将采取以结构化数据采集为主要,结合非结构化的文本采集,能够同时满足中医临床医疗业务和科研数据的同步采集需求。
2、采集系统必须符合卫生部《电子病历系统功能规范(试行)》、国家中医药管理局《中医电子病历系统功能规范(试行)》等规范的要求。
3、采集系统支持全面、规范、实时采集多源、多媒体、多格式的临床信息(文字、表格、图片、音频、视频等)。
4、采集系统能够与医院his、lis、pacs等系统集成融合,实现数据共享。
5、采集系统数据能安全导出,提供研究分析所需的信息字段,与数据转储、数据挖掘工作有机结合,融为一体。
6、具备病历质量与临床研究数据质量监测的功能。
(三)数据转换存储与管理
1、各类原始数据根据数据源特征,通过数据抽取、转换、加载系统(etl)等工具软件全面、实时、动态进行数据的清理、批量汇总、数据整理和数据转换等任务,并将数据自动导入到数据仓库中。
2、根据中医特点统一建模,构建中医临床数据仓库。可进行大规模数据的批量处理,实现数据的整合、转换,以及检索查询、可视化展示。
3、具有合理权限管理、隐私保护及知识产权保护功能。
(四)数据分析挖掘
1、具备面向重点病种的专用的挖掘分析功能,支持各种临床研究的数据挖掘分析。
2、支持统计分析与数据挖掘的基本工具,如sas、spss、weka等。
运行与维护
第十八条 基地建立数据中心,全面负责共享系统的运行和共享数据库的维护管理,按照国家有关要求完成共享数据的整理和汇总上报任务,为基地中医临床研究提供信息技术支持。中心应有专用工作场地、设备和专职人员。每个重点病种配置数据挖掘人员1-2名;运行维护人员1-2名。
第十九条 国家中医药管理局建立国家中医临床研究数据中心,负责国家中医临床研究数据库网络的建设和运行管理,承担数据的汇总和分析研究任务,为各基地数据中心提供技术支持。建立国家中医临床研究数据中心和各临床基地的信息双向流通机制,以及基地之间信息交换、共享的技术和管理规范。
附则
第二十条 本基本要求由国家中医药管理局科技司负责解释。
第二十一条 本基本要求自发布之日起试行。
第二十二条 基地协作单位可参照本基本要求执行。
附件:
中医医疗与临床科研信息共享系统项目实施指南
(试行)
1组织实施管理
1.1概述
1.2实施保障
1.3建设组织与分工
1.4条件建设要求
1.4.1硬件要求
1.4.2 软件要求
2 中医临床术语
2.1技术要求
2.2 实施要求
2.2.1 技术路线
2.2.2 实施方案
2.3 考核与验收
3 数据采集系统
3.1 技术要求
3.1.1基本要求
3.2实施要求
3.2.1实施筹备
3.2.2实施步骤
3.3考核与验收
3.3.1模板验收
3.3.2系统验收
3.3.3数据质量要求
4. 数据仓库及挖掘分析
4.1技术要求
4.1.1基本要求
4.1.2 扩展要求
4.2实施要求
4.2.1遵循原则
4.2.2基础设施要求
4.2.3实施步骤
4.2.4任务分工
4.3考核与验收
4.3.1 平台验收
4.3.2 成果验收
4.4基础设施要求
4.4.1 硬件
4.4.2 软件
4.4.3 数据仓库软件部署
1 组织实施管理
1.1概述
“中医医疗与临床科研信息共享系统”(以下简称“共享系统”)是基于临床科研一体化理念,利用现代信息技术,在标准化、规范化的基础上,充分整合计算机、数理统计、数据挖掘、人工智能等方法构建的中医临床研究的技术平台。
根据《中医临床研究基地建设指导意见》和《中医临床研究基地业务建设要求》,构建中医临床与科研信息共享系统是中医临床研究基地业务建设的重要任务,是落实国家中医药管理局关于基地建设“一体两翼”建设任务的重要举措。为了指导、规范和推进各基地中医医疗与临床科研信息共享系统建设,特制定《中医医疗与临床科研信息共享系统项目实施指南》(简称“指南”)。
1.2实施保障
国家组织开展共享系统的规范研究,制定相关技术标准规范和建设要求;基地在国家统一指导和协调下,按照相关要求开展共享系统建设。国家中医药管理局与各基地所在省级管理部门,定期对各基地共享系统建设进度与质量进行检查。
基地应当把共享系统建设纳入基地建设总体方案,统筹规划,与基础设施建设、学科专科建设等协同推进,一并落实。
1.3建设组织与分工
(1)国家中医药管理局建立国家中医医疗与临床科研信息共享系统专家指导小组,负责基地共享系统建设中相关标准的制定、数据共享协调、运行管理咨询和科研方法指导;搭建中医临床科研信息学术交流平台,定期组织开展中医临床研究的相关学术活动与技术交流,培养高素质中医临床研究人才。
(2)基地要成立共享系统建设领导小组,设置相应机构,配备专职负责人员。领导小组组长由医院主要领导担任,成员应当包括重点研究病种负责人以及科研、信息、医务等职能科室负责人。领导小组负责制定基地共享系统建设规划;协调、组织重点研究病种技术标准体系制定、人员技术培训、硬件建设、软件系统安装、信息系统整合及运行调试等方面建设任务。
(3)重点研究病种须配备参与病种研究且熟悉术语标准制定规范的固定人员,负责梳理归集与本病种相关的名词术语,提出和更新重点病种相关的术语字典,制定、维护和更新重点病种的病历模板。
(4)基地科研管理或医务部门须建立科研数据质量控制体系,规范和监督重点病种的数据采集过程;指导重点病种术语、模板和标准体系的建立。配备熟练掌握中医理论、具有临床科研数据的分析、挖掘能力的临床科研方法学研究人员,开展重点病种疗效评价、诊疗方案优化与评价、名老中医经验总结和传承研究等工作。
(5)基地信息管理部门须有熟练掌握医院his、lis、pacs等系统安全运行与维护的专职人员;配备掌握delphi语言等软件编程语言和oracle等专业数据库开发应用能力的固定人员,负责数据审核、系统维护、传输数据以及数据导出等。
(6)基地可根据实际需要,设立共享系统建设专家技术组,为共享系统建设提供技术咨询、方案审查和质量评定等。
(7)中国中医科学院深入研究共享系统关键技术问题,为基地提供共性产品及技术服务,参加项目的整体部署和人员培训,指导制定建设规划与方案。
1.4条件建设要求
1.4.1硬件要求
共享系统是在整合医院lis,pace,his,ris等信息集成网络的基础上的应用系统。医院的硬件系统如中心机房配置、综合布线系统、网络建设、数据库及应用服务器、存储系统等的配置应符合国家(或国际)相关建设规范及技术标准,核心设备需满足中医临床研究的需求,并保证基地信息平台的安全运行。
1.4.2 软件要求
共享系统建设的应用软件主要包括:临床数据采集系统、数据库管理系统、数据仓库及分析软件、集成软件等。临床数据采集系统是基于结构化的中医电子病历系统,执行国家中医药管理局关于中医医院信息化建设功能规范和电子病历的各项规定。其他应用系统根据实际需要为共享系统的接入提供开放接口,符合中医临床研究的需求,保证基地共享系统的正常运行。
2 中医临床术语
中医临床术语集是中医、西医规范术语有机汇集,是临床术语字典、临床数据挖掘利用的基础和规范术语的主要来源和支撑。术语字典是在数据采集系统中,中医临床规范术语应用的工具,是临床数据采集模板与病历书写的术语来源。共享系统建设,要求采用统一的中医临床术语集和主要来自中医临床术语集的术语字典。
2.1技术要求
重点病种临床术语字典为共享系统提供支撑服务。主要体现在四个方面:支持数据采集、支持数据检索、支持挖掘模型的形成、支持病历模板的生成。
(1)支持数据采集
提供临床数据采集的便捷性及灵活性,同时排除冗余信息。
(2)支持数据检索
支持数据检索调用,可以根据实际需要检索术语,能将所需术语及术语的各种属性包括同义术语、编码等检索出来。
(3)支持挖掘模型的形成
支持数据挖掘模型的形成,为后期数据整理、临床数据仓库建立以及数据挖掘研究提供服务,保证数据挖掘结果的真实性及准确性。
(4)支持病历模板的生成
病历模板是采集系统的核心,重点病种临床术语字典应支持病历模板的生成。
2.2 实施要求
2.2.1 技术路线(略)
2.2.2 实施方案
(1)中医临床术语集的补充
中国中医科学院已研制了中医临床术语集,作为共同的资源提供给各基地应用(各基地只有使用权,版权属于中国中医科学院)。在实施过程中将根据各基地的使用情况进行术语的补充。
(2)重点病种临床术语字典的形成
①根据基地重点病种研究的典型病历与相关文献,收集病种常用的中医术语,建立统一的重点病种临床术语字典表结构。
②将各重点病种的临床常用术语及其属性从中医临床术语集抽取到重点病种临床术语字典。
③重点病种临床术语字典的术语应主要来源中医临床术语集,若需增加可根据规范纳入。
(3)重点病种临床术语字典的维护
①重点病种临床术语字典新增术语的审核。
-新增术语进入术语审核表。
-审核表内设有术语增加的时间、审核人、审核的时间、审核的结果。
-审核人员必须是是给予权限的重点病种研究专家。
-对纳入到重点病种临床术语字典的新术语给予标识。
②重点病种临床术语字典的删改及修订 。
该字典的删改及修订必须是给予权限的重点病种研究专家,同时保留删改及修订的痕迹。
2.3 考核与验收
重点病种临床术语字典主要来自中医临床术语集,形成术语字典增加、删除、修订的机制与模式。
3 数据采集系统
3.1 技术要求
3.1.1基本要求
(1)提供满足临床科研病历数据采集工具
采集系统以结构化电子病历为主要工具,能够满足中医临床医疗业务和科研数据的同步采集需求。
(2)符合电子病历规范要求
采集系统必须符合卫生部《电子病历系统功能规范(试行)》、国家中医药管理局《中医电子病历系统功能规范(试行)》等规范的要求。
(3)具备全面实时采集临床信息功能
采集系统支持全面、规范、实时采集多源、多媒体、多格式的临床信息(文字、表格、图片、音频、视频等)。
(4)与其他医疗系统间数据共享
采集系统能够与医院his、lis、pacs等系统集成融合,实现数据共享。
(5)与数据挖掘系统有机结合
采集系统数据能安全导出,应与数据转储、数据挖掘工作有机结合,融为一体。
(6)科研病历监测功能
具备科研病历质量监测功能,有效的核查、核对科研病历数据信息。
3.2实施要求
3.2.1实施筹备
(1)系统实施范围确定
确定基地重点病种研究的科室。
(2)功能模块选择
各基地对采集系统提出应用需求,项目实施组对需求进行合理分析,选用适合该单位采集系统实施的功能模块。
(3)基础设施要求
①基地软硬件设备到位及网络的畅通是结构化电子病历实施最基本要求,项目实施组入场前基地单位必须保证软硬件设备到位,各部门科室网络畅通。
②提供用于采集系统、数据挖掘分析系统专用服务器各一台,满足临床、科研病历数据采集、挖掘的实际应用需求。
③应选用当前主流数据库管理软件如oracle等。
(4)人员要求
①基地单位需要建立专职团队配合采集系统实施组完成实施工作。
②实施期间以实施组人员为主,医院工作人员协助,基地科研人员逐步熟悉工作流程和方法,为以后其它科室实施做好基础和准备。
(5)系统接口设计要求
①系统接口方式
采集系统接口方案根据医院的实际情况或地区的要求制定,但方案需求要在实施组入场前明确。
②组织协调
医院应协调该院信息系统(his/lis/pacs/ris等)与采集系统间的数据交换工作。采集系统能够与医院his、lis、pacs等系统集成融合,实现数据共享。
(6)系统实施方案与实施计划
①调研报告
项目实施组进行基地项目调研报告书准备,包括医院项目领导小组成员、医院信息化现状、医院硬件建设情况(如机房、服务器等)、医院重点科室及临床科室情况、病历结构及模板格式、工作场所情况等。
②接口标准方案
确定采集系统与his/lis/pacs等系统的接口方案
③制定实施方案与实施计划
项目实施组根据调研书、接口工作方案,制定基地单位整体实施方案与实施计划。
3.2.2实施步骤
(1)项目启动会准备
会议议程、参加人员、会议通知、会议地点等。
(2)环境检查
检查服务器、客户端环境基础搭建环境(如操作系统、杀毒软件等)工作是否完成、客户端及网络环境等是否能连通。
(3)接口开发工作讨论
讨论接口开发的方案及细节内容,确定接口开发计划。
(4)项目启动会召开
领导小组组织,动员相关各个部门配合项目实施组进行工作,明确下一步的工作计划。
(5)科室调研
对医院的情况进行初步调研,对科室进行调研,收集重点病种及临床科室病历模板资料。
(6)接口开发与测试
根据商定的接口方案及计划进行接口开发工作。环境搭建与接口开发工作完成后,进行实际联调测试。
(7)模板制作
①重点病种临床术语的准备
参照中医临床术语部分
②模板生成
严格按照卫生部发布《电子病历系统功能规范(试行)》及国家中医药管理局《中医电子病历系统功能规范(试行)》等规范的要求进行模板制作。
③模板维护
成立模板维护小组,专门负责重点病种科研模板及其它病种模板的整理制作与维护工作。负责增加、删改调整病历模板中元素内容,达到临床与科研应用要求。
(8)实施计划确认
项目负责人对实施整体计划和阶段计划进行确认,共同配合执行计划
(9)环境搭建
安装服务器、客户端环境,并进行调试
(10)科室模板整理
根据科室提供病历模板需求及格式进行模板制作、整理、调整、测试工作,并与科室及院方负责人进行模板确认
(11)培训
准备好培训环境、材料,对科室进行采集系统应用培训。包括各功能模块应用、常见问题处理、科研数据分析等培训内容。采取循环式培训。
(12)系统使用
①正式运行采集系统,将实际入院病人的病历内容按照《电子病历书写规范》要求填写。
②重点病种数据采集关键点,按照病历模板设定内容进行结构化采集,病历采集信息根据结构化程度定期进行解析并审核,审核内容为前台采集数据与解析后数据的一致性。
③基地数据中心承担基地临床与科研数据汇总、解析任务,负责向国家中医临床研究数据中心上传采集数据信息。
(13)系统维护
①对电子病历应用常见问题进行收集并整理。
②定期检查服务器、客户端系统运行情况。
3.3考核与验收
3.3.1模板验收
应遵循如下原则:
(1)模板格式完全符合国家《电子病历书写规范》的标准。
(2)病历模板内容遵循科研目的及需求,可有效完成科研病历数据采集。
(3)病历模板中标准化术语来源于术语标准知识库,可实现病历内容与后台术语库间的关联。
(4)保证病历模板由五类基本元素组成:数值型、日期型、选择型、字典型、文本型。
(5)重点病种的病历数据需测试几十份,病历解析完成后进行病历数据字段结构核查。
3.3.2系统验收
系统在重点病种数据采集方面已达到目标要求,同时也完成了本地化的改造工作,运行稳定,系统验收合格。
3.3.3数据质量要求
病历模板在临床实际操作中高效、精确的完成病人从入院记录、病程记录、手术记录、量表、出院记录等信息的书写,其中重点病种临床研究目标涉及的关键信息以及病历内容中包括主诉、现病史、舌象、脉象、实验室检查、中医诊断、西医诊断、辨病辨证依据等体现中医诊治特色的病历内容要求全结构化采集。
4 数据仓库及挖掘分析
临床诊疗数据是符合中医理论的中医诊疗方法和疗效的直接证据,采用结构化采集系统完成数据采集之后,进行面向临床研究的数据利用研究是基地临床科研信息共享的核心内容和任务。
在该阶段,基地临床研究人员需要基于临床诊疗和研究积累,提出新颖合理的分析目标。同时也需要根据临床研究需求进行数据清理、数据整理与转换,以达到可靠数据分析的数据质量要求。本阶段的研究过程分两个交叉的研究步骤:数据仓库及挖掘分析平台的构建与临床数据利用分析研究。本技术与实施要求用于结构化临床诊疗数据形成后,进行数据利用和挖掘分析时,在实施步骤和任务安排方面提供指导与参考。
4.1技术要求
参照国家中医药管理局中医医院信息化建设基本规范中的中医临床研究分析分系统,名老中医经验传承分系统和中医辅助诊疗分系统的功能规范,结合国家中医临床研究基地临床科研信息共享的要求,数据仓库及挖掘分析须达到的技术要求如下。
4.1.1基本要求
(1)数据抽取、转换与导入(etl)
①数据清理
对结构化病历数据进行清理,去除关键信息如大病历症状体征、诊断、中药处方等与关键疗效指标缺失的患者记录;
②数据抽取与转换
从结构化病历数据库中抽取适合科研分析的数据,设定抽取和代码转换规则,实现对来源病历数据的筛选,并到数据仓库数据的自动转换;
③数据导入
支持大规模病历数据到数据仓库数据的自动批量导入与汇总处理。
(2)数据仓库
①细节数据模型
建立囊括中医病历数据中患者人口统计学信息、大病历、病程、方药、理化检查等信息,面向科研分析的关系数据模型,主要用于从病历数据导入汇总的大规模数据存储;
②细节数据的规范模型
具有与细节数据模型类似但较为简化的数据模型结构,用于存储规范整理后的科研分析数据集;
③大规模数据管理
以大型数据库管理软件如oracle为依托,建立数据仓库的安全访问、结构化查询、增删改处理的客户端软件环境与机制。
(3)数据整理与数据导出
①数据整理
结合中医临床术语系统和临床信息标准词典,具有对症状体征、诊断、方药和理化检查等进行规范和标准化处理的功能;
②数据审核
支持对规范处理前后数据的人工审核,并对规范处理后数据进行数据补充与修改;
③数据格式转换
将整理后数据转换成适合挖掘分析的数据格式;
④数据导出
将规范整理后的数据导出为常用挖掘分析软件能够识别的数据输入格式。
(4)多维查询检索
分别对症状体征、诊断、方药和理化指标等从时间、患者人口统计学信息、医生等不同维度进行即席查询(由用户自定义条件的查询),实现面向病种研究需求的临床数据探索性分析。
(5)数据挖掘分析
①专用挖掘分析平台
具备基于实际临床诊疗数据,面向重点病种临床研究分析需求的专用挖掘分析功能,能够实现辨证经验、有效处方和随症加减规律等分析,支持进行基于临床数据的有效方药发现、临床优化治疗方案形成和名老中医经验传承研究等各种临床研究的数据挖掘分析任务;
②适宜挖掘分析算法
以中医临床症-证-治-效为分析主线,具备数据预处理、混淆因素检验、分类、聚类、相关分析、复杂网络分析等适宜挖掘分析算法。
4.1.2 扩展要求
(1)多维主题数据模型
需要构建面向主题的多维数据模型,以支持高效的多维查询检索功能。多维数据模型以rolap或molap模式实现,对主题以事实表和维表形式进行建模。
(2)多源动态数据整合
除结构化电子病历数据源之外,在数据仓库平台建立针对医院其他信息来源如his,lis和现代临床试验数据库的动态数据汇总和整合技术,整合基地个性化科研分析数据源到数据仓库中。
(3)临床决策与循证支持
在数据仓库平台基础上,构建面向特定病种诊疗的辅助决策支持功能,实现从临床诊疗中寻找证据、分析证据和提炼证据的方法,辅助形成初步的临床证据链。
(4)高级数据挖掘分析
①多阶段序贯治疗方案的分析方法
基于临床实际诊疗数据,利用内隐对照和马尔可夫决策过程模型,分析确认较优的动态序贯治疗方案;
②有效核心处方与症-药随症加减规律的分析方法
研制发现并确认有效的核心处方的层次复杂网络分析方法,以及随症用药加减的药-症关系知识的聚类分析方法。
4.2实施要求
数据仓库及挖掘分析平台的实施包括平台构建和数据分析利用研究两个主要阶段。本部分阐述实施过程中需要遵循的原则、步骤和基本要求。
4.2.1遵循原则
以基地信息条件和基于实际临床数据的病种临床研究需求为基础,将数据仓库及挖掘分析平台构建和病种临床研究有机结合,以基地临床研究和专职人员为主导,进行临床仓库及挖掘分析平台的建设和示范应用研究。注意在平台构建时的扩展性,支持院内的管理决策。
4.2.2基础设施要求
除基本的局域网络环境之外,数据仓库及挖掘分析平台相关的硬软件环境如下。
(1)硬件要求
①数据仓库服务器
用于分析用数据的存储和管理。在保证运行性能如cpu和内存的基础上,重点需要保证大容量的磁盘存储(最好配置相应的盘阵)。
②多维分析服务器
用于分析报表的应用服务,需要保证并发服务能力。
③etl数据处理和挖掘分析工作站
用于数据导入的etl软件的运行和挖掘分析功能,鉴于etl的大规模数据导入和挖掘分析的高计算量,需要配置高端性能的服务器。
(2)软件要求
①oracle数据库管理软件(oracle 9i以上)
②bo中间件软件
(3)数据仓库软件部署
①在oracle数据库环境中构建ods数据表、细节数据表、多维数据表、复杂网络分析数据表以及系统运行所需的元信息表等。
② bo软件的安装和部署,元信息数据库的导入和报表文件的导入处理。
③ etl和复杂网络分析系统的部署。
4.2.3实施步骤
(1)数据仓库及挖掘分析平台构建
临床研究平台由数据前处理、数据仓库、专用数据挖掘和多维检索与展示等四部分功能系统构成。数据前处理系统实现分析用数据的抽取、转换和导入处理;数据仓库系统实现分析用数据按照临床研究内容涉及的数据元素及其关系进行组织和管理,支持结构化查询、筛选和高效的数据分析服务;专用数据挖掘分析系统在数据仓库数据组织模式的基础上,实现数据挖掘分析算法和面向统计分析的数据导出接口;多维检索与展示系统实现直接基于数据仓库数据的多维检索与展示,对临床数据中显性的数据关系从不同维度(证-症-治-效)进行展示。
①数据仓库系统构建
在大型数据库管理系统如oracle已经安装的基础上,创建数据库,并生成数据仓库关系数据表。针对临床研究问题所对应的数据内容,采用数据模型设计软件,设计多维数据模型,并基于该模型生成数据仓库中相应的多维数据表;
②数据前处理系统的安装与运行测试
在相应的硬件服务器环境中进行数据前处理系统的部署,针对采集形成的结构化数据进行数据转换导入配置,形成并进行数据转换导入运行测试,确保处理前后数据的一致性;
③专用数据挖掘系统安装与运行测试
安装专用数据挖掘分析系统,完成与数据仓库系统的连接配置,联机筛选数据仓库数据形成数据集或采用测试数据样例,进行数据分析功能运行测试;
④多维检索与分析系统安装与分析设计
安装多维检索与分析系统,在多维数据模型和临床分析问题的基础上,采用分析设计工具(如水晶报表)进行分析报表的设计和发布。
平台构建实施流程(略)
(2) 临床数据利用分析
临床数据分析利用阶段主要任务包括:利用中医临床中采集的结构化数据,根据重点病种和重点科室确定的临床分析目标,完成对中医临床数据的前处理、数据挖掘分析和临床研究成果总结等科研任务。基于前期挖掘分析经验和平台构建流程,数据利用分析的具体实施流程分成两部分内容:基于测试平台的预分析和基于基地平台的挖掘分析。
基于测试阶段的预分析目的是解决针对基地特定目标挖掘分析的所有技术环节,并由基地专有挖掘分析人员参与进行平台功能操作的学习和实践,完成对其的初步培训任务;基于基地平台的挖掘分析则由基地专有挖掘分析人员和临床研究人员为主导进行常规挖掘分析应用研究,平台研究组人员提供技术指导和协助,并对挖掘分析过程平台相关的功能进行可能的优化和完善。
①挖掘分析需求的提出
-根据临床诊疗实践和研究积累,基地临床人员根据病种研究特点提出面向分析的临床研究需求,该临床研究需求需要表达明确的目标与内容;
-挖掘分析需求需要具体化到数据的纳入条件,研究目标中可能涉及的主要临床数据内容如诊断、病史、症状体征、理化指标、药物和结局指标等;
-从临床角度,能够估计当前采集数据对该研究目标的支持程度。研究目标一定要结合实际采集的数据,充分利用基地数据存在的优势和特点,同时保证与临床研究核心目标相关的数据具有较高的数据质量;
-该部分工作由基地临床研究人员提出,并不需要直接提挖掘分析目标,仅需要临床人员熟悉的临床研究目标。平台技术组人员可以参与从挖掘分析和临床诊疗数据的一般情况的角度提供反馈,以达到临床人员修改形成相对明确而新颖的面向分析的临床研究需求。
②数据前处理
-根据数据分析需求,确定和选择适合的相关信息,利用数据前处理系统的数据筛选、数据整理和数据转换导出等功能,从中医临床数据仓库中提取和筛选符合科研和临床要求的结构化临床数据;
-把与分析目标相关的数据元素或变量进行规范整理,对整理前后的数据进行严格的数据审核,保证每一例用于分析的数据内容与临床病历内容一致,形成用于分析的数据集。
③显性知识的探索性分析
利用多维检索与分析系统提供的分析功能,对与临床分析目标相关的报表进行即时检索和操作,并导出分析结果,结合临床知识对导出结果进行解释与分析。
④隐性知识的挖掘分析
-临床研究基地应能够根据分析目标,基于数据仓库整理后的数据和专用数据挖掘系统进行数据挖掘建模和分析,选择合适的数据挖掘分析方法,操作完成数据挖掘分析任务;
-利用临床知识和理论从分析结果中总结中医诊疗规律和特点,形成中医专家知识库,指导中医医生的临床实践。
⑤结果阐释与临床成果总结
-结果阐释
形成挖掘分析结果由基地临床研究人员进行解释,若不能满足预期研究目标,则需要根据情况回到挖掘分析的各个步骤进行数据的重新处理和分析;
-临床研究成果总结
结合中医基础理论和预期临床研究目标,由基地临床研究人员完成挖掘分析结果的提炼和理论提升,形成临床研究成果。
数据利用分析阶段实施流程(略)
4.2.4任务分工
(1)原则
①在平台构建阶段以技术组人员为主,基地临床研究及其专职人员提供条件支持和建设需求。
②在数据利用分析阶段以基地临床研究及其专职人员为主,技术组人员提供技术指导与辅助。
(2)具体任务与要求
①平台构建过程中的任务
-基础设施准备与专职人员配置
准备相应的软硬件条件,并配置专职数据仓库、数据处理和挖掘分析人员;
-示范数据准备与测试协助
在示范数据准备、数据内容确定、数据整理和分析报表浏览测试等步骤提供支持和协助。
②数据分析利用中的任务
-主导并承担挖掘分析的主体工作
基地专有挖掘分析人员经过初步培训后,在基地构建形成的临床研究平台基础上进行的挖掘分析工作由专职挖掘分析人员和基地临床研究人员主导进行,平台研究组人员重点对挖掘分析方法和任务提供必要协助和指导;
-临床研究需求及其相关数据内容确定
其中临床研究需求的确定是关键,能否获得好的分析研究结果取决于基于实际数据条件基础上合理新颖的临床研究需求;
-数据整理
数据整理是保证数据采集后数据质量和吻合预期目标的主要环节,具有较大的工作量,该步骤需要专职临床研究人员负责;
-结果阐释
负责面向病种挖掘分析中对获得结果的临床解释,并把存在的阶段性问题反馈给平台技术组。
-形成研究成果
结合基地病种研究需求,在平台及其临床数据基础上,获得有价值的临床研究结果如名老中医病证辨治经验及规律、优势病种有效治疗方案等。
4.3考核与验收
4.3.1 平台验收
形成具备基本功能或扩展功能的数据仓库与挖掘分析平台,该平台已经集成充分数量(如3000份住院或者门诊病历记录)可分析利用的中医临床诊疗数据,并能够对数据内容进行便捷的展示和分析。
4.3.2 成果验收
(1)基于平台和实际临床数据的挖掘分析示范研究成果
①名老中医典型医案库
构建包含充分可分析案例的名老中医典型医案库,基于数据仓库平台的挖掘分析方法,进行示范研究,获得有临床意义及专家认可的名老中医病证辨治经验知识。
②面向基地特定病种的优化辨治方案
(2)形成基于实际临床数据进行中医临床研究的可持续研究机制与模式
4.4基础设施要求
除基本的局域网络环境之外,数据仓库及挖掘分析平台相关的硬软件环境如下。
4.4.1 硬件
(1)数据仓库服务器
用于分析用数据的存储和管理。在保证运行性能如cpu和内存的基础上,重点需要保证大容量的磁盘存储(最好配置相应的盘阵)。
(2)多维分析服务器
用于分析报表的应用服务,需要保证并发服务能力。
(3)etl数据处理和挖掘分析工作站
用于数据导入的etl软件的运行和挖掘分析功能,鉴于etl的大规模数据导入和挖掘分析的高计算量,需要配置高端性能的服务器。
4.4.2 软件
(1)oracle数据库管理软件(oracle 9i以上)
(2)bo中间件软件
4.4.3 数据仓库软件部署
(1)在oracle数据库环境中构建ods数据表、细节数据表、多维数据表、复杂网络分析数据表以及系统运行所需的元信息表等。
(2) bo软件的安装和部署,元信息数据库的导入和报表文件的导入处理。
(3) etl和复杂网络分析系统的部署。