中医药要点科学研究范畴的规则包含 关于中医药科学数据建造的考虑
崔蒙+杨寅
摘要:从中医药文献数据库、《中医药学主题词表》的研制到中医药信息数字化虚拟研讨院、依据结构型数据库的数据发掘,中医药数据建造获得了明显的效果。但中医药科学数据在建造和运用中也存在一些问题,需求考虑。中医药科学数据建造需求选用虚拟研讨院形式,有必要有安稳的部队。中医药科学数据建造与运用有必要契合中医药学自身规矩,树立适宜自身数据处理的办法。中医药科学数据建造的理论和办法学问题,不行单纯引进其他学科的理论和办法,而应该在中医药理论指导下学习这些理论和办法处理中医药数据建造的难点。
要害词:中医药;科学数据;虚拟研讨院
中图分类号:R2-05 文献标识码:A 文章编号:2095-5707(2016)04-0001-03
Reflections on the Construction of TCM Scientific Data
CUI Meng, YANG Yin
(Institute of Information on Traditional Chinese Medicine, China Academy of Chinese Medical Sciences, Beijing 100700, China)
Abstract: The construction of TCM scientific data has made great achievements, including TCM literature database, the development of TCM keywords table, virtual institute of digital TCM information, and data mining based on structural database. At the same time, we found some problems in the construction and utilization of TCM scientific data, which demand our reflection. TCM virtual institute should be used to construct TCM scientific data and build a steady team. The construction and utilization of TCM scientific data should fit the law of TCM and establish a proper way of data processing. The problems in the theory and methodology of construction of TCM scientific data cannot be solved by solely introducing theories and methods of other subjects, but can be solved by referencing these theories and methods under the guidance of TCM theories.
Key words: TCM; scientific data; virtual institute
中医药科学数据是指在中医长期医疗实践活动及科学研讨进程中所发生的原始性、根底性数据,以及依照不同需求、系统加工的数据。它既包含了
基金项目:国家科技部严重专项(2012ZX09304003-001);国家中医药办理局职业专项(201207001-21);科技部科技根底性作业专项(2009FY120300);我国中医科学院立异团队项目(PY1306)
榜首作者:崔蒙,研讨员,研讨方向为中医药信息学。E-mail: cm@mail.cintcm.ac.cn
中医在几千年医疗实践活动中长期堆集与收拾编纂的海量数据,也包含施行科技计划项目与科技作业者科学实践所发生的很多数据,它是中医理论承继与立异展开、中医临床决议计划支撑与中药新药研制的重要源泉与依据。
1 中医药科学数据建造现状
中医药科学数据建造起源于20世纪80年代初,我国中医研讨院图书情报中心(即现在的我国中医科学院中医药信息研讨所)模仿美国国立医学图书馆Medline数据库开端研制中医药文献数据库。虽然仅仅文摘数据库,但选用美国国立医学图书馆的标引技能,研制出《中医药学主题词表》,对数据库进行主题词标引,起点比较高。该数据库至今仍在继续维护中,录入规划现已扩大到1949年至今,文献量超越140万篇,对中医药科学数据的运用发挥了重要效果,是中医药科技查新的重要东西。
20世纪90年代末至21世纪初,跟着国家对科学数据建造注重程度的不断提高,特别是国家科学数据同享工程的发动,中医药科学数据建造获得了快速的展开。由我国中医科学院中医药信息研讨所安排,树立了由全国37家中医药院校和研讨院所的图书馆、信息中心、文献中心一起参加的中医药信息数字化虚拟研讨院(简称“虚拟研讨院”)。虚拟研讨院没有行政联系,首要是以项目为枢纽,以一起政策为己任,以各个院校、研讨院所的相关安排为依托,以各个数据库为研讨小组,构成了集全国力气为一体的中医药科学数据研制团队。在浙江大学核算机科学与技能学院的全力支撑下,引进最先进的核算机及网络技能,展开了空前规划的中医药科学数据建造作业,开发了中医药科学数据共建与同享渠道,研制了中医药学言语系统、中医临床术语系统和20余个中医药专题词表,制作了60余个中医药结构型专题数据库,构成了全球最大规划的中医药科学数据渠道,对推进中医药职业的科学数据运用,以及对中医药职业注重科学数据起到了不行代替的效果。
与此一起,中医药科学数据的深度运用研讨也蓬蓬勃勃地展开起来。依据结构型数据库的数据发掘作业获得了很大的展开,在丹方配伍规矩、证候组合规矩、名老中医用药规矩等方面展开了很多的研讨作业。在浙江大学核算机科学与技能学院的支撑下,搭建了高性能核算渠道,支撑50个节点的并行运算,运算峰值达每秒万亿次;研制了支撑虚拟研讨院作业的DartGrid渠道,完成了全国37家单位的长途协同建库作业;研制了支撑常识效劳的DartCloud云渠道,构建了常识效劳渠道的才智运用中心,极大地促进了中医药科学数据的深度运用。
当大数据理念提出后,咱们提出了中医药数据所具有的2个明显特征,即中医药数据是全数据、是常识密布型数据,并开端研制依据大数据的运用渠道,愈加重视非结构化数据的处理、稠浊数据的处理,以及数据间的相相关系,对依据中医药科学数据的常识效劳展开了愈加深化的研讨。
在获得效果的一起,咱们也发现了在中医药科学数据建造和运用中存在的问题,这些问题有或许推迟中医药科学数据建造与运用到达更高水平缓更快展开的速度。因而,有必要认真考虑和处理这些问题。
2 中医药科学数据建造的问题及处理计划
2.1 树立安稳的虚拟研讨院部队
中医药科学数据建造单位的规划一般不很大,依托一个单位展开大型数据库的建造和运用十分困难。别的,一个严重研讨项目常常横跨多个学科,应归纳运用多种研讨办法讨论其一起规矩[1]。因而,以项目为依托,严密联合多所大学及研讨院编制内的实体研讨安排或科研小组的、全国性的协同作业在中医药科学数据建造中至关重要。而现已树立起来的虚拟研讨院是成功的典范,其多学科、多中心、多项意图协作形式,依据工程、多项目支撑、多层次结合、鼓舞自我优势讨论的展开形式,中心担任、专业化分工、共建同享、松懈联合的运转形式,一起构成了虚拟研讨院在中医药科学数据建造上的一起优势[2]。经过近年的建造实践,虚拟研讨院坚持了稳步的展开,完成了研讨方向的不断丰富,研讨范畴的不断拓宽,参加单位科研人员全体水平的不断提高,协作单位的不断增多,国际交流的不断扩展,数字化效果、数据运用效果、传统常识维护效果、国际协作效果产出的不断增多。但是,在实践中咱们发现虚拟研讨院仍存在一些问题,最首要的是人员办理体制问题。
现行的人员办理体制中存在一把手担任制、干部轮换制。一把手担任制即组成虚拟研讨院的安排担任人不只担任断定数据建造的战略和政策,还干涉详细的办理进程以及计划的断定和施行。干部轮换制是指组成虚拟研讨院的安排担任人经过必定年限后,由所从属的科研院所进行替换,而新担任人或许来自院所的其他部分,不具备中医药信息研讨布景和专业根底。在这种办理体制下,“一把手”并不是这个专业的行家里手,乃至对这项作业没有爱好,使得虚拟研讨院的运转呈现了很大的问题。换言之,一批干部轮换后,若由不拿手此项作业的人来掌管,会影响作业展开。但是,科学数据的办理和完善不是单纯的技能问题,而是技能与办理相结合的继续完善的办理进程[3]。关于虚拟研讨院来说,其安排、安排、人员等的安稳具有极其重要的效果和含义,特别是组成虚拟研讨院安排的担任人的安稳性对中医药科学数据建造作业的展开具有至关重要的效果。中医药科学数据的建造与运用是一项专业性很强的、需求继续进行的作业,并不是一项简略的行政作业;凝集一批有爱好、有才干、有作业心的担任人,对中医药科学数据建造作业具有极其重要的效果,而用简略的行政办理办法,随意调集、替换担任人,会导致作业失掉连贯性,特别是当新的担任人没有满足的爱好或才干时,乃至会导致作业停止,由此给中医药科学数据建造与运用带来巨大损失。因而,虚拟研讨院需求以担任人安稳和研讨人员联系相等为根底的人员部队。
2.2 树立适宜中医药科学数据处理的办法
经过长期的实践,咱们发现中医药科学数据建造与运用既要遵从一般科学数据建造的规矩,也要遵从中医药学的规矩,不然其数据建造和运用就会脱离中医药临床与科研的实践,失掉其应有的价值和含义。首要,中医药的临床实践是依据个别化治疗的,这种个别化不只指调查目标的个别化,还包含调查者的个别化,亦即参加治疗进程的医师和患者都具有个别化特征,构成一个相对独立的个别化系统。当然,这是一个敞开的独立系统,患者是处于自己个别的天地人三者合一的敞开系统中,医师也相同处于其个别的天地人三者合一的系统中,两者又组成了一个一起的敞开系统。关于这样一个别系所发生的数据有必要要遵从中医药学的理论进行处理,才干发现其内涵规矩。在这个别系中,有可以运用混合大数据处理的数据,如发现组成证候的症状群规矩;也有只能依据单一系统处理的数据,如医师个别、或单个医师与患者组成的系统诊治时处方用药的规矩;因而不能简略地运用大数据的处理办法处理中医药数据。其次,中医药数据是归于常识密布型数据,其数据量很难到达相似地舆、海洋、气候、地舆等学科等级的数据量,因而,仅靠数据密布度发现新常识具有必定难度。更为适宜的办法或许是树立依据本体的语义网络,将数据中隐含的常识相关起来,以期发现新的常识和规矩。所以,中医药科学数据的处理有必要契合中医药学自身的规矩,效劳于中医药常识和规矩的发现与运用。跟着人工智能技能的展开,特别是近期韩国闻名围棋手李世石与谷歌AlphaGo所进行的围棋比赛,显现了人工智能研讨展开的态势,使中医药科学数据的深度运用遭到很大启示,甚或有了新的研讨思路。
2.3 树立中医药科学数据建造的理论和办法学
树立中医药科学数据建造的理论和办法学,不行单纯引进其他学科的理论和办法,而应该在中医药理论指导下学习这些理论和办法,来处理中医药数据建造的难点。
依据中医药常识效劳的科学数据建造有4个难点,即⑴怎么表达杂乱、定性、含糊的中医药概念、常识与思想形式?⑵怎么无缝集成交融不同学科的异构常识,确保常识的一致性并能快速查询查找?⑶怎么重组、扩展、发掘数据以发现隐形常识,完成常识立异价值?⑷怎么完成智能的进程信息常识办理,提高职业经济效益?很明显,单纯引进其他学科的理论和办法不能直接处理这4个难点,只要将前者融入中医药理论中,将之转化成契合中医药展开变化规矩的理论和办法,才干处理中医药科学数据建造的问题。
针对上述4个难点,较为适宜的处理办法依次是,⑴构建依据语义图的中医药常识图谱与常识库,要害点为依据多图语义的常识图谱建模办法和唯象中医药常识建模办法;⑵研制依据语义互联网的中医药常识查找技能,要害点为多模型语义映射办法和分布式语义索引办法;⑶树立依据语义图发掘的中医药常识发现,要害点是杂乱网络化常识的查找发掘办法和依据语义图的泛化相关规矩发掘办法;⑷获取面向进程效劳的常识集成办法及效劳技能,要害点是依据语义发布订阅的常识集成办法和面向移动环境的常识效劳集成办法。
3 小结
中医药科学数据建造是整个人口与健康科学数据同享渠道建造的不行或缺的部分,咱们尽力将中医药科学数据融入整个健康科学数据的共建同享,在促进整个健康作业展开中发挥效果。以虚拟研讨院为安排形式的中医药科学数据建造在获得必定展开的一起,亦发现一些问题,发生了与之对应的考虑。期望可以经由这些发现和考虑进一步完善中医药科学数据建造作业,使中医药科学数据发挥更大的效果。
参考文献
[1] 周增桓,李海燕,史先东,等.对科研协作中若干问题的讨论[J].中华医学科研办理杂志,2000,13(3):188-189.
[2] 崔蒙,谢琪,尹爱宁,等.中医药信息数字化虚拟研讨院建造形式研讨[J].上海中医药大学学报,2008,22(3):5-8.
[3] 吴金红,陈勇跃.面向科研第四范式的科学数据监管系统研讨[J].图书情报作业,2015,59(16):11-17.