复制文本
下载此文档
加入vip,每篇下载不到2厘

WS_T 303-2023 卫生健康信息数据元标准化规则

VIP免费
3.0 2024-06-05 0 0 311.23KB 23 页 1库币 海报
投诉举报
ICS
11.020
CCS
C
07
WS
中华人民共和国卫生行业标准
WS/T 303—2023
代替 WS/T 303-2009
卫生健康信息数据元标准化规则
Rules for data element standardization of health information
2023 - 08 - 07 发布 2024 - 02 - 01 实施
中华人民共和国国家卫生健康委员  发 布
WS/T 303—2023
I
前 言
本标准为推荐性标准。
本标准代替WS/T 3032009 《卫生信息数据元标准化规则WS/T 3032009相比,主要为编
辑性修改。
本标准由国家卫生健康标准委员会卫生健康信息标准专业委员会负责技术审查和技术咨询,由国家
卫生康委计信息中负责协调和格式审,由家卫委规划发与信司负务管
理、法规司负责统筹管理。
本标准起草单位:中国人民解放军总医院、国家卫生健康委统计信息中心、中国人民解放军空军军
医大学。
本标准主要起草人:刘丽华、刘建超、张黎黎、王骏、冯丹、王霞、胡建平。
WS/T 303—2023
1
卫生健康信息数据元标准化规则
1 范围
本标准规定了卫生健康信息数据元模型、属性、卫生健康信息数据元的命名定义、分类以及卫生
健康信息数据元内容标准编写格式规范。
本标准适用于卫生健康信息数据元目录(数据元字典)的研究与制定卫生健康信息数据元元数据
注册系统的设计与开发、卫生健康信息标准的研究、教学与交流。
2 规范性引用文
下列文件中的内容通过文中的规范性引用而构成本标准必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本标准;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
标准。
ISO 3166-1 国家和所属地区名称代码 第1部分:国家代码
GB/T 18391.1 信息技术 元数据注册系统(MDR) 第1部分:框架
GB/T 18391.3 信息技术 元数据注册系统(MDR) 第3部分:注册系统元模型与基本属性
3 术语和定义
下列术语和缩略语适用于本标准。
3.1 术语
3.1.1
概念 concept
由特征的一个独特组合所生成的知识单元。
[来源:GB/T 15237.1-2000,3.2.1]
3.1.2
一般概念 general concept
对应两个或两个以上对象的概念,由于共同的特性而形成一个组。
[来源:GB/T 15237.1-2000,3.2.3]
3.1.3
个别概念 individual concept
仅对应一个对象的概念。
[来源:GB/T 15237.1-2000,3.2.2]
3.1.4
数据元 data element DE
用一组属性规定其定义、标识、表示和允许值的数据单元。
[来源:GB/T 18391.1-2009,3.3.8]
3.1.5
数据元概念 data element concept DEC
能以数据元的形式表示的概念,其表述与任何特定表示法无关。
[来源:GB/T 18391.1-2009,3.3.9]
3.1.6
WS/T 303—2023
2
对象类 object class
可以对其界限和含义进行明确的标识,且特性和行为遵循相同规则的观念抽象概念或现实世界中
事物的集合。
[来源:GB/T 18391.1-2009,3.3.22]
3.1.7
特性 property
一个对象类所有成员所共有的特征。
[来源:GB/T 18391.1-2009,3.3.29]
3.1.8
表示 representation
数据元的值域、数据类型的组合,必要时也包括计量单位或表示类。
[来源:GB/T 18391.1-2002,3.60]
3.1.9
表示类 representation class
表示类型的分类。
[来源:GB/T 18391.1-2009,3.3.35]
3.1.10
计量单位 unit of measure
用于计量相关值的实际单位。
[来源:GB/T 18391.1-2009,3.3.36]
3.1.11
值域 value domain;VD
允许值的集合。
[来源:GB/T 18391.1-2009,3.3.38]
3.1.12
允许值 permissible value
在一个特定值域中允许的一个值含义的表达。
[来源:GB/T 18391.1-2009,3.3.28]
3.1.13
值含义 value meaning
一个值的含义或语义内容。
[来源:GB/T 18391.1-2009,3.3.39]
3.1.14
维度 dimensionality
无单位的计量表述。
注:一个数量是具有一个相关计量单位的值。320F、00C、1米和100厘米是数量。两个计量单位之间的等价由一个计
量单位度量的值与另一个计量单位度量的值之间保持有一个一一对应关系的数量来决定,并独立于相关语境,其特征运
算是相同的。等价的计量单位在此意义上具有相同的维度。这里定义的等价在所有计量单位集合中形成了一个等价关系。
每类等价对应一个维度。“华氏温度”和“摄氏温度”的计量单位具有相同的维度,因为对于相同的数量,每个由华氏
计量的值,同样存在一个由摄氏计量的值,反之亦然。对于每个计量单位的数量可以进行同样的运算。温度一一对应的
数量等式有:C0=(5/9)*(F0-32)和F0=(9/5)*(C0)+32。
[来源:GB/T 18391.1-2009,3.3.12]
WS/T 303—2023
3
3.1.15
概念域 conceptual domain;CD
有效的值含义的集合。
[来源:GB/T 18391.1-2009,3.3.6]
3.1.16
内涵 intension
<术语学>组成概念的特征的集合。
[来源:GB/T 18391.1-2009,3.2.15]
3.1.17
外延 extension
<术语学>与一个概念对应的全体对象。
[来源:GB/T 18391.1-2009,3.2.12]
3.1.18
元数据 metadata
定义和描述其它数据的数据。
[来源:GB/T 18391.1-2009,3.2.16]
3.1.19
元数据项 metadata item
一个元数据对象的实例。
[来源:GB/T 18391.1-2009,3.2.17]
3.1.20
实体 entity
任何现存、曾经存在的或可能存在的具体的或抽象的事物,包括事物间的联系。
[来源:GB/T 18391.1-2009,3.2.10]
3.1.21
属性 attribute
某个对象或实体的特征。
[来源:GB/T 18391.1-2009,3.1.1]
3.1.22
属性值 attribute value
某种属性的一个实例表示。
3.1.23
分类法 taxonomy
依据类及子类间的固有关系进行分类的方法。
3.1.28
主题词表 thesaurus
按给定顺序排列参照词汇,其中显示和标识了词汇间的关系。
3.1.29
注册机构标识 registration authority identifier RAI
经授权对数据元进行注册的任何组织的标识符。
3.1.30
WS/T 303—2023
4
数据标识符 data identifier DI
由注册机构赋予数据元的标识符。
3.1.31
版本标识符 version identifier
赋予版本的一个标识符,以此提交和更新数据元注册。
3.1.32
管理状态 administrative status
注册机构处理注册请求中赋予管理过程的状态的指称。
[来源:GB/T 18391.1-2009,3.3.3]
3.1.33
数据元字典 data element dictionary
列出并定义了所有相关数据元的一种信息资源。
注:数据元字典可以有各种不同层级,例如:ISO/IEC 委员会级、国际协会级、行业部门级、公司级、应用系统级。
3.2 缩略语
ISO:国际标准化组织(International Organization for Standardization)
IEC:国际电工委员会(International Electrotechnical Commission)
EIA:电子工业协会(Electronic Industries Association)
4 数据元概述
4.1 数据元基本模型
数据元的基本模型是由数据元概念和数据元两部分组成,见图1。
特性
对象类
特性
对象类
表示
(1:N)
(1:1)
(1:N)
(1:1)
(1:1)
(1:N)
数据元概念 数据元
特性
对象类
特性
对象类
表示
(1:N)
(1:1)
(1:N)
(1:1)
(1:1)
(1:N)
数据元概念 数据元
特性
对象类
特性
对象类
表示
(1:N)
(1:1)
(1:N)
(1:1)
(1:1)
(1:N)
数据元概念
特性
对象类
特性
对象类
表示
(1:N)
(1:1)
(1:N)
(1:1)
(1:1)
(1:N)
数据元概念 数据元
1数据元的基本模型
一个数据元概念是由对象类和特性两部分组成,是能以一个数据元形式表示的概念,其描述与任何
特定表示法无关。一个数据元是由对象类、特性和表示三部分组成。一个数据元概念对应多个数据元
对象类是可以对其界限和含义进行明确的标识,且特性和行为遵循相同规则的观念、抽象概念或现
实世界中事物的集合。它是我们希望采集和存储数据的事物对象类是概念,在面向对象的模型中与
相对应,在实体-关系模型中与实体对应,例如,患者、医生、卫生机构等。对象类可能是一般概念。
当对象类所对应的对象集有两个或多个元素时,就是一般概念。患者、医生卫生机构等都是一般概念。
对象类也可以是个别概念。当对象类对应的对象集仅有一个元素时,就是个别概念例如“北京市医
机构”就是个别概念。
特性是一个对象类的所有成员所共有的特征。它用来区别和描述对象是对象类的特征,但不一定
是本质特征,它们构成对象类的内涵。特性也是概念对应于面向对象模型或实体-关系模型中的属性,
WS/T 303—2023
5
例如身高、体重血压、脉搏血型等。特性也可是一般概念或个别概念作为个别概念的例子有:
床总数或医疗收入。
表示可包括值域、数据类型、表示可选的)和计量单位四部分,其中任何一部分发生变化都成
为不同的表示值域是数据元允许值的集合,例如医疗毛收入这一数据元的值域是用非负实数集(以人
民币为单位)作为它的允许值集合;数据类型是表达数据元允许值的不同值的集合以这些值的特性和
运算为特征,例如患者姓名的数据类型是“字符表示类是表示类型的分类,它是可选的,例如性别
代码这一值域的表示类是“类别”计量单位是用于计量相关值的实际单位,例如患者血压测量的计量
单位是“mmHg”。
当一个数据元概念与一个表示联系在一起时,就产生了一个数据元。在需要生成概念上相似的数据
元时,一个数据元概念可以与不同的表示关联产生不同的数据元。同一概念的表达方法有许多。例如
患者国籍这个数据元概念,可以应用ISO 3166-1中规定的世界各国7种不同的表示,有英文全称、2位字
母码、3位字母码地区代码等,每种都包含了一个表示集合都可以用作与该数据元概念关联的表示。
7种关联就形成了7个数据元。
4.2 值域基本模型
值域的基本模型由概念域和值域两部分组成,一个概念域对应多个值域,见图2。
概念域 值含义
(1:N) 允许值 值域
(N:1)
值域
(1:N)
概念域
(1:N)(1:N)
值域
可枚举
值域
不可枚举
值域
概念域
可枚举
概念域
不可枚举
概念域
非互斥子类 非互斥子类
(1:1)
概念域 值含义
(1:N) 允许值 值域
(N:1)
值域
(1:N)
概念域
(1:N)(1:N)
值域
可枚举
值域
不可枚举
值域
概念域
可枚举
概念域
不可枚举
概念域
非互斥子类 非互斥子类
概念域 值含义
(1:N) 允许值 值域
(N:1)
概念域 值含义
(1:N) 允许值 值域
(N:1)
概念域 值含义
(1:N) 允许值 值域
(N:1)
值域
(1:N)
概念域
(1:N)(1:N)
值域
(1:N)
概念域
(1:N)(1:N)
值域
可枚举
值域
不可枚举
值域
概念域
可枚举
概念域
不可枚举
概念域
非互斥子类 非互斥子类
值域
可枚举
值域
不可枚举
值域
概念域
可枚举
概念域
不可枚举
概念域
值域
可枚举
值域
不可枚举
值域
值域
可枚举
值域
不可枚举
值域
概念域
可枚举
概念域
不可枚举
概念域
概念域
可枚举
概念域
不可枚举
概念域
非互斥子类 非互斥子类
(1:1)
2值域的基本模
4.2.1 值域
值域是数据元允许值的集合一个允许值是某个值和该值的含义的组合值的含义称为值含义。
如,“患者病情状态”数据元的值域是:1表示危,2表示重,3表示一般。1、2和3是值其值含义分别
是危、重和一般。
值域有两种(非互斥的)子类:
——可枚举值域:由允许值(值和它们的含义)列表规定的值域;
——不可枚举值域:由描述规定的值域。
一个可枚举值域是包含了它的所有值及值含义的一个列表。例如,“患者血型类别代码”数据元的
一个可枚举值域列表见表1
表1 “患者血型类别代码”的值域
值 值含义
1 A型
2 B型
3 0型
4 AB型
9 不详
WS/T 303—2023
6
一个不可枚举值域是由一个描述来规定。不可枚举值域的描述须准确描述属于该值域的允许值。
如,“传染病死亡率”数据元的值域是大于等于0且小于等于1的实数。
描述数据有时需要计量单位例如描述血压的值域记录时,为了准确理解值含义需要使用计量单
mmHgkPa年龄值域记录的计量单位可使用年、月、;血糖值域记录的计量单位可以是mg/dl
mmol/L。所以,计量单位与值域关联。
4.2.2 概念域
概念的外延构成了概念域,一个概念域是一个值含义集合。一个概念域的内涵是它的值含义概念
域也有两种(非互斥的)子类:
——可枚举概念域:由值含义列表规定的概念域;
——不可枚举概念域:由描述规定的概念域。
可枚举概念域的值含义可以明确地列举。该类型概念域对应于可枚举类型的值域,见示例1。不可
枚举概念域的值含义由“不可枚举概念域描述规则”来表述。该规则描述了不可枚举值域中允许值的含
义。这种类型的概念域对应于不可枚举类型的值域,见示例2
如果一个计量单位的任何量可以转化为另一种计量单位下等同的量,则这些计量单位彼此之间是等
价的。所有等价的计量单位被认为具有相同的维。例如,长度计量单位(米,厘米等)具有相同的维
年龄计量单位(年、月、周、日)具有相同的维。所以,维与概念域关联。
示例1:可枚举概念域
概念域名称:国别代码
概念域定义:世界各国名称的表示
值含义:中国、美国、巴西、法……
————————————————————
值域名称(1):国家代码-3位字母
允许值:<CHN, 中国> ;<USA, 美国> ;<BRA, 巴西> ;<FRA, 法国>;……
————————————————————
值域名称(2):国家代码-2位字母
允许值:<CN, 中国> ;<US, 美国> ;<BR, 巴西> ;<FR, 法国>;……
————————————————————
值域名称(3):国家代码-3位数字
允许值:<156, 中国> ;<840, 美国> ;<076, 巴西> ;<250, 法国>;……
示例2:不可枚举概念域
概念域名称:体重
概念域定义:身体所有器官重量的总和
概念域描述规则:用非负实数表示
————————————————————
值域名称(1):体重—N5,2
值域描述:身体所有器官重量的总和,最大长度5位的非负实数,小数点后保留2位数字。
计量单位:千
————————————————————
值域名称(2):体重—N4
值域描述:身体所有器官重量的总和,最大长度4位的非负整数。
计量单位:克
4.2.3 关系
每个值域都是概念域的一个元素。多个值域可能是同一个概念域的外延,但一个值域只与一个概念
域关联。概念域之间可以存在关系由此创建概念域的一个概念体系。值域之间也可以存在关系,根据
这些关系提供的框架,就能够捕捉相关值域和它们关联概念的结构。
WS/T 303—2023
7
每个值域表示两种概念:数据元概(间接地和概念域(直接地数据元概念是与一个数据元
关联的概念。值域是数据元的表示因此也间接地表达了数据元概念。但是,值域与一个概念域直接关
联,因此,值域对概念的表示与数据元无关。
4.3 数据元的元数据总体模
数据元的元数据总体模型由概念层和表示层两个部分组成,见图3。概念层包括数据元概念类和概
念域类。这两种类都表示概念。表示层包括数据元类和值域类。这两种类都表示数据值的容器。
值域
概念域
数据元
数据元概念 (N:1)
(N:1)
(1:N)
概念层
表示层
(1:N)
值域
概念域
数据元
数据元概念 (N:1)
(N:1)
(1:N)
概念层
表示层
(1:N)
3数据元的元数据总体模型
图3可以给出4个类的若干基本事实:
——一个数据元是一个数据元概念和一个值域的结合体;
——多个数据元可以共享相同数据元概念这意味着一个数据元概念可以用多个不同方式表示。
如,患者入院时间是一个数据元概念,它可以有多个表示方法,例如用 YYYYMMDD 表示患者入
院的年月日,如果需表示小时和分,则用 YYYYMMDDhhmm 表示。“患者性别代码-英文全称”
“患者性别代码-1 位字母代码”共享同一个数据元概念患者性别。
——多个数据元可以共享相同的表示,这意味着一个值域可以被不同数据元重复利用例如,“住
院病人结算费用-元(人民币)“门急诊就诊费用-元人民币)数据元共享相同的值域
“费用-元(人民币)”
——值域不是必然与一个数据元关联,可以单独管理;
——不同值域所有允许值所对应的值含义都相同时这些值域在概念上是等价的,因此,对应相同
的概念域。例如,前述关于性别的值域:性别代码-1位数字、性别代码-英文全称及性别代码
-1位字母代码的允许值所对应的值含义相同,均表示“男性、女性未知的性别、未说明的
别”。所以这些值域对应同一个概念域“性别”。
——不同值域部分允许值所对应的值含义相同时,这些值域在概念上是相关的,因此,在包含有其
各自概念域的概念体系中共享一个由共同的值含义构成的概念域。例如,性别代码-符号的允
许值是“♂和♀”分别表示“男性和女性”无其他符号表示未知的性别”“未说明的
性别”那么性别代码-符号与性别代码-1位数字、性别代码-英文全称及性别代码-1位字母代
码值域在概念上相关,共享由共同的值含义“男性和女性”构成的概念域“性别”。
——一个数据元概念仅与一个概念域相关因此共享相同数据元概念的所有数据元共享概念上相关
的表示。例如,“新生儿体重-N5,2(千克)”和“新生儿体重-N4(克)”是两个不同的数据
元,共享一个数据元概念新生儿体重。两个数据元的表示在概念上是相关的共享概念“体
重”千克和克都是重量的计量单位,称具有相同的维度因此计量单位与值域相关,维度
概念域相关。
——许多数据元概念可以共享相同的概念域。例如,患者体重和新生儿体重是两个不同的数据元概
念,共享一个概念域“体重”。
WS/T 303—2023
8
4.4 数据元与其他数据概念的关系
图4简化表示了数据元所在的不同数据环境。数据元出现在数据库、文件和数据交换集当中。数据
元是系统所管理数据的基本单元,因而它必然是其内部进行数据库和文件设计的组成部分也一定是系
统间数据交换集的组成部分。
在系统内部,数据库或文件由记录、段和元组等组成,而记录、段和元组则由数据元组成。数据元
本身包含各种各样的数据,这些数据包括字符、图像和声音等。
标识符
定义
名称
值域,等
数据元
数据库、文件等
事务处理与交换单元等
记录、段、元组等
字段、列等
字符、图像、声音
数据库、文件等
标识符
定义
名称
值域,等
数据元
数据库、文件等
事务处理与交换单元等
记录、段、元组等
字段、列等
字符、图像、声音
数据库、文件等
4数据元和其他数据概念
系统间进行数据传输时,数据元是构成交换集的基本单元数据交换主要发生于数据库间或文件间,
但系统间的数据库和文件结构(记录或元组)并不一定相同,所以进行信息交换的公用单元是数据元
4.5 卫生健康信息数据元
卫生健康信息数据元是卫生这一特定领域的数据元,它的概念和结构遵循通用数据元的概念和
构,但具有自身的特点。医药卫生领域包括基础医学、临床医学、公共卫生、中医药学等多个专业,
数据元的表现形式复杂,例如数字人体、医学影像基因图谱、中医经络等,除具有通用数据元的属性
外,还具有其鲜明的领域特殊性。
5 数据元属性
5.1 数据元基本属性
数据元的基本属性模型见图5。一个数据元规范由一组属性组成,使用了基数型和逻辑相关性两种
准则对数据元的基本属性进行分组,分在同一组的属性共同拥有相似的基数和逻辑相关性。
——基数型:每一个数据元规范都可能包含 01011且仅仅是 1110或多0n
1或多(1n)个列于图 5中的属性。
例如:一个数据元规范可能包含0或1个“主管机构”属性,但要求有1且仅仅是1个“定义”属性;
可能包含0或多对“相关数据参照”与“关系类型”属性,但要求有1或多个“数据元允许值”属性。
——逻辑相关性:属性除了有相似基数类型外,还可能彼此依赖,也就是说,某种属性在没有其他
属性存在的情况下不可能存在。
摘要:

ICS11.020CCSC07WS中华人民共和国卫生行业标准WS/T303—2023代替WS/T303-2009卫生健康信息数据元标准化规则Rulesfordataelementstandardizationofhealthinformation2023-08-07发布2024-02-01实施中华人民共和国国家卫生健康委员会  发布WS/T303—2023I前言本标准为推荐性标准。本标准代替WS/T303-2009《卫生信息数据元标准化规则》。与WS/T303-2009相比,主要为编辑性修改。本标准由国家卫生健康标准委员会卫生健康信息标准专业委员会负责技术审查和技术咨询,由国家卫生健康委统计信...

展开>> 收起<<
WS_T 303-2023 卫生健康信息数据元标准化规则.pdf

共23页,预览23页

还剩页未读, 继续阅读

温馨提示:66文库网--作为在线文档分享平台,一直注重给大家带来优质的阅读体验;让知识分享变得简单、有价值;海量文档供您查阅下载,让您的工作简单、轻松而高效! 1. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。 2. 66文库网仅提供信息存储空间,仅对广大用户、作者上传内容的表现方式做保护处理,对上传分享的文档内容本身不做任何修改或编辑,并不对下载的任何内容负责。 3. 广大用户、作者上传的文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。 4. 本站不保证、不承担下载资源内容的准确性、安全性和完整性, 同时也不承担用户因使用下载资源对自己和他人造成任何形式的伤害或损失。
分类:法规文献 价格:1库币 属性:23 页 大小:311.23KB 格式:PDF 时间:2024-06-05
/ 23
客服
关注