复制文本
下载此文档
加入vip,每篇下载不到2厘

GB_T 38667-2020 信息技术 大数据 数据分类指南

3.0 2024-07-19 8 0 1.27MB 18 页 6.6库币 海报
投诉举报
!"#$%&''()*
!"#$ %&' &'()*+
,- ./
' ( + , - . / 0 1 2
' ( ) * 3 / 0 4 5 6
, -
  
 
………………………………………………………………………………………………………
 规范性引用文件
…………………………………………………………………………………………
 术语和定义
………………………………………………………………………………………………
 缩略语
……………………………………………………………………………………………………
 分类过程
…………………………………………………………………………………………………
 
 
…………………………………………………………………………………………………
 
 
……………………………………………………………………………………………
 
 
……………………………………………………………………………………………
 
 
……………………………………………………………………………………………
 
 
……………………………………………………………………………………………
 
 
……………………………………………………………………………………………
 分类视角
…………………………………………………………………………………………………
 
 
…………………………………………………………………………………………………
 
 技术选型视角
………………………………………………………………………………………
 
 业务应用视角
………………………………………………………………………………………
 
 安全隐私保护视角
…………………………………………………………………………………
 分类维度
…………………………………………………………………………………………………
 
 
…………………………………………………………………………………………………
 
 技术选型维度
………………………………………………………………………………………
 
 业务应用维度
………………………………………………………………………………………
 
 安全隐私保护维度
 分类方法
 
 线
 
 
 
 混合分类法
资料性附录
 
  
  本标准按照
T1
请注意本文件的某些内容可能涉及专利
本标准由全国信息技术标准化技术委员会
本标准起草单位
浪潮软
件集团有限公司国网安徽省电力有限
电力科学研究院
上海三零卫
士信息安全有限公司
联通大数据有限公司
九次方大数据信息
集团有限公司
广
中电科大数据研究
院有限公司
北京大学
山东省计算中心
本标准主要起草人马红霞张慧敏顾广宇吴艳华
郑金子
冯念慈
史丛丛
孙嘉阳
 大数据 
 
本标准提供了大数据分类过程及其分类视角
本标准适用于指导大数据分类
 规范性引用文件
下列文件对于本文件的应用是必不可少的
仅注日期的版本适用于本文
凡是不注日期的引用文件
T4
 国民经济行业分类
T3
   
 术语和定义
T3
便使
以下重复列出了
T3
大数据 
具有体量巨大
大量数据集的数据
  个特征普遍不加修饰地直接用
并分别赋予
了它们在大数据语境下的定义
  
  
数据可能来自多个数据仓库数据领域或多种数据类型
  
单位时间的数据流量
  
即体量速度和多样性等特征都处于多变状态
T3
数据集 
数据记录汇聚的数据形式
  它可以具有大数据的体量多样性和易变性特征数据集的特征表征的是数据本身或静态数据
当其在网络上传输时或暂时驻留于计算机存储器中以备读出或更新时表征的是动态数据
T3
大数据分类 
根据大数据的属性或特征
排列顺序的过程
 
使
 
分类主体观察和开展大数据分类活动的角度
 
  常见数据分类维度包括产生来源
结构化特征
业务归属
处理时效性要求等
 
根据选定的分类维度
 
处理数据
  数据分发包括线上或线下等多种方式数据共享数据公开等
 
或特征
 缩略语
下列缩略语适用本文件
转换和加载
eT
结构化查询语言
 分类过程
 
大数据分类过程划分为分类规划
 
本章规范了大数据的分类过程
分类方法
 
 选择分类视角
选择分类视角过程包括
 明确分类业务场景
 根据业务场景选取分类视角
  
 制定工作计划
制定工作计划过程包括
 明确规划拟开展分类的数据范围
 明确拟采用的分类维度和方法
 明确预期分类结果
 明确分类工作实施方案及进度安排
 明确对分类结果的评估方法
 明确对分类结果体系的维护方案
 
 调研数据现状
调研数据现状过程包括
 包括但不限于数据产生的场景稀疏稠密
 调研数据存储现状
 调研数据质量情况包括但不限于数据的规范性完整性可访问
 调研数据业务类型
 调研数据敏感程度
 调研数据应用情况
使
使
 调研数据时效性情况
 调研数据权属情况
使
 确定分类对象
确定分类对象过程包括
 确定数据分类的业务场景
 确定数据产生的起止时间
 确定数据量大小
 确定数据产生频率
 确定数据结构化特征
 确定数据存储方式
 确定数据处理时效性
 确定数据交换方式
 确定数据产生来源
 确定数据流通类型
 确定数据质量
 确定数据敏感程度
 选择分类维度
选择分类维度过程包括
 梳理分类视角的数据特征
 根据数据特征选取分类维度
  分类维度见第
 选择分类方法
  
分类方法见第
  
若选择混合分类法
还需考虑以哪种分类维度为主
哪种分类维度作为补充
 分类实施
 拟定实施流程
拟定实施流程宜结合大数据的生命周期包括但不限于明确实施步骤
开展实施工作
 开发工具脚本
脚本宜根据实施流程遵循软件开发或者脚本编制
的规范开发分类工具脚本
 记录实施过程
 输出分类结果
输出分类结果宜梳理各个步骤的分类结果
 
 核查实施过程
核查实施过程包括
 核查数据分类表
 核查分类过程记录
 核查分类维度
分类目标
 核查分类方法的合理性
 根据核查结果调整大数据分类过程
 访谈相关人员
访谈相关人员包括
 访谈数据分类执行者
方法与业务场景的关联性等
 访谈数据所有者
际情况
 访谈数据管理者数据存储方式类别划分
程度划分
 访谈数据使用者
交换方式类别划分
类别划分流通类型类别划分等是否符合实际应用情况
 核查意见和问题
调整大数据分类过程
 测试分类结果
测试分类结果包括
 对分类后的数据执行分类脚本或程序查看是否有不符合分类策略的分类结果
 核查意见和问题调整大数据分类过程
 
 
变更控制包括
 分析变更的必要性和合理性
 制定变更计划
评估变更对大数据分类工作的影响
包括分类维度
分类方法的改变等
 执行变更对分类结果进行更改记录变更过程
 对新的大数据分类结果进行评估
 发布新的大数据分类结果
 
定期评估包括
 定期评估大数据分类维度和方法的合理性检查其是否符合业务场景变化和分类视角变化
 定期评估大数据分类结果的有效性和应用情况
检查其是否满足业务应用需求的更新
 核查意见和问题
 分类视角
 
大数据分类视角分为技术选型视角
 技术选型视角
技术选型视角包括但不限于
 理清数据产生频率
确定数据存储平台配
型等存储资源分配方案
 理清数据产生方式
确定在整个数据处理流程中数据所处的位置
数据处理及存储技术
 分析数据的结构化特征
确定数据存储与处理方案
 明确数据的存储方式
访
支撑各类数据应用场景
 理清数据稀疏稠密程度
确定数据存储策略和分析方法
选择数据存
储方案和分析方案
 明确数据处理时效性要求选择包括计算平台和资源
匹配等的数据处理方案
 理清数据交换方式
支撑构建信息交换体系
 业务应用视角
业务应用视角包括但不限于
 理清数据产生来源
访
便于数据追踪溯源
 明确数据应用场景选择数据分析方案
 明确数据分发场景明确可用数据的种类和范围
 理清数据质量情况
 安全隐私保护视角
安全隐私保护视角包括但不限于
 明确不同敏感程度的大数据在存储访分发时的安全要求
 明确不同敏感程度的大数据的隐私保护要求
 指导分类主体制定隐私保护方案
 指导分类主体制定安全管理方案
 分类维度
 
本章从技术选型
数据类别和适用场景
 
 按产生频率分类
 
按产生频率分类是指根据数据产生的频率
数据进行分类
 
按产生频率分类的要素包括
 数据产生周期
 单位周期中数据的产生量
数表示或者以数据占用空间表示
如百万条记录
万条记录
级数据
 
按产生频率可分为
每分钟更新数据
 
按产生频率分类的适用场景
 按产生方式分类
 
 
按产生方式分类的要素包括
 数据被获取或被采集的方式通过信息系统采集等
 数据被加工的程度二次加工数据等
 
按产生方式分类可包括
感知设备产生数据
原始数据
二次加
工数据等
 
按产生方式分类的适用场景
 按结构化特征分类
 
按结构化特征分类是指根据数据的结构化程度对数据进行分类

标签: #技术

摘要:

提供了大数据分类过程及其分类视角、分类维度和分类方法等方面的建议和指导

展开>> 收起<<
GB_T 38667-2020 信息技术 大数据 数据分类指南.pdf

共18页,预览18页

还剩页未读, 继续阅读

温馨提示:66文库网--作为在线文档分享平台,一直注重给大家带来优质的阅读体验;让知识分享变得简单、有价值;海量文档供您查阅下载,让您的工作简单、轻松而高效! 1. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。 2. 66文库网仅提供信息存储空间,仅对广大用户、作者上传内容的表现方式做保护处理,对上传分享的文档内容本身不做任何修改或编辑,并不对下载的任何内容负责。 3. 广大用户、作者上传的文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。 4. 本站不保证、不承担下载资源内容的准确性、安全性和完整性, 同时也不承担用户因使用下载资源对自己和他人造成任何形式的伤害或损失。
分类:技术文献 价格:6.6库币 属性:18 页 大小:1.27MB 格式:PDF 时间:2024-07-19
/ 18
客服
关注