你所在的位置: 首页 > 正文

数据治理心得(元数据和数据安全管理)

2019-08-15 点击:1852

3062217-2d8f9c0c9656bc14.jpg

结合最近一段时间的工作内容,以及工作中的一些想法,总结一下,记录并分享,供大家参考。

清晰详细的文档对于理解,解释和使用数据至关重要。元数据详细说明了数据的内容,格式和内部关系,并使其他数据用户能够查找,使用和正确引用您的数据。

在系统开发和实施的初始阶段以及整个项目期间,更容易记录您的数据。如果您必须在项目结束时添加文档,则该过程将很痛苦,重要的细节将丢失或遗忘。

系统文档

>>>数据收集的基本原则和背景

>>>数据收集方法

>>>数据文件的结构和组织

>>>使用的数据源

>>>数据验证和质量保证

信息

数据集文档

>>>变量名称和描述

>>>使用的代码和分类方案的描述

>>>转换数据的算法

>>>使用的文件格式和软件(包括版本)

他们的数据可以根据元数据标准进行记录。一些元数据标准被设计用于记录文件的内容,用于记录文件的其他技术特征,以及一些用于表示一组数据内的文件之间的关系。

以下是您应记录的数据的一些常规方面。

概述

生成它的数据集或项目的名称

>>>创建者:创建数据的组织或个人的名称和地址;人名的首选格式是姓氏

>>>标识符:用于标识数据的唯一编号,即使它只是内部项目参考编号

>>>日期:与数据关联的关键日期,包括:项目开始和结束日期;发布日期;数据涵盖的时间段;以及与数据生命周期相关的其他日期,例如维护周期,更新时间表;首选格式为yyyy-mm-dd,或者yyyy.mm.dd-yyyy.mm.dd是范围

>>>方法:如何生成数据,列出使用的设备和软件(包括型号和版本号),公式,算法等。

>>>处理:如何更改或处理数据(例如,标准化)

引用其他来源的数据,包括源数据的保存位置和访问方式的详细信息

内容描述

描述数据主题或内容的关键字或短语

>>>位置:所有适用的物理位置

>>>语言:数据集中使用的所有语言

>>>变量列表:数据文件中的所有变量(如果适用)

>>>代码列表:文件名中使用的代码或缩写或数据文件中的变量的说明(例如,“999表示数据中缺少值”)

技术说明

>>>文件列表:与项目关联的所有文件,包括扩展程序

>>>文件格式:数据格式,如FITS,SPSS,HTML,JPEG等。

>>>文件结构:数据文件的组织和变量的布局(如果适用)

>>>版本:每个版本的唯一日期/时间戳和标识符

>>>权利:任何已知的知识产权,合法权利,许可或数据使用限制

>>>访问信息:您可以在何处以及如何访问数据

数据安全性保护数据免受未经授权的访问,使用,更改,泄露和破坏。通过以下方式确保您的数据安全:

网络安全

>>>保护机密数据

>>>在极端情况下,将敏感材料放在未连接到Internet的计算机上

身份安全

>>>限制对保存计算机或媒体的建筑物和房间的访问

>>>只让受信任的个人解决计算机问题

>>>计算机系统和文件

>>>使病毒防护保持最新

>>>不要通过电子邮件或FTP发送机密数据(如有必要,加密)

>>>在文件和计算机上设置密码

>>>谈及声称来自贵组织IT部门的电话和电子邮件

保持个人信息的机密性既是道德问题,也是企业的生命线。一旦发生用户隐私泄露,公司将失去用户的信任并面临灾难。数据治理人员需要了解和管理机密性要求与归档和发布数据的潜在好处之间的关系。

评估数据的匿名性。考虑您的数据包含直接或间接标识符的程度,这些标识符可以与其他公共信息结合以识别某人。

遵守法律。负责数据保密的州长应参考《个人信息管理规范》等国家标准及相关法律法规。

要以符合道德的方式分享机密数据,您可以:

>>>获得数据正文的明确同意

>>>通过删除标识信息来匿名化数据。但请注意,任何包含足够有用信息的数据集都会带来一些风险。

>>>您和其他人将来可以更轻松地读取未加密的数据,但您可能需要加密敏感数据。

>>>使用主流加密工具(例如,PGP)

>>>不要仅依赖第三方加密

>>>将密码和密钥保存在纸上(2份)

>>>未压缩的数据将来会更容易阅读,但您可能需要压缩文件以节省磁盘空间。

>>>使用主流压缩工具(例如ZIP,GZIP,TAR)

>>>限制压缩到第三个备份副本

>>>定期备份是数据管理不可或缺的一部分

>>>一个好的做法是在至少两个位置有三个副本(例如原始+外部/本地备份+外部/远程备份)

>>>按地理位置分发本地和远程副本,以降低同一地点发生灾难的风险(停电,洪水,火灾等)。

测试备份系统

要确保备份系统正常运行,请定期检索数据文件并确认您可以读取它们。您应该在最初设置系统时执行此操作,然后定期执行此操作。

谁负责管理和控制数据?

>>>谁控制数据?在花费大量时间确定如何存储数据,共享数据,命名数据等之前,您应该确保您有权这样做。

数据的目的是什么?

>>>谁是您的数据目标受众?您如何期望他们使用这些数据?这些问题的答案将有助于构建和分发数据。

数据需要保留多长时间?

>>>您要保留数据吗?如果是这样,需要多长时间? 3 - 5年,10 - 20年,永久?并非所有数据都需要保留,并且需要保留的一些数据不需要无限期保留。特别是个人信息,我们必须认真研究相关的法律法规和相关的国家标准,如《个人信息管理规范》,充分了解您保留数据的义务。

除了任何外部强加的要求之外,还要考虑数据的长期可用性。

日期归档
玛雅maya18登录 版权所有© www.blogdomau.com 技术支持:玛雅maya18登录 | 网站地图