DAMA数据管理知识体系(第9章 文件和内容管理)

  • 课本内容
    • 9.1 引言
      • 概要
        • 文件和内容管理是指针对存储在关系型数据库之外的数据和信息的采集、存储、访问和使用过程的管理[1]。它的重点在于保持文件和其他非结构化或半结构化信息的完整性,并使这些信息能够被访问。
      • 业务驱动因素
        • 法规遵从性要求
          • 法律法规要求组织保留某些活动的档案
        • 诉讼响应能力
        • 电子取证请求能力
          • 电子取证是查找可能作为法律诉讼证据的电子档案的过程
        • 业务连续性要求
          • 提高效率是改进文件管理的驱动力。文件管理方面的技术进步,有助于组织简化流程、管理工作流、消除重复性的手动任务并实现协作。
      • 语境图
        • 图9-1 语境关系图:文件和内容管理
      • 目标和原则
        • 目标
          • 1)确保能够高速有效地采集和使用非结构化的数据和信息。2)确保结构化和非结构化数据之间的整合能力。3)遵守法律义务并达到客户预期。
        • 原则
          • 1)组织中的每个人都应该在保护组织的未来方面发挥作用。每个人都必须按照既定的制度和程序来创建、使用、检索和处置档案。
          • 2)档案和内容处理方面的专家应充分参与制度和规划的制定。不同的行业和法律管辖区之间,监管实践可能会有很大的差异。
      • 档案保存指导原则
        • ARMA国际(非营利性的档案和信息管理专业协会)在2009年发布
        • 内容
          • 问责原则
          • 完整原则
          • 保护原则
          • 遵从原则
          • 可用原则
          • 保留原则
          • 处置原则
          • 透明原则
      • 基本概念
        • 内容
          • 内容管理
            • 内容管理(Content Management)包括用于组织、分类和构造信息资源的流程、方法和技术,以便以多种方式存储、发布和重复使用这些资源。
          • 内容元数据
            • 非结构化数据内容的元数据基于:
              • 格式
              • 可搜索性
              • 自我描述性
              • 既有模式
                • 是否可以采用或者适配现有的方法和模式(如在图书馆目录中)。
              • 内容主题
                • 人们可能在寻找的东西。
              • 需求
                • 需要进行彻底和详细的检索能力(如制药或核工业)。
          • 内容建模
            • 内容建模(Content Modeling)是将逻辑内容概念转换为具有关系的内容类型、属性和数据类型的过程
          • 内容分发方法
            • 内容需要模块化、结构化、可重复使用,且与设备和平台无关
            • 内容分发系统可分为三种,分别是推式、拉式和交互式。
        • 受控词表
          • 受控词表(Controlled Vocabularies)是被明确允许用于通过浏览和 搜索对内容进行索引、分类、标引、排序和检索术语的定义列表
          • 词汇表管理
            • 词汇表管理关键问题集中于用途、消费者、标准、维护 4 个方面。
          • 词汇表视图和微控制词汇表
            • 词汇表视图(Vocabulary View)是受控词表的子集,涵盖了受控词表领域内有限范围的主题。
          • 术语和选择列表
          • 术语管理
            • 关系的类型
              • 等价术语关系
              • 层次化关系
                • 它描述广义(一般)到狭义(特定)或整体-部分的关系。
              • 关联关系
                • 与受控词表中的另一个术语相关联,但这种关联不是层次化的。
          • 同义词环和规范表
            • 同义词环(Synonym Ring)是指一组含义大致相同的术语。
            • 规范表(Authority List)是描述性术语的受控词汇表,旨在促进特 定领域或范围内的信息检索
          • 分类法
            • 不同结构
              • 扁平分类法
                • 在受控类别集之间没有关系,所有类别都是平等的。这类似于列表。例如,一个包含多个国家的列表。
              • 层次分类法
                • 它是一种树结构,其中节点通过规则相互关联。
              • 多重层级结构
                • 它是具有多个节点关系规则的树状结构。
              • 面分类法
                • 它指的是每个节点与中心节点相关联,其形状看起来像星形图。
              • 网状分类法
                • 既可用于层级结构,也可用于刻面结构
          • 分类方案和打标签
          • 主题词表
            • 主题词表(Thesauri)又称叙词表,是一种用于内容检索的受控词 表。它结合了同义词列表和分类方案的特征。主题词表提供相关的每个 术语及其与其他术语的关系信息
          • 本体
            • 本体(Ontology)是一种分类法,它代表一套概念和它们在某个领 域内概念之间的关联
        • 文件和档案
          • 概要
            • 文件
              • 文件(Document)是包含任务说明,对执行任务或功能的方式和时间的要求以及任务执行和决策的日志等的电子或纸质对象。文
            • 档案
              • 档案可用于证明所做的决策和所采取的行动是符合程序的;可作为组织业务活动和法规遵从的证据。
          • 文件管理
            • 管理文件和档案的生 命周期包括
              • 编目
                • 识别已有的和新建的文件/档案。
              • 制度
                • 文件/档案制度的创建、批准和实施,包括文件/档案的保管制度。
              • 分类
                • 文件/档案的分类
              • 存储
                • 纸质和电子文件/档案的短期和长期存储。
              • 检索和流转
                • 在遵守制度、安全、控制标准和法律的情况下,允许文件/档案的访问和流通。
              • 保存和处置
                • 在遵守组织需求、规章和法规的情况下,对文件/档案进行归档和销毁。
          • 档案管理
            • 档案管理包括整个档案的生命周期:从档案的创 建或接收到处理、分发、组织和检索,再到处置
            • 精心管理的档案具备以下特点
              • 内容
                • 内容必须准确、完整和真实。
              • 背景
                • 关于档案的创建者、创建日期或与其他档案关系的描述性信息(元数据)应该在创建档案时收集、组织并维护。
              • 及时性
                • 档案应该在事件、行为或决定发生后立即创建。
              • 永久性
                • 一旦成为档案,则在档案的法定保存期内不能改变其内容。
              • 结构
                • 档案内容的外观和排版需要清晰,它们应被记录在正确的表格或模板上。
          • 数字资产管理
        • 数据地图
          • 数据地图(Data Map)是所有ESI数据源、应用程序和IT环境的清单,其中包括应用程序所有者、保管人、相关地理位置和数据类型等信息。
        • 电子取证
          • “取证”(Discovery)是一个法律术语,指诉讼的预审阶段,双方当事人互相要求对方提供信息,以查明案件事实,并了解双方的论点有多强。
        • 信息架构
          • 信息架构是为信息体或内容创建的结构
          • 包括以下组件
            • 1)受控词表。2)分类法和本体。3)元数据映射。4)搜索功能规格。5)用例。6)用户流。
        • 搜索引擎
        • 语义模型
          • 语义建模(Semantic Modeling)是一种知识建模,描述一系列概念网络(有关的想法或主题)以及它们之间的关系。
        • 语义搜索
          • 语义搜索(Semantic Search)侧重于语义和语境而非预先设定的关键字。
        • 非结构化数据
          • 存储、完整性、安全性、内容质量、访问和有效使用对非结构化数据的管理都具有指导作用。
        • 工作流
    • 9.2 活动
      • 规划生命周期的管理
        • 概要
          • 文件管理实践涉及文件生命周期的规划——从文件的创建或接收文 件后的分发、存储、检索、归档和潜在的销毁。规划包括开发分类/索 引系统和分类法,以实现文件的存储和检索。重要的是,生命周期规划 中需要为档案建立具体的制度。
        • 规划档案管理
        • 制定内容策略
          • 内容管理计划应直接支持组织以有效和全面的方式提供相关和有用的内容。
      • 创建内容处理制度
        • 制定的制度中需要描述行为的原则、方向和指南等信息,以帮助员工理解并遵守文件和档案管理的要求。
        • 其他制度
          • 社交媒体制度
          • 设备访问制度
          • 处理敏感数据
          • 应对诉讼
            • 组织应通过有前瞻性的电子取证措施,为时刻可能的诉讼请求做好准备(报最好的希望,做最坏的打算)。
      • 定义内容信息架构
        • 数据管理专业人员在处理非结构化数据和内容的参考数据及元数据 时,可能会涉及受控词汇表和术语
      • 实施的声明周期管理
        • 获取档案和内容
        • 管理版本的控制
          • ANSI 859标准基于数据的重要性以及数据损坏或不可用时可能造成的损害,将数据控制分为3个等级:正式、修订和托管。
        • 备份和恢复
          • 文件/档案管理系统需要包含在组织的整体企业备份和恢复活动 中,包括业务连续性和灾难恢复计划
        • 管理保管和处置
        • 审计文件/档案
      • 发布和分发内容
        • 开放访问、搜索和检索
        • 通过可接受的渠道分发
    • 9.3 工具
      • 企业内容管理系统
        • 文件管理
          • 文件管理系统是用于跟踪和存储电子文件和纸质文件的电子影像的 应用程序
          • 一些文件管理系统拥有工作流模块,可以支持不同的工作流,如:1)手动工作流,指示用户将文件发往何处。2)基于规则的工作流,通过制定规则指示文件在组织内的流向。3)动态规则,允许基于内容的不同工作流。
        • 内容管理系统
          • 内容管理系统(Content Management System,CMS)用于收集、组织、索引和检索内容,将内容存储为组件或整个文件,同时保持组件之间的链接。
        • 内容和文件工作流
      • 协作工具
        • 协作工具(Collaboration Tools)可用于收集、存储、工作流程和管理与团队活动相关的文件。
      • 受控词汇表和元数据工具
      • 标准标记和交换格式
        • 可扩展标示语言( XML)
        • 基于JavaScript语言的轻量级的数据交换格式( JSON)
        • 资源描述框架(RDF)和相关的万维网联盟(W3C)规范
          • RDF以主语(资源)-谓语(属性名称)-宾语(属性值)表达式或 三元组的形式来描述资源
      • 电子取证技术
    • 9.4 方法
      • 诉讼应诉手册
      • 诉讼应诉数据映射
    • 9.5 实施指南
      • 就绪评估/风险评估
        • 概要
          • ECM关键成功因素包括对现有内容的审核和分类、合适的信息体系结构、内容生命周期的支持、适当元数据标签的定义以及在ECM解决方案中自定义功能的能力。
        • 档案管理成熟度
          • ARMA有一个信息治理成熟度模型,它可 以帮助组织评估档案保存计划和实践
          • 信息治理成熟度模型分为5个等级
            • 1级,低于标准的
              • 信息治理和档案保管问题没有得到解决或只是最低限度的解决。
            • 2级,发展中的
              • 认识到信息治理和档案保管可能对组织产生的影响。
            • 3级,基本的
              • 必须满足法律法规的最低要求。
            • 4级,积极的
              • 已经建立了一个以持续改进为重点的主动式信息治理计划。
            • 5级,完成变革的
              • 信息治理已经融入企业的基础架构和业务流程中。
          • 档案管理系统和应用程序的技术评估
            • 1)电子档案管理软件应用系统设计标准(DoD 5015.2)。2)电子办公环境中档案管理原则与功能要求(ISO 16175)。3)电子档案管理通用需求(MoReq2)。4)对象管理组(OMG)的档案管理服务(RMS)规范。
        • 电子取证评估
          • 成熟的规划将明确规定角色和职责、保存协议、数据收集方法和披露流程。
      • 组织和文化变革
        • 隐私、数据保护、机密性、知识产权、加密、道德使用和身份,这应是文件和内容管理专业人员与其他员工以及管理层和监管机构合作一起处理的重要问题。
    • 9.6 文件和内容治理
      • 信息治理架构
        • 驱动因素
          • 1)法律和法规遵从。2)档案的合理处置。3)对电子取证的前瞻性准备。4)敏感信息的安全。5)电子邮件和大数据等风险领域的管理。
        • 信息治理参考模型
          • 图9-4 信息治理参考模型
          • 外环包括了实施信息管理过程中涉及的制度、标准、流程、工具和基础架构等方面,中心展示了一张生命周期图。IGRM是对ARMA的GARP®的补充。
      • 信息的激增
      • 管理高质量的内容
        • 定义高质量的内容需要了解它生产和使用的背景,
          • 1)生产者。谁创建内容?为什么要创建?2)消费者。谁使用信息?出于什么目的?3)时间。何时需要信息?需要多久更新或访问一次?4)格式。消费者是否需要特定格式的内容才能实现目标?是否有不可接受的格式?5)分发。信息将如何分发?消费者将如何获取信息?如何实施安全措施以防止对电子内容的不恰当访问?
      • 度量指标
        • 概要
          • 关键业绩指标(KPI)是衡量组织绩效与目标的定量和定性指标。可以在战略和运营层面制定关键绩效指标。
        • 档案管理
          • 在战略层面,可以在档案管理法规遵从(如满足要求所花费的时间)和/或治理(如遵守制度)方面制定KPI。在运营层面,可以在档案管理资源(如运营和资本成本)、培训(如给定的类别数量、受过培训的员工数量及水平)、日常档案管理服务的提供与操作(如满足用户服务水平协议(SLA)的百分比)和/或档案管理功能与其他业务系统的整合(如集成的百分比)等方面制定KPI。
        • 电子取证
          • 电子取证常见的一个KPI指标是成本降低,另一个KPI指标是对比被动收集信息的方式,提前收集信息时提高的效率(如转为电子取证平均需要几天时间)。
        • 企业内容管理
          • 应制定KPI来衡量企业内容管理(ECM)的有形和无形效益。有形效益包括提高生产力、降低成本、提高信息质量和改善合规性;无形效益包括增进协作、简化工作程序和工作流。
  • 考察分值&知识点
    • 考察分值
      • 2分

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/442556.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

每日OJ题_牛客_平方数_数学_C++_Java

目录 牛客_平方数_数学 题目解析 C代码1暴力 C代码2数学 Java代码数学 牛客_平方数_数学 平方数 (nowcoder.com) 描述: 牛妹是一个喜欢完全平方数的女孩子。 牛妹每次看到一个数 x,都想求出离 x 最近的完全平方数 y。 每次手算太麻烦,…

LeetCode讲解篇之322. 零钱兑换

文章目录 题目描述题解思路题解代码题目链接 题目描述 题解思路 我们可以使用动态规划解决这道题,我们首先定义一个数组,数组中第i个元素表示组成金额 i 的最少硬币个数 我们遍历数组的1 ~ amount号位置,对coins进行遍历,查找选…

Chromium 搜索引擎功能浅析c++

地址栏输入:chrome://settings/searchEngines 可以看到 有百度等数据源,那么如何调整其顺序呢,此数据又存储在哪里呢? 1、浏览器初始化搜索引擎数据来源在 components\search_engines\prepopulated_engines.json // Copyright …

【C语言刷力扣】1678.设计Goal解析器

题目: 解题思路: 遍历分析每一个字符,对不同情况分别讨论。 若是字符 G ,则 res 中添加字符 G若是字符 ( ,则再分别讨论。 若下一个字符是 ), 则在 res 末尾添加字符 o若下一个字符…

【CSS in Depth 2 精译_045】7.1 CSS 响应式设计中的移动端优先设计原则(上)

当前内容所在位置(可进入专栏查看其他译好的章节内容) 第一章 层叠、优先级与继承(已完结) 1.1 层叠1.2 继承1.3 特殊值1.4 简写属性1.5 CSS 渐进式增强技术1.6 本章小结 第二章 相对单位(已完结) 2.1 相对…

分布式锁--redission 最佳实践!

我们知道如果我们的项目服务不只是一个实例的时候,单体锁就不再适用,而我们自己去用redis实现分布式锁的话,会有比如锁误删、超时释放、锁的重入、失败重试、Redis主从一致性等等一系列的问题需要自己解决。 当然,上述问题并非无…

刷题 二叉树

二叉树的核心思想 - 递归 - 将问题分解为子问题 题型 递归遍历迭代遍历层序遍历 bfs:队列各种递归题目:将问题分解为子问题二叉搜索树 - 中序遍历是递增序列 TreeNode* &prev 指针树形dp 面试经典 150 题 - 二叉树 104. 二叉树的最大深度 广度优…

DDD简介

概述 传统的数据驱动开发模式,View、Service、Dao这种三层分层模式,会很自然的写出过程式代码,这种开发方式中的对象只是数据载体,而没有行为,是一种贫血对象模型。以数据为中心,以数据库ER图为设计驱动&a…

JavaSE - 基础语法

01 背景知识补充 ① Java统治了后台服务器的开发,比如京东,淘宝网站的后台服务器就是使用的Java进行开发的 ② Java之父:詹姆斯高斯林 ③ Java由sun公司研发,现在属于Oracle公司 02 注释 ① Java的注释有三种:单行…

快速启动工具 | Biniware Run v7.1.0.0 绿色中文版

Biniware Run是一款便携式的Windows生产力工具,旨在为用户提供快速访问其喜爱的网站地址、文件和文件夹的便捷方式。这款软件的特点在于其易用性和高度可定制性。用户可以通过简单的拖放操作,将网址、文件或文件夹添加到软件中,从而快速访问。…

网络层协议 --- IP

序言 在这篇文章中我们将介绍 IP协议,经过这篇文章的学习,我们就会了解运营商到底是如何为我们提供服务的以及平时我们所说的内网,公网到底又是什么,区别是什么? IP 地址的基本概念 1. IP 地址的定义 每一个设备接入…

【进阶OpenCV】 (4)--图像拼接

文章目录 图像拼接1. 读取图片2. 计算图片特征点及描述符3. 建立暴力匹配器4. 特征匹配5. 透视变换6. 图像拼接 总结 图像拼接 图像拼接是一项将多张有重叠部分的图像(这些图像可能是不同时间、不同视角或者不同传感器获得的)拼成一幅无缝的全景图或高分…

AI学习记录 - L2正则化详细解释(权重衰减)

大白话: 在反向传播时,加入额外的损失值,让总损失值变得比原来更大,并且加入的损失值要关联到神经网络全部权重的大小,当出现权重的平方变大的时候,也就是网络权重往更加负或者更加正的方向走的时候&#…

【答疑解惑】图文深入详解undo和redo的区别及其底层逻辑

题记:最近有些人问我,undo和redo到底是什么关系,他们中不乏已经入行3-4年的同学,今天咱们就来深入探讨下到底什么是undo和redo,他们分别做什么,底层逻辑原理是什么等等。 1. undo 1.1 undo的存储结构 Un…

叶国富“推翻”马云新零售,零售新王此刻登基?

63亿入主永辉超市,拿到29.4%股份,坐上永辉超市第一大股东的宝座,名创优品创始人叶国富,成为了新科“零售之王”。 很是霸气外漏。 有投资者表示费解,不明白为何此时入局超市行业,叶国富当即召开电话会议&…

Selenium自动化测试的显示等待

在进行UI自动化测试的时候,我们为了保持用例的稳定性,往往要设置显示等待,显示等待就是说明确的要等到某个元素的出现或者元素的某些条件出现,比如可点击、可见等条件,如果在规定的时间之内都没有找到,那么…

我们如何构建 ClickHouse 内部的数据仓库:一年回顾的思考 【Part2】

本文字数:4105;估计阅读时间:11 分钟 作者:Mihir Gokhale 本文在公众号【ClickHouseInc】首发 一年前,我的同事 Dmitry Pavlov 介绍了我们如何在 ClickHouse Cloud 上构建了公司内部的数据仓库,简称 “DWH”…

外贸财务管理必备,6款热门软件优势对比

外贸企业的财务管理面临着多币种结算、汇率波动、跨境支付等复杂问题。本文将盘点Zoho Books、KashFlow、Sage Intacct等六款热门的外贸财务软件,并探讨它们各自的优势与特点,以帮助外贸企业做出明智的选择。 一、Zoho Books Zoho Books是一款面向中小企…

RNN(循环神经网络)简介及应用

一、引言 在深度学习领域,神经网络被广泛应用于各种任务,从图像识别到语音合成。但对于序列数据处理的任务,如自然语言处理(NLP)、语音识别或时间序列预测等,传统的前馈神经网络(Feedforward N…

docker compose入门5—创建一个3副本的应用

1. 定义服务 version: 3.8 services:web:image: gindemo:v2deploy:replicas: 3ports:- "9090" 2. 启动服务 docker compose -f docker-compose.yml up -d 3. 查看服务 docker compose ps 4. 访问服务