登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書

『簡體書』数据综合治理实践指导手册

書城自編碼: 3720502
分類:簡體書→大陸圖書→工業技術一般工业技术
作者: 陈刚
國際書號(ISBN): 9787512146471
出版社: 北京交通大学出版社
出版日期: 2022-01-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 56.3

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
正念心理学:全面开启自我觉察与接纳的疗愈之旅
《 正念心理学:全面开启自我觉察与接纳的疗愈之旅 》

售價:HK$ 83.8
车用锂离子动力电池碰撞安全
《 车用锂离子动力电池碰撞安全 》

售價:HK$ 189.6
中国近代史(中国史学大家蒋廷黻典作品)
《 中国近代史(中国史学大家蒋廷黻典作品) 》

售價:HK$ 47.8
先跳了再说: 仓本聪的工作与生活哲学
《 先跳了再说: 仓本聪的工作与生活哲学 》

售價:HK$ 67.2
抗焦虑饮食(赠实践手册)
《 抗焦虑饮食(赠实践手册) 》

售價:HK$ 106.8
生活不是掷骰子:理性决策的贝叶斯思维
《 生活不是掷骰子:理性决策的贝叶斯思维 》

售價:HK$ 82.8
万有引力书系·基辅罗斯:东斯拉夫文明的起源
《 万有引力书系·基辅罗斯:东斯拉夫文明的起源 》

售價:HK$ 141.6
康熙的红票:全球化中的清朝
《 康熙的红票:全球化中的清朝 》

售價:HK$ 93.6

 

建議一齊購買:

+

HK$ 117.5
《 深入理解微电子电路设计——电子元器件原理及应用(原书第5版) 》
+

HK$ 110.0
《 汽车发动机故障诊断手册 》
+

HK$ 129.4
《 工业互联网:技术、实践与行业解决方案 》
+

HK$ 103.0
《 EPLAN电气设计从入门到精通 》
+

HK$ 98.8
《 KUKA工业机器人操作与运维 》
+

HK$ 45.0
《 浅埋煤层风氧化富水区域巷道失稳机理与控制 》
內容簡介:
本书简要阐述了数据治理的基本概念及相关理论,侧重于数据质量管理和数据集成两方面,介绍相关基本理论的同时,详细描述了自主研发的数据质量管理系统和多源数据汇集处理系统。基于这些数据治理软件,结合具体的实际案例,详细描述了数据质量管理与数据集成的典型功能。本书案例内容丰富,步骤翔实具体,有助于读者在理解数据质量管理和数据集成的基本理论的同时,能较全面地掌握数据质量管理与数据集成软件的常用功能及其操作方法。
  本书既可以作为高等院校信息管理与信息系统、信息资源管理、大数据工程以及计算机信息管理等专业本科生的教材或辅助读本,也可以作为企事业单位信息管理工作人员的培训教材。
目錄
第1章 数据治理概述 11.1 数据治理的定义 11.2 数据治理的基本要求 21.3 数据治理模型 31.4 数据治理一般步骤 5第2章 数据质量 82.1 数据质量概述 8 2.1.1 数据质量定义 8 2.1.2 数据质量问题 8 2.1.3 数据质量维度 102.2 数据清洗 10 2.2.1 数据清洗定义 10 2.2.2 数据清洗方法 11 2.2.3 数据清洗流程 21第3章 数据质量管理系统 253.1 数据源管理 25 3.1.1 关系数据库数据源管理 25 3.1.2 文件数据源管理 273.2 数据剖析 27 3.2.1 元数据 27 3.2.2 值预览 28 3.2.3 值分布分析 283.3 数据质量评估 29 3.3.1 指标体系维护 29 3.3.2 评估算法库 31 3.3.3 数据检查算子库 32 3.3.4 数据血缘关系维护 35 3.3.5 数据质量评估流程 37 3.3.6 评估任务库 403.4 数据清洗 40 3.4.1 清洗算子库 40 3.4.2 数据清洗流程 43 3.4.3 清洗任务库 45 3.4.4 清洗案例库 463.5 系统设置 46 3.5.1 用户管理 46 3.5.2 角色管理 47 3.5.3 模块管理 49 3.5.4 修改密码 52第4章 常用数据质量管理系统操作 534.1 规划评估指标 534.2 导入数据源 544.3 建立基础指标体系 564.4 创建数据质量评估任务 584.5 配置指标树 594.6 配置评估算子 594.7 设置指标聚合方式 614.8 执行评估方案 624.9 数据清洗 644.10 算子开发 66 4.10.1 算子开发与部署方法 66 4.10.2 算子开发实例 70第5章 数据集成 745.1 数据集成的概念 745.2 数据集成的方法 75 5.2.1 虚拟视图方法 76 5.2.2 物化方法 77 5.2.3 混合型集成方法 785.3 数据集成开发生命周期 79第6章 多源数据汇集处理系统 806.1 管理部分 80 6.1.1 用户管理 80 6.1.2 管理案例库 826.2 普通人员视图 84 6.2.1 历史库 85 6.2.2 案例模板库 86 6.2.3 数据源创建 87 6.2.4 预设向导模板 896.3 开发者视图 92 6.3.1 新建 92 6.3.2 打开 93 6.3.3 资源库 93 6.3.4 统计 94 6.3.5 模型校验 94 6.3.6 事前校验 96 6.3.7 测试模型 96 6.3.8 逐步测试 96 6.3.9 插入断点 97 6.3.10 插入监控点 98 6.3.11 大数据支持 99 6.3.12 日志和统计升级 99 6.3.13 数据预览 100第7章 常用数据集成功能操作 1017.1 数据集成准备 1017.2 表属性的计算汇总 1037.3 表数据分组统计 1137.4 表间数据关联 1247.5 脚本处理 1337.6 多表数据合并 1427.7 字段合并与数据分流 1517.8 数值范围标识 1627.9 作业处理 1707.10 综合操作(1) 1777.11 综合操作(2) 197参考文献 209
內容試閱
前 言
  
  随着信息量的剧增带来巨大的数据价值,人们已经意识到挖掘数据价值的重要性,但如何实现数据价值的化,始终未得到完美解决。由于各企业和部门之间的相互独立,容易造成信息系统之间的不兼容,数据结构存在较大差异,数据难以共享,形成信息的孤岛效应。为解决在获取数据价值过程中出现的这些典型难题,数据治理技术得到快速发展。数据治理从数据的全生命周期的各个环节做出专业的管理。
  本书重点介绍了数据治理中的两种常用的治理技术——数据质量管理和数据集成,并在自主研发的平台上基于典型的案例实现数据质量的管理和数据的集成。数据质量管理能够确保数据模式和数据实例的一致性、正确性、完整性和小性。数据集成可将分散的若干个数据源中的数据逻辑地或物理地集成到一个统一的数据集合体中,以统一的视图对外提供数据服务。因此,本书分为数据治理概述、数据质量管理、数据集成等三部分。
  第1部分数据治理概述共1章(第1章),介绍了不同机构体系对数据治理概念的理解,并从四个方面提出对数据治理定义的理解。在进行数据治理时,不同的机构体系都遵循一定的基本原则,具体阐述了COBIT5提出的五项原则。针对不同领域或行业,设计的数据治理模型会有所区别,IBM数据治理委员会提出了在业界认可度较高的数据治理模型。该模型从11个数据治理成熟度类别来度量数据治理能力。数据治理的步骤主要阐述了IBM数据治理委员会提出的统一流程。
  第2部分数据质量管理共3章(第2~4章),介绍了数据质量常见的三种定义,具体阐述了数据质量的问题分类以及评价数据治理的标准。数据清洗主要研究如何检测并消除数据中的错误和不一致等质量问题。根据常见的数据治理问题,如数据缺失、数据记录相似或重复、数据异常、数据逻辑错误等,提供了相应的数据清洗方法,同时总结了提高数据清洗效率的典型流程。数据质量管理系统是一款通过对数据质量建立各个指标维度后进行质量评估终实现数据清洗的软件系统,主要分为用于管理不同类型数据源的数据源管理、用于元数据查看预览的数据剖析、用于指标体系建立与维护以及支撑整个评估流程的数据质量评估、用于对完成数据评估的数据进行清洗的数据清洗、用于系统基本功能设置以及用户设置的系统设置等五大功能。基于数据质量管理系统,以教师信息为依托,介绍了常用的数据质量管理的操作流程,以及检查算子的开发方法。
  第3部分数据集成共3章(第 5~7 章),介绍了数据集成的概念,虚拟视图和物化及其混合的集成方法,以及数据集成的开发生命周期。多源数据汇集处理系统是一款基于 Kettle软件改造的专用数据集成软件,其核心功能和运行模式与Kettle基本一致。它能够以普通人员、专业数据人员、开发者等不同身份操作软件的功能。在该软件上,详细介绍了表属性的计算汇总、表数据分组统计、表间数据关联、脚本处理、多表数据合并、字段合并与数据分流、数据范围标识等典型数据集成方法,并阐述了这些典型方法的综合运用。
  本书由陈刚负责全面筹划、设计工作,其中第1、3、4章由陈刚负责编写,第5、6、7章由郝建东负责编写,第2章由张中辉负责编写,胡琨和于坤参与了部分章节的编写,郝建东负责统稿、校验、修订等工作。
  本书既可以作为高等院校信息管理与信息系统、信息资源管理、大数据工程以及计算机信息管理等专业本科生的教材或辅助读本,也可以作为企事业单位信息管理工作人员的培训教材,在理解数据治理,特别是数据质量管理和数据集成的相关理论的同时,通过数据质量管理和数据集成的典型软件,掌握数据治理的常用方法,提高实践操作能力。
  由于编者水平有限、编写时间紧迫,加之数据工程理论与技术不断发展,书中难免存有错误和不妥之处,敬请专家和广大读者不吝批评指正。编者将进一步完善和充实本书的内容。
  
  编著者
  2021年5月于南京

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.