登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書

『簡體書』数据星河:构建现代化数据仓库之路

書城自編碼: 4108106
分類:簡體書→大陸圖書→計算機/網絡操作系統/系統開發
作者: 程志远、左岩、翟文麟
國際書號(ISBN): 9787302686668
出版社: 清华大学出版社
出版日期: 2025-05-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 64.9

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
城市计算    郑宇
《 城市计算 郑宇 》

售價:HK$ 130.9
赢在常识:巴菲特的投资原则
《 赢在常识:巴菲特的投资原则 》

售價:HK$ 54.8
第六次中国总膳食研究
《 第六次中国总膳食研究 》

售價:HK$ 657.8
明清戏曲剧目简评与戏曲小语
《 明清戏曲剧目简评与戏曲小语 》

售價:HK$ 63.8
基于模型的系统工程--建模与模型驱动技术
《 基于模型的系统工程--建模与模型驱动技术 》

售價:HK$ 217.8
盘活——顶尖技术人才争夺内幕(上、下册)
《 盘活——顶尖技术人才争夺内幕(上、下册) 》

售價:HK$ 151.8
百年澳门——明信片里的城市记忆
《 百年澳门——明信片里的城市记忆 》

售價:HK$ 118.8
请别当众夸奖我!:受困于“好孩子综合征”的日本年轻人 (洞悉“躺平”背后的隐形压力,缓解从校园到社会的过渡之痛。)
《 请别当众夸奖我!:受困于“好孩子综合征”的日本年轻人 (洞悉“躺平”背后的隐形压力,缓解从校园到社会的过渡之痛。) 》

售價:HK$ 49.5

編輯推薦:
本书旨在为广大读者提供全面、系统、实用的数据仓库建设参考和指导。无论是从事数据仓库设计和管理的专业人士,还是具备基本数据库知识的技术爱好者都能够从本书中找到适合自己的学习和实践路径,助力企业走向数据驱动的未来。
內容簡介:
本书以数据仓库建设内容为主线,以理论基础为核心,引导读者渐进式地学习数据仓库建设版图中所需知识。通过认识数据基建、数据质量、数据安全、实时技术、数据治理、数据资产、数据服务、数据应用等8个模块及常见遇到项目,使读者能够了解日常数据仓库开发流程及数据仓库工作具体内容,从而快速上手数据仓库建设工作。 來源:香港大書城megBookStore,http://www.megbook.com.hk
本书共14章,分为基础篇、基建篇、应用篇、评价篇、展望篇。基础篇(第1章和第2章)介绍数据仓库框架和数据模型建设知识点;基建篇(第3~8章)详细讲述数据仓库中每个板块建设,由简入深剖析搭建背景及搭建中细节;应用篇(第9~11章)通过实战讲解,快速上手数据仓库常见项目;评价篇(第12章和第13章)结合数据仓库基建和项目,阐述完整数据仓库需要具备的条件,并补充评价体系指标;展望篇(第14章)结合当前AIGC应用衍生出数据仓库未来发展探索;本书示例代码丰富,实际性和系统性较强,并配有视频讲解,助力读者透彻理解书中的重点、难点。
本书适合初学者入门,也适合工作多年数据仓库开发者借鉴学习,亦可作为高等院校和培训机构相关专业的教学参考书。
關於作者:
程志远,前阿里巴巴数据技术及产品部下数据研发工程师,现某大型互联网公司数据仓库工程师,数据仓库全局版图规划者,全链路数据保障提出者及建设者,主导过2021阿里巴巴某业务线双十一实时链路建设,能够对多场景业务线提供解决架构方案。
左岩,中国电信股份有限公司技术专家,有着多年的数据领域从业经验,擅长实时数据、数据治理、数据分析等方面的设计与实施。Apache Flink、Apache Doris、Flink CDC 、StarRocks、Fluss等开源项目Contributor,对于流式计算、实时数仓等技术有深入的研究。
翟文麟,曾担任美团点评、京东等互联网大厂资深数据研发工程师。负责部门数据架构制定与规划,参与集团数据治理与数据应用的规划和制定。从业务角度出发,将数据转化为资产,最终实现技术价值。
目錄
本书源码

基础篇
第1章认识数据仓库00
1.1大数据在如今社会中的运用00
1.2大数据相关岗位介绍00
1.2.1数据仓库岗位介绍00
1.2.2数据平台岗位介绍00
1.2.3数据分析岗位介绍00
1.2.4数据产品岗位介绍00
1.2.5数据挖掘岗位介绍00
1.3大数据在企业中的组织架构00
1.3.1数据中台00
1.3.2业务线数据00
1.4数据仓库岗在大数据生态中的定位00
1.4.1数据仓库概念00
1.4.2数据仓库定位00
1.5数据仓库发展史00
1.5.1数仓1.0传统数据仓库时代00
1.5.2数仓2.0 Hadoop生态时代00
1.5.3数仓3.0云端及数据平台时代00
1.5.4数仓4.0湖仓一体时代00
1.6数据仓库建设内容简介00
1.6.1数据仓库建设版图0
1.6.2数据基建简介0
1.6.3数据资产简介0
1.6.4数据服务简介 0
1.6.5数据应用简介0
1.7数据仓库架构介绍0
1.7.1Lambda架构0
1.7.2HSAP架构0
1.7.3流批一体架构0
1.7.4Doris架构0
1.8数据仓库所使用的技术栈0
第2章数据仓库模型建设0
2.1OLTP与OLAP0
2.1.1什么是OLTP0
2.1.2什么是OLAP0
2.1.3OLTP与OLAP的区别0
2.2数据仓库分层0
2.2.1数据仓库分层原理0
2.2.2数据仓库分层内容0
2.3数据仓库模型介绍0
2.4数据仓库模型建设方法0
2.4.1三范式建模与维度建模介绍0
2.4.2三范式建模与维度建模区别0
2.5数据模型建设的具体流程0
2.5.1数据模型设计的基本原则0
2.5.2数据模型设计过程0
2.5.3数据模型建设五要素0
2.6数据域与主题域0
2.7事实表设计0
2.7.1事实表类型0
2.7.2三类事实表区别0
2.7.3全量和增量0
2.7.4拉链表0
2.7.5完整的数据模型内容案例0
2.8数据标准介绍0
2.8.1数据模型命名规范0
2.8.2数据模型命名词根0
2.8.3字段命名规范0
2.8.4字段类型规范0
2.8.5数据模型元数据规范0
2.8.6数据模型分区生命周期0
2.9数据模型发展周期0
2.10数据模型分层新式方法0
基建篇
第3章元数据0
3.1元数据定义及分类0
3.1.1元数据定义0
3.1.2元数据分类0
3.2元数据模型0
3.2.1确定元数据对象0
3.2.2确定元数据属性0
3.2.3确定元数据关系0
3.2.4创建元数据模型0
3.3元数据管理0
3.3.1元数据采集与收集0
3.3.2元数据存储0
3.3.3元数据维护0
3.3.4元数据使用0
3.4元数据管理工具0
3.5数据血缘0
3.5.1数据血缘功能0
3.5.2数据血缘类型0
第4章数据指标体系0
4.1数据指标概念0
4.2数据指标分类0
4.2.1按用途分类0
4.2.2按计算方法分类0
4.2.3按时间范围分类0
4.3数据指标设计0
4.3.1明确目标0
4.3.2选择方法0
4.3.3确保一致性0
4.3.4词根分类0
4.4数据指标的应用场景0
4.4.1数据明细报表0
4.4.2数据可视化图0
4.4.3数据挖掘0
4.4.4指标监控0
4.5数据指标中心建设0
4.5.1数据指标中心建设的目的0
4.5.2数据指标中心解决的痛点问题0
4.5.3数据指标中心建设流程0
第5章数据质量0
5.1数据质量背景0
5.1.1数据质量概念0
5.1.2数据质量存在的痛点问题0
5.2数据质量保障措施0
5.2.1制定数据模型及指标的上线变更规范0
5.2.2数据质量监控0
5.2.3数据基线及SLA0
5.2.4容灾备份快速恢复能力0
5.2.5数据问题上报平台0
5.2.6源头数据质量长期监测跟踪体系0
5.3推动上下游开展数据质量建设活动0
5.3.1数据仓库发展期0
5.3.2数据仓库成熟期0
5.4数据质量思考0
第6章数据安全0
6.1数据安全背景0
6.2数据安全实施难点0
6.2.1数据安全要做什么0
6.2.2数据安全现状梳理0
6.2.3数据安全保障方向0
6.3数据安全保障流程0
6.3.1角色权限管理0
6.3.2数据使用权限管理0
6.3.3数据模型分级0
6.3.4数据展示0
6.3.5数据风险预期管理0
6.3.6数据脱敏0
6.4数据安全实施阶段0
6.4.1早期数据安全实施0
6.4.2成熟期数据安全实施0
6.5数据安全思考0
第7章数据治理0
7.1数据治理背景0
7.1.1合规治理0
7.1.2资源治理0
7.2数据仓库发展阶段0
7.3数据治理内容0
7.3.1数据模型合规治理0
7.3.2数据质量合规治理0
7.3.3数据安全合规治理0
7.3.4存储资源治理0
7.3.5计算资源治理0
7.3.6小文件治理

7.4推动上下游开展数据治理活动方法
7.5数据治理思考与沉淀
第8章实时技术
8.1实时数据仓库搭建背景
8.2实时架构及组件
8.2.1实时数据仓库架构
8.2.2实时数据仓库组件
8.3实时开发流程
8.4实时链路优化
8.5实时技术产出量化
应用篇

第9章数据资产
9.1数据资产介绍
9.2风险名单数据资产(消费金融业务)
9.2.1项目背景
9.2.2项目流程介绍
9.2.3项目流程
9.2.4项目难点
9.2.5项目思考
9.3各场景下用户画像体系建设
9.3.1用户画像介绍
9.3.2项目背景
9.3.3项目流程介绍
9.3.4项目流程
9.3.5项目难点
9.3.6项目思考
第10章数据服务
10.1数据服务介绍

10.1.1数据服务概念
10.1.2当前数据应用时存在的痛点问题
10.2数据服务建设内容
10.2.1指标中心
10.2.2标签画像管理平台
10.2.3数据资产门户
10.2.4数据质量中心
10.2.5数据安全中心
10.2.6数据模型设计中心
10.2.7OneID
10.2.8数据治理360
10.3数据服务建设周期
10.3.1探索期
10.3.2扩张期
第11章数据应用
11.1数据应用介绍
11.2神策明星榜数据(视频行业业务)
11.2.1项目背景
11.2.2项目流程介绍
11.2.3项目流程
11.2.4项目难点
11.2.5项目思考
11.3员工离职动因专项分析(人力资源业务)
11.3.1项目背景
11.3.2业务视角分析
11.3.3项目流程
11.3.4项目思考
11.4征信系统专题分析
11.4.1项目背景
11.4.2项目流程
11.4.3项目产出
11.4.4项目思考

评价篇

第12章评价数据仓库的好坏
12.1数据质量层面评估
12.1.1数据质量问题产生的原因
12.1.2数据质量评估方法
12.2数据模型层面评估
12.2.1数据模型问题产生的原因
12.2.2数据模型评估方法
12.3数据安全层面评估
12.3.1数据安全问题产生的原因
12.3.2数据安全评估方法
12.4数据成本及性能层面评估
12.4.1数据成本过高及性能过低的原因
12.4.2数据成本及性能层面评估方法
第13章数据价值
13.1抽象的数据能力架构
13.1.1数据传输能力
13.1.2数据计算能力
13.1.3数据资产能力
13.1.4数据算法能力
13.2数据能力对数据价值的呈现
13.3数据价值对业务的帮助
13.3.1用户增长/经营性分析
13.3.2数据质量/产出稳定
13.3.3查数/用数提效
13.3.4降低部门支出

展望篇
第14章AIGC对数据发展的影响
14.1数据与AI的关系
14.2网易ChatBI介绍
14.3网易ChatBI功能
14.3.1需求理解能力
14.3.2提供用户所需内容的预测能力
14.3.3多轮对话能力
14.3.4图表绘制能力
14.3.5多端互通能力
14.3.6过程可验证能力
14.3.7用户可干预能力
14.4数据产品未来规划
14.4.1网易ChatBI产品未来规划
14.4.2其他数据产品未来规划
內容試閱
尊敬的读者,在当今大数据时代,数据已成为企业发展和竞争的重要资源之一。然而,由于数据来源复杂、数据量庞大、数据类型多样等因素,企业往往难以有效地利用这些数据来支持业务决策和创新发展。

现如今,解决数据问题的方案有很多,如数据库、数据仓库、数据湖等。各种技术架构也层出不穷。同时随着云计算的普及,以上架构也分为云集群和本地集群,这两种方案的人力成本和物力成本千差万别。在如此繁多且复杂的架构中,如何选出适合自身业务的一款是重中之重。本书也会对不同的架构进行详细介绍,并给出具体场景以供参考。

数据仓库是解决这一矛盾的有效手段之一。它将分散的数据集成、整合,提供一致的数据视图和查询接口,帮助企业更好地理解自己的业务情况和市场趋势,从而做出更明智的决策。
本书旨在介绍数据仓库的基本概念、架构设计、实施方法和应用案例,全面阐述数据仓库的建设过程和管理方法。具体来讲,书中包含以下14章。
第1章: 认识数据仓库,介绍数据仓库的基本定义、历史背景和发展趋势,帮助读者深入了解数据仓库的意义和作用。
第2章: 数据仓库模型建设,介绍数据仓库的模型结构、维度建模方法和设计原则,帮助读者理解数据仓库的数据模型和关系结构。
第3章: 元数据,介绍元数据的定义、分类、建模和管理方法,帮助读者全面掌握元数据管理的重要性和实现方法。
第4章: 数据指标体系,介绍数据指标的概念、分类、设计和应用方法,帮助读者了解数据指标的本质和作用。
第5章: 数据质量,介绍数据质量的定义、评估、提升和监控方法,帮助读者掌握数据质量管理的技术和实践。
第6章: 数据安全,介绍数据安全的定义、威胁、保障和监管方法,帮助读者理解数据安全的重要性和保护方法。
第7章: 数据治理,介绍数据治理的定义、框架、流程和实施方法,帮助读者理解数据治理的目标和实践。
第8章: 实时技术,介绍实时计算技术的原理、架构和实现方法,帮助读者掌握实时数据仓库的设计和实现方法。
第9章: 数据资产,介绍数据资产的定义、价值、管理和利用方法,帮助读者充分发挥数据资产的价值和效能。
第10章: 数据服务,介绍数据服务的概念、分类、架构和实现方法,帮助读者了解数据服务的本质和应用方法。
第11章: 数据应用,介绍数据应用的概念、类型、开发和部署方法,帮助读者掌握数据应用的设计和实现技术。
第12章: 评价数据仓库的好坏,介绍数据仓库在建设后的评价体系,以及评价标准,帮助读者了解数据仓库建设过程的缺陷。
第13章: 数据价值,介绍数据对业务侧提供数据支撑带来的价值收益评估,帮助读者量化数据带来的影响。
第14章: AIGC对数据发展的影响,介绍数据与人工智能结合实现业务提效所带来的业务发展,帮助读者了解当前最新数据产品框架。
资源下载提示
素材(源码)等资源: 扫描目录上方的二维码下载。

本书旨在为广大读者提供全面、系统、实用的数据仓库建设参考和指导。无论是从事数据仓库设计和管理的专业人士,还是具备基本数据库知识的技术爱好者都能够从本书中找到适合自己的学习和实践路径,助力企业走向数据驱动的未来。希望本书能够为您提供有益的帮助和启示。

笔者
2025年1月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2025 (香港)大書城有限公司  All Rights Reserved.