登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書

『簡體書』智能数据工程

書城自編碼: 4102414
分類:簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 岳昆、段亮、武浩、吴鑫然
國際書號(ISBN): 9787302682615
出版社: 清华大学出版社
出版日期: 2025-03-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 54.8

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
全球对话主义(第二版)
《 全球对话主义(第二版) 》

售價:HK$ 107.8
思考,快与慢
《 思考,快与慢 》

售價:HK$ 107.8
集成式机器学习算法理论与应用
《 集成式机器学习算法理论与应用 》

售價:HK$ 108.9
宋以前医籍考
《 宋以前医籍考 》

售價:HK$ 286.8
华夏文库儒学书系:明代遗民:顾炎武、王夫之、黄宗羲
《 华夏文库儒学书系:明代遗民:顾炎武、王夫之、黄宗羲 》

售價:HK$ 25.4
中国书法之美:汉字美的历程
《 中国书法之美:汉字美的历程 》

售價:HK$ 136.8
葡萄酒与战争:法国人与纳粹的斗争(格致·格尔尼卡)
《 葡萄酒与战争:法国人与纳粹的斗争(格致·格尔尼卡) 》

售價:HK$ 73.2
2025年版 中华人民共和国药典(1~4部)
《 2025年版 中华人民共和国药典(1~4部) 》

售價:HK$ 4875.4

編輯推薦:
1、编写理念新颖
以“数据管理-数据挖掘-知识发现”为主线,将智能数据处理及分析的理论方法与Python程序实现相结合,提供智能数据工程“思想-模型-技术-实现”四位一体的知识学习框架,培养学生的数据思维、算法思维和编程思维。各章围绕数据处理及分析的典型任务,从不同类型数据的特点出发,介绍架构、模型及算法,注重智能数据处理及分析理念的传递。
2. 内容系统全面
数据管理篇介绍以基数估计为代表的关系数据库查询优化技术,经典信息检索模型和Web信息检索技术,数据仓库、数据湖和向量数据库这三种数据组织方式及相关技术;数据挖掘和智能分析篇介绍高维数据的降维、分类和聚类挖掘技术,围绕目标检测、图像分割和视频目标跟踪的视觉数据分析技术,围绕语言模型、情感分析和机器翻译的文本数据分析技术,围绕节点分类、链接预测和社区发现的图数据分析技术;知识表示和知识推理篇介绍知识图谱构建、嵌入和推理技术,以及贝叶斯网构建和推理技术。
3、教学资源丰富
针对智能数据处理及分析的各类任务,给出问题背景、模型思想、核心算法,读者扫描书中的二维码即可观看演示动画。配套教学课件和习题参考答案,读者可从清华大学出版
內容簡介:
本书以“数据管理—数据挖掘—知识发现”为主线,将智能数据处理及分析的理论方法与Python程序实现相结合。作者开发了基于Git的在线编程平台和案例库,旨在构建智能数据工程“思想—模型—技术—实现”四位一体的知识学习框架。本书围绕数据处理及分析的典型任务,从不同类型数据的特点出发,介绍架构、模型及算法,注重智能数据处理及分析理念的传递。 來源:香港大書城megBookStore,http://www.megbook.com.hk
本书介绍智能数据工程的经典方法和前沿技术,包括数据管理篇、数据挖掘和智能分析篇、知识表示和知识推理篇三部分。数据管理篇(第1~3章)介绍关系数据库查询优化、经典信息检索、数据组织和架构技术;数据挖掘和智能分析篇(第4~7章)介绍高维数据挖掘、视觉数据分析、文本数据分析和图数据分析技术;知识表示和知识推理篇(第8~9章)介绍知识图谱和贝叶斯网模型及相应的知识推理技术。
学习本书,读者需要具有计算机程序设计、数据库技术、深度学习的基础知识,以及使用开源平台的基本能力。本书可作为计算机和电子信息类相关专业研究生、高年级本科生数据工程、人工智能或机器学习等相关课程的教材,也可作为数据科学及人工智能等相关学科研究和开发人员的参考书。教师可根据学生类别、课程性质、学分设置和学习目标选择不同篇(或章)开展教学。
目錄
第1篇数据管理篇
第1章关系数据库查询优化3
1.1关系数据库查询优化概述3
1.2基数估计4
1.2.1基数估计概述4
1.2.2传统基数估计5
1.2.3基于机器学习的基数估计12
1.3思考题22
第2章信息检索24
2.1信息检索概述24
2.1.1信息检索的概念24
2.1.2信息检索的基本原理25
2.1.3信息检索相关学科和研究内容26
2.2信息检索模型28
2.2.1信息检索系统的形式表示28
2.2.2布尔模型29
2.2.3向量空间模型29
2.3文本信息检索33
2.3.1词汇的频率与数量分布规律33
2.3.2文本信息预处理34
2.3.3文本信息的倒排索引35
2.4Web信息检索39
2.4.1Web信息搜索的概念和工作原理39
2.4.2搜索引擎中的网页去重技术41
2.4.3搜索引擎中的结果排序技术43
2.5信息检索评价指标49
2.5.1单个查询的评价指标49
2.5.2多个查询的评价指标51
2.5.3面向用户的评价指标52
2.6思考题53
第3章数据组织和架构55
3.1数据组织概述55
3.2数据仓库56
3.2.1数据仓库的基本特征56
3.2.2从操作型系统到信息型系统57
3.2.3数据仓库体系结构57
3.3数据湖63
3.3.1数据湖概述63
3.3.2数据湖与数据中台64
3.3.3数据湖体系结构65
3.3.4Apache Hudi简介68
3.4向量数据库71
3.4.1向量数据库概述71
3.4.2向量数据库的索引技术72
3.4.3向量数据库的搜索技术74
3.4.4向量数据库产品介绍75
3.5思考题77
第2篇数据挖掘和智能分析篇
第4章高维数据挖掘81
4.1高维数据挖掘概述81
4.2数据降维82
4.2.1自编码器82
4.2.2变分自编码器85
4.3数据分类88
4.3.1朴素贝叶斯分类88
4.3.2支持向量机91
4.4数据聚类95
4.4.1k均值聚类95
4.4.2CLIQUE聚类97
4.4.3谱聚类101
4.5思考题104
第5章视觉数据分析106
5.1视觉数据分析概述106
5.2目标检测107
5.2.1目标检测概述107
5.2.2卷积神经网络108
5.2.3YOLO算法110
5.3图像分割113
5.3.1图像分割概述113
5.3.2Mask RCNN算法114
5.4视频目标跟踪119
5.4.1视频目标跟踪概述119
5.4.2Siamese FC算法120
5.5思考题123
第6章文本数据分析125
6.1文本数据分析概述125
6.2语言模型126
6.2.1语言模型概述126
6.2.2传统语言模型126
6.2.3BERT预训练语言模型127
6.3情感分析131
6.3.1情感分析概述131
6.3.2基于情感词典的情感分析132
6.3.3基于BERT的情感分析133
6.4机器翻译135
6.4.1机器翻译概述135
6.4.2基于LSTM的神经机器翻译136
6.4.3基于BERT的机器翻译模型140
6.5思考题144
第7章图数据分析146
7.1图数据分析概述146
7.2图神经网络147
7.3节点分类149
7.3.1节点分类概述149
7.3.2基于GCN的节点分类150
7.4链接预测154
7.4.1链接预测概述154
7.4.2基于GCN的链接预测154
7.5社区发现158
7.5.1社区发现概述158
7.5.2基于GCN的社区发现159
7.6评价指标162
7.7思考题164
第3篇知识表示和知识推理篇
第8章知识图谱169
8.1知识图谱概述169
8.2知识图谱构建170
8.2.1命名实体识别171
8.2.2关系抽取174
8.2.3实体关系联合抽取177
8.3知识图谱嵌入179
8.3.1距离模型179
8.3.2双线性模型182
8.4知识图谱推理183
8.4.1基于规则的推理184
8.4.2基于神经网络的推理186
8.5思考题191
第9章贝叶斯网192
9.1贝叶斯网概述192
9.2贝叶斯网构建193
9.2.1基本概念193
9.2.2学习算法193
9.3基于贝叶斯网的概率推理198
9.3.1精确推理算法198
9.3.2近似推理算法200
9.4思考题202
参考文献204
內容試閱
随着数据处理、互联网和人工智能技术的快速发展和迅速普及,当代计算机学科发生了深刻变化,即“以计算为中心”转变到“以数据为中心”。随着新一轮科技革命和产业变革深入推进,智能数据处理及分析技术在科学研究、工业生产、社会治理等领域中发挥着不可替代的作用,成为发展人工智能新质生产力的重要技术基础。同时,日益迫切的数据密集型科学研究、各行各业的数字化转型需求,也促进了数据库、数据科学、人工智能等围绕数据和知识两个要素快速发展、持续演进和交叉融合。
针对智能数据处理及分析任务的模型构建、算法设计、分析比较、编程实现能力,是计算机和电子信息类相关专业研究生及高年级本科生的重要能力,反映了学生解决复杂工程问题、建立有效解决方案、应用信息技术对实际问题进行建模和求解的必要素养。相关学科领域交叉渗透加剧,培育学生数据思维、算法思维、编程思维的要求日益提高,智能数据工程的内涵不断演进、外延日益丰富,相关课程具有较强的工程性,教学方式也逐步从“由原理到技术”向“原理与技术相协同”转变,对课程的教学内容和教学模式提出了新的要求。
培养学生解决复杂工程问题能力的迫切需求与智能数据工程相关课程的内容设置和教学模式之间,仍存在不同学习阶段知识点重复或不衔接,数据管理与组织、数据挖掘与分析、知识发现与推理的教学内容缺乏系统性,经典方法与前沿技术、理论模型与编程实践结合不紧密等问题。一方面,智能数据工程知识的学习,需要面向实际需求,从不同组织形式或不同模态数据的特点出发,掌握经典的模型和算法,把握其基本理念和求解问题的一般思路;另一方面,不同层次的读者,对智能数据工程知识的学习需求也有很大差异,并不存在通用的学习模式、面面俱到的学习内容、一成不变的学习方法,而模型理念、算法思想、技术步骤、实施路径,则是希望通过学习获得的精髓。
基于上述背景和目标,我们对前期出版的《数据工程》进行了大量更新和替换,构建了一系列支持“线下 线上”教学的资源,完成了包括新内容、体现新理念的教材《智能数据工程》,既考虑了智能数据工程技术在经典和前沿两个方面内容的互补性,也考虑了在数据管理、数据挖掘和知识发现三个方面内容的完整性,介绍每部分内容的代表性技术。在每个知识点的阐述中,聚焦智能数据处理及分析任务,注重思路和技术框架的介绍、技术内涵和理念的传递。
本书以“数据管理数据挖掘知识发现”为主线,将智能数据处理及分析的理论方法与Python程序实现相结合,旨在构建智能数据工程“思想模型技术实现”四位一体的知识学习框架,达到举一反三、触类旁通的效果,培养学生的数据思维、算法思维和编程思维。本书针对智能数据处理及分析的各类任务,给出问题背景、模型思想、核心算法,注重数据与知识工程理念的传递,而不陷入技术的细节。
本书由数据管理篇、数据挖掘和智能分析篇、知识表示和知识推理篇三部分构成。
数据管理篇包括以下内容: 第1章以基数估计为代表介绍关系数据库查询优化技术,第2章介绍经典信息检索模型和Web信息检索技术,第3章介绍数据仓库、数据湖和向量数据库这三种数据组织方式及相关技术。
数据挖掘和智能分析篇包括以下内容: 第4章介绍高维数据的降维、分类和聚类挖掘技术,第5章围绕目标检测、图像分割和视频目标跟踪介绍视觉数据分析技术,第6章围绕语言模型、情感分析和机器翻译介绍文本数据分析技术,第7章围绕节点分类、链接预测和社区发现介绍图数据分析技术。
知识表示和知识推理篇包括以下内容: 第8章介绍知识图谱构建、嵌入和推理技术,第9章介绍贝叶斯网构建和推理技术。
此外,作者开发了基于Git的在线编程平台和案例库(https://intelligentdataengineering.github.io/),给出便于教师和学生使用的Python语言编写的在线案例(包括示例程序和自测练习),可供本书的读者免费使用,以作为本书内容的有益补充。本书提供用于教材内容展示的知识图谱,以及基于大模型的教材内容导航、知识总结和关联答疑系统,同时不断完善在线案例,希望能为使用本书的读者提供日益丰富的“赠品”。
在本书的策划和编写过程中,华东师范大学周傲英教授和钱卫宁教授、云南大学刘惟一教授提出了许多宝贵的意见和建议。清华大学出版社责任编辑张玥老师对本书的编辑出版工作给予了大力指导和支持,付出了辛勤的劳动。云南大学信息学院、云南省智能系统与计算重点实验室为本书的编写提供了良好的计算设备和工作环境,云南大学数据与知识工程课题组王笳辉老师、杨培忠老师、方岩老师和10余名研究生给予了很多有益的帮助。在此,谨向每一位关心和支持本书编写工作的人员表示衷心的感谢。
由于作者的知识和水平有限,对模型及算法的理解和观点不够全面,错误和疏漏之处在所难免,恳请各位专家和读者批评指正,以使本书不断改进。
作者
2025年1月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2025 (香港)大書城有限公司  All Rights Reserved.