登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書

『簡體書』数据挖掘原理、算法与应用

書城自編碼: 4139114
分類:簡體書→大陸圖書→教材高职高专教材
作者: 梁亚声 徐欣 等编著
國際書號(ISBN): 9787111496328
出版社: 机械工业出版社
出版日期: 2025-07-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 75.9

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
中药炮制学科发展集萃
《 中药炮制学科发展集萃 》

售價:HK$ 239.8
君士坦丁堡深仇400年:俄土战争(1877—1878)(全2册)
《 君士坦丁堡深仇400年:俄土战争(1877—1878)(全2册) 》

售價:HK$ 226.6
城市文明蓝皮书:全球城市文明发展报告(2024-2025)
《 城市文明蓝皮书:全球城市文明发展报告(2024-2025) 》

售價:HK$ 140.8
未来生活金融指南
《 未来生活金融指南 》

售價:HK$ 63.8
《法官如何裁判》(在法律规范体系的框架下如何寻求个案公正的判决之道,麦读译丛18)
《 《法官如何裁判》(在法律规范体系的框架下如何寻求个案公正的判决之道,麦读译丛18) 》

售價:HK$ 86.9
自由的危机:全球视角下的英国内战史
《 自由的危机:全球视角下的英国内战史 》

售價:HK$ 173.8
索恩丛书·俾斯麦:欧洲风暴
《 索恩丛书·俾斯麦:欧洲风暴 》

售價:HK$ 196.9
元首政治与帝国治理——以赫洛迪安《罗马帝国史》为考察对象
《 元首政治与帝国治理——以赫洛迪安《罗马帝国史》为考察对象 》

售價:HK$ 74.8

內容簡介:
本书系统介绍了数据挖掘原理、技术、算法和应用。主要内容包括:数据挖掘的过程、数据存储的数据仓库、数据预处理技术和算法、异常数据检测技术和算法、数据分类算法和应用、数据聚类分析的算法及其应用、数据关联分析算法及其应用、模型的评估技术和算法、复杂数据的数据挖掘和技术。本书涵盖了数据挖掘过程的各方面技术、算法,在内容安排上将理论知识和工程技术应用有机结合,并介绍了许多数据挖掘的典型应用方法。 來源:香港大書城megBookStore,http://www.megbook.com.hk
本书可作为高等职业院校计算机科学与技术、信息管理、数据分析等专业的教科书,也可作为企业管理、信息分析人员的技术参考书。
本书配有电子课件,需要的教师可登录www.cmpedu.com免费注册、审核通过后下载,或联系编辑索取(QQ:2399929378,电话:010-88379753)。
關於作者:
梁亚声,中国人民解放军电子工程学院总工。多年从事本科,研究生教学工作。获得教学成果一等奖多次。项目主要有:系统工程教学体系,获电子工程学院教学一等奖;获得军队科技进步二等奖1项;获得军队科技进步三等奖10项。获得对象军队科技成果一、二、三等奖。
目錄
目录
出版说明
前言
第1章概述
11从数据中获取知识
12数据挖掘的基本概念
13数据挖掘的发展历程
14数据挖掘的功能和数据挖掘
系统的分类
141分类与回归
142聚类分析
143关联规则
144时序模式
145异常检测
146数据挖掘系统的分类
15数据挖掘的过程
151数据挖掘的一般流程
152跨行业数据挖掘标准过程
16数据挖掘与其他学科的关系
161数据挖掘与数据库知识发现
162数据挖掘与数据库查询
163数据挖掘与统计分析
164数据挖掘与数据仓库
165数据挖掘与联机分析处理
166数据挖掘与人工智能、专家系统、
机器学习
17数据挖掘的应用和发展趋势
171商业的数据挖掘
172金融业的数据挖掘
173欺诈侦测中的数据挖掘
174DNA数据分析中的数据挖掘
175电信业中的数据挖掘
176科学和统计数据挖掘
177数据挖掘系统和软件
178数据挖掘的发展趋势
18小结
19习题
第2章数据存储
21关系数据集
22数据仓库
221数据仓库的概念和特点
222数据仓库的数据组织
223数据仓库的关键技术
224数据仓库与数据挖掘的关系
23NoSQL数据库
231NoSQL概念与理论
232NoSQL数据模型
233NoSQL与关系数据库
24分布式文件系统
241分布式文件系统的历史
242分布式文件系统的体系结构
243谷歌文件系统(GoogleFS)
244Hadoop分布式文件系统
(HDFS)
25小结
26习题
第3章数据预处理
31数据预处理的必要性
32数据清理
321缺失数据处理方法
322噪声数据平滑技术
323时间相关数据的处理
33数据集成
331实体识别与匹配
332冗余和相关分析
333元组重复数据的检测
334冲突数据的检测与处理
34数据转换
341数据标准化
342数据泛化
35数据归约
351数据立方体聚集
352维度归约
353数据压缩
354数值归约
36数据离散化
361分箱方法
362直方图分析
363基于熵的离散化
364ChiMerge技术
365人工划分分段
37特征提取、选择和构造
371特征提取
372特征选择
373特征构造
38小结
39习题
第4章数据相似度与异常检测
41相似度度量
411对象与属性类型
412相似度度量的定义
413由距离度量变换而来的
相似度度量
414属性之间的相似度度量
415对象之间的相似度度量
42传统度量方法
421二值属性的相似度度量
422欧氏距离
423余弦距离
424Mahalanobis距离
425Jaccard距离
426海明距离
43大数据度量方法
431文档的Shingling
432局部敏感散列算法
44异常检测
441基于统计的检测方法
442基于距离的检测方法
443基于密度的检测方法
444基于聚类的检测方法
445基于分类的检测方法
446高维数据中的异常点检测
45小结
46习题
第5章数据分类和预测
51分类和预测的基本概念
511准备数据
512分类和预测方法的评估标准
52决策树分类
521ID3算法生成决策树
522C45算法生成决策树
523CART算法和Gini指标
524决策树归纳的可扩展性
525数据仓库与决策树
526决策树和决策规则的局限性
53贝叶斯分类
531贝叶斯定理
532朴素贝叶斯分类
533贝叶斯信念网络
534训练贝叶斯信念网络
54神经网络
541多层前馈神经网络
542定义神经网络的拓扑结构
543后向传播
544后向传播和可理解性
55其他分类方法
551基于关联的分类方法
552K-最近邻分类
553基于案例推理
554遗传算法
555粗糙集方法
556模糊集合方法
56预测算法
561预测算法分类
562预测算法选择
563线性和多元回归
564非线性回归
565其他回归模型
57分类预测应用实例
571样本选取
572建立预测模型
573模型评估
574实用价值
58小结
59习题
第6章数据聚类分析
61基本概念
611对聚类分析的要求
612聚类分析方法分类
62划分聚类算法
621K-means算法(基于
质心的技术)
622K-medoids算法(基于代表
对象的技术)
63层次聚类算法
631BIRCH算法
632CURE算法
633ROCK算法
634Chameleon算法
64基于密度的聚类算法
641DBSCAN算法
642OPTICS算法
643DENCLUE算法
65基于网格的聚类算法
651STING算法
652WaveCluster算法
653CLIQUE算法
66基于模型的聚类算法
661EM算法
662COBWEB算法
663SOM算法
67聚类评估
671估计聚类趋势
672确定簇数
673测定聚类质量
68聚类分析应用实例
681问题理解与提出
682数据收集与选择
683数据预处理
684应用K-means聚类算法建模
69小结
610习题
第7章数据关联分析
71数据关联分析的基本概念
72频繁项集产生
721先验原理
722Apriori算法的频繁项集产生
723支持度计数
724计算复杂度
73规则产生
731基本步骤
732Apriori算法中规则的产生
74频繁项集的紧凑表示
741最大频繁项集
742闭频繁项集
75产生频繁项集的其他方法
751项集格遍历
752事务数据集的表示
76FP-Growth算法
761FP树构造
762频繁项集产生
77关联评估
771兴趣度客观度量
772多个二元变量的度量
773倾斜支持度分布的影响
78关联分析应用实例
781关联分析学生成绩
782数据处理
783算法的应用
784挖掘结果的分析
79小结
710习题
第8章性能评估和提升
81评分函数
811预测性评分函数
812描述性评分函数
813一致性评价
82成本评价
821成本评价曲线
822Cost-Sensitive学习
83复杂度评估
84验证
841交叉验证
842Bootstrap
843模型比较
85性能提升
851效率提升
852准确率提升
86小结
87习题
第9章复杂数据挖掘
91文本数据挖掘
911文本数据预处理
912文本数据挖掘技术
913文本数据挖掘的应用
92图像数据挖掘
921图像数据的特点和挖掘
技术现状
922图像数据预处理
923图像数据挖掘技术
924图像数据挖掘的应用
93语音识别挖掘
931语音数据特点及挖掘
技术现状
932语音信号预处理
933语音识别技术
934语音识别技术的应用
94视频数据挖掘
941视频数据特点及挖掘
技术现状
942视频数据预处理
943视频数据挖掘技术
944视频数据挖掘的应用
95网络拓扑挖掘
951拓扑发现的技术现状及网络
数据的采集
952基于挖掘技术的网络
拓扑发现
96网络舆情挖掘
961舆情研究发展现状及舆情
特点
962网络舆情数据预处理
963网络舆情挖掘技术
97推荐系统
971推荐系统发展现状
972相关技术
973推荐系统
98空间数据挖掘
981空间数据的特点
982空间数据预处理
983空间数据挖掘技术
984空间数据挖掘工具
99数据流挖掘
991数据流的特点
992数据流预处理
993数据流挖掘技术
994数据流挖掘技术的应用
910小结
911习题
参考文献
內容試閱
前言随着信息技术的普及和应用,各个领域产生了大量的数据,这些数据被获取、存储下来,其中蕴含着丰富的信息。人们持续不断地探索处理这些数据的方法,以期最大程度地从中挖掘有用的信息,面对如潮水般不断增加的数据,人们不再满足于数据的查询和统计分析,而是期望从数据中提取信息或者知识为决策服务。数据挖掘技术突破了数据分析技术的种种局限,它结合统计学、数据库、机器学习等技术解决从数据中发现新的信息,辅助决策这一难题,是正在飞速发展的前沿学科。一些大型企业对数据挖掘产品和工具的使用都超过20年,并已产生了期望的效应。此外,数据挖掘产品和工具在金融、商业、电信、医学等多个领域也得到广泛推广应用。
数据挖掘并不是要取代其他数据分析技术,而是将它们作为其工作的基础。尽管有些技术(如关联分析)是数据挖掘独有的,但是,另一些技术(如聚类、分类和异常检测)则建立在其他学科长期研究的基础之上。数据挖掘利用已有技术加速其发展,并一直与其他学科的技术紧密结合。成功地进行数据挖掘是综合使用多种技术,以及理解数据的专业人员和数据分析人员合作的成果。
本书结合数据挖掘技术的最新发展,系统地介绍了数据挖掘的基础理论、技术原理、算法和应用,以使读者对数据挖掘有一个系统、全面的了解。本书共9章,第1章主要介绍数据挖掘的基本概念和数据挖掘的过程。第2章主要介绍关系数据集和数据仓库等数据存储方式的基本概念、数据组织及其涉及的关键技术,以及分布式文件系统、NoSQL等大数据存储方式的概念、结构、原理和数据组织方法等。第3章主要介绍了数据预处理的概念和必要性,以及数据清理、数据集成、数据转换、数据归约、数据离散化和特征选择等数据预处理技术。第4章主要介绍了相似度度量的基础知识和5种异常检测方法,并深入分析欧式距离等6种传统的度量方法和大数据度量方法。第5章主要介绍了数据分类和预测的基本概念,决策树分类、贝叶斯分类、神经网络等分类方法,以及预测算法与应用。第6章主要介绍了数据聚类分析的基本概念,以及基于划分、基于层次、基于密度、基于网格和基于模型的聚类算法,还介绍了聚类分析的评估方法及其应用。第7章主要介绍了关联分析的基本概念,分析了关联规则挖掘的两个子任务:频繁项集产生和规则产生,介绍了频繁项集的紧凑表示及产生频繁项集的其他方法、FP-growth算法、关联评估及其应用等内容。第8章主要针对数据挖掘模型的评价和度量介绍了评分函数(包括常用的预测性评分函数和描述性评分函数);介绍了针对数据挖掘模型的成本评价曲线;从评价模型复杂度角度介绍了最短描述长度原则等评价方法;针对模型有效性验证介绍了交叉验证和Bootstrap验证方法;从数据挖掘模型效率和准确率提升角度,介绍了云计算和集成学习方法。第9章主要介绍了针对文本、图像、语音识别、视频、网络拓扑、网络舆情、推荐系统、空间数据和数据流等复杂数据的数据挖掘技术,分析了各类复杂数据的特点,介绍了相关数据挖掘的关键技术。本书涉及的内容较为广泛,在教学时,可根据实际情况选择。
本书由梁亚声编写第1、5章,徐欣编写第8、9章,成小菊编写第6、7章,梁佳领编写第2、3章,朱霞编写第4章。何成宇为第4章的编写提供了部分资料。徐欣对全书进行了统稿。
本书编著得到了国家自然科学基金(61402426)资助。
由于作者水平有限,书中难免存在不妥之处,敬请读者批评指正。



出 版 说 明当前,我国正处在加快转变经济发展方式、推动产业转型升级的关键时期。为经济转型升级提供高层次人才,是高等院校最重要的历史使命和战略任务之一。高等教育要培养基础性、学术型人才,但更重要的是加大力度培养多规格、多样化的应用型、复合型人才。
为顺应高等教育迅猛发展的趋势,配合高等院校的教学改革,满足高质量高校教材的迫切需求,机械工业出版社邀请了全国多所高等院校的专家、一线教师及教务部门,通过充分的调研和讨论,针对相关课程的特点,总结教学中的实践经验,组织出版了这套“高等教育规划教材”。
本套教材具有以下特点:
1) 符合高等院校各专业人才的培养目标及课程体系的设置,注重培养学生的应用能力,加大案例篇幅或实训内容,强调知识、能力与素质的综合训练。
2) 针对多数学生的学习特点,采用通俗易懂的方法讲解知识,逻辑性强、层次分明、叙述准确而精练、图文并茂,使学生可以快速掌握,学以致用。
3) 凝结一线骨干教师的课程改革和教学研究成果,融合先进的教学理念,在教学内容和方法上做出创新。
4) 为了体现建设“立体化”精品教材的宗旨,本套教材为主干课程配备了电子教案、学习与上机指导、习题解答、源代码或源程序、教学大纲、课程设计和毕业设计指导等资源。
5) 注重教材的实用性、通用性,适合各类高等院校、高等职业学校及相关院校的教学,也可作为各类培训班教材和自学用书。
欢迎教育界的专家和老师提出宝贵的意见和建议。衷心感谢广大教育工作者和读者的支持与帮助!
机械工业出版社

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2025 (香港)大書城有限公司  All Rights Reserved.