登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書

『簡體書』循序渐进学习商业分析:使用SAS与R语言

書城自編碼: 3608889
分類:簡體書→大陸圖書→計算機/網絡程序設計
作者: [印]苏巴西尼·夏玛·特里帕蒂 著,吴骅 译
國際書號(ISBN): 9787302570806
出版社: 清华大学出版社
出版日期: 2021-02-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:HK$ 111.3

我要買

 

** 我創建的書架 **
未登入.


新書推薦:
孙中山与海南(1905—1913)
《 孙中山与海南(1905—1913) 》

售價:HK$ 92.0
故宫雅趣:紫禁城皇室生活与君臣轶事
《 故宫雅趣:紫禁城皇室生活与君臣轶事 》

售價:HK$ 103.8
金钱、奇珍异品与造物术:荷兰黄金时代的科学与贸易
《 金钱、奇珍异品与造物术:荷兰黄金时代的科学与贸易 》

售價:HK$ 115.6
本该成为女王的姐妹:都铎王朝的一段悲剧
《 本该成为女王的姐妹:都铎王朝的一段悲剧 》

售價:HK$ 115.6
棺材船:爱尔兰大饥荒时期海上的生与死
《 棺材船:爱尔兰大饥荒时期海上的生与死 》

售價:HK$ 103.8
新左派政治经济学:一个局外人的看法(汉译名著本14)
《 新左派政治经济学:一个局外人的看法(汉译名著本14) 》

售價:HK$ 33.6
汗青堂丛书006·十二幅地图中的世界史(2024版)
《 汗青堂丛书006·十二幅地图中的世界史(2024版) 》

售價:HK$ 141.6
英国人:国家的形成,1707-1837年(英国史前沿译丛)
《 英国人:国家的形成,1707-1837年(英国史前沿译丛) 》

售價:HK$ 177.6

 

編輯推薦:
在过去的10年中,分析和数据科学作为业务决策的支持功能而走在技术发展的前沿,业务分析师还是鲜为人知的职业选择。随着数据存储成本的急剧下降和数据量的蓬勃增 长,首席经验官(Chief eXperience Officer,CXO)和现代经理人都迫切需要掌握分析和数据科学,以便在企业经营的每个点上做出明智的决策。
如何开始分析和数据科学职业生涯?
《循序渐进学习商业分析:使用SAS与R语言》将告诉你如何通过定义、收集、组织、可视化、分析和见解(DCOVA&I)过程执行数据分析并解决问题。这是一个非常完整而严密的过程,因此,即使数据非常新颖或你对问题不太熟悉,也可以通过使用逐步检查表进行推论来解决问题。*后,为了实现分析输出,需要以简单的业务术语来理解结论或见解。
內容簡介:
《循序渐进学习商业分析:使用SAS与R语言》详细阐述了与SAS和R语言商业分析相关的解决方案,主要内容包括了解SAS和R、使用SAS和R进行数据处理、使用SAS和R发现有关数据的基本信息、可视化、概率、样本和抽样分布、分析的置信区间和正确性等。此外,本书还提供了丰富的示例及代码,以帮助读者进一步理解相关方案的实现过程。 本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。
目錄
第1章 分析的过程 1
1.1 分析的定义 1
1.1.1 简单的分析示例 2
1.1.2 典型日常工作 3
1.1.3 适合数据分析师职业的个人特质 3
1.2 分析的演变 4
1.2.1 质量运动 5
1.2.2 第二次世界大战 7
1.2.3 统计的影响和涉及面 7
1.3 商业智能的曙光 8
第2章 了解SAS和R 11
2.1 选择SAS和R的原因 11
2.1.1 市场概况 11
2.1.2 高级分析的定义 12
2.2 SAS和R的历史 13
2.2.1 SAS的历史 14
2.2.2 关于EG 15
2.2.3 获得SAS Enterprise Guide软件的方式 15
2.2.4 R的历史 15
2.2.5 关于R的命名 16
2.2.6 关于R 16
2.2.7 关于RStudio 16
2.2.8 关于CRAN 18
2.2.9 关于R的附加软件包 19
2.2.10 微软公司收购Revolution Analytics的意义 20
2.3 安装SAS和R 20
2.3.1 获得SAS 20
2.3.2 SAS University Edition 21
2.3.3 SAS OnDemand for Academics 26
2.3.4 Education Analytical Suite 29
2.3.5 安装R 29
第3章 使用SAS和R进行数据处理 33
3.1 定义:数据处理之前的阶段 33
3.2 常见业务问题的基本理解 34
3.2.1 数据来源 36
3.2.2 使用基准创建最佳定义陈述 36
3.3 从ERP到业务分析SaaS的数据流 37
3.3.1 主键 38
3.3.2 关系数据库 38
3.4 数据完整性检查 39
3.5 SAS案例研究1 39
3.5.1 问题陈述 40
3.5.2 导入数据 41
3.5.3 查看数据 42
3.5.4 收集和组织数据 44
3.5.5 可视化 47
3.5.6 执行分析 50
3.6 R案例研究1 52
3.6.1 问题陈述 52
3.6.2 导入数据 53
3.6.3 查看数据 53
3.6.4 收集和组织数据 56
3.6.5 可视化 63
3.6.6 执行分析 68
第4章 使用SAS和R发现有关数据的基本信息 73
4.1 关于描述性统计 73
4.1.1 有关推论和描述统计的更多信息 74
4.1.2 表格和描述性统计 75
4.1.3 关于频率分布 76
4.2 SAS案例研究2 78
4.2.1 问题陈述 78
4.2.2 导入数据 79
4.2.3 查看数据 80
4.2.4 关于单变量过程 82
4.2.5 收集和组织数据 85
4.2.6 可视化 90
4.2.7 执行分析 91
4.3 R案例研究2 92
4.3.1 问题陈述 92
4.3.2 导入数据 93
4.3.3 查看数据 93
4.3.4 收集和组织数据 95
4.3.5 可视化 102
4.3.6 执行分析 102
4.4 使用描述性统计 104
4.4.1 集中趋势的度量 104
4.4.2 散布的度量 105
4.4.3 差异分析 106
4.4.4 方差 107
第5章 可视化 111
5.1 可视化的定义 111
5.2 当今世界的数据可视化 113
5.3 进行数据可视化的理由 113
5.4 常见的图形和图表类型 115
5.5 SAS案例研究3 116
5.5.1 关于数据 116
5.5.2 数据内容 116
5.5.3 定义 116
5.5.4 问题陈述 117
5.5.5 SAS解决方案 117
5.6 SAS代码和解决方案 118
5.6.1 导入数据 118
5.6.2 查看内容并了解变量 121
5.6.3 保留所需的变量 121
5.6.4 创建所需的欺诈指标变量 122
5.6.5 组织和整理数据 123
5.6.6 可视化y变量 125
5.7 R案例研究3 129
5.7.1 关于数据 129
5.7.2 数据内容 130
5.7.3 定义 130
5.7.4 问题陈述 130
5.7.5 R中的解决方案 130
5.8 R代码和解决方案 131
5.8.1 导入数据 131
5.8.2 查看内容并了解变量 132
5.8.3 保留所需的变量 134
5.8.4 创建所需的欺诈指标变量 135
5.8.5 组织和整理数据 136
5.8.6 可视化y变量 137
5.9 相关性和协方差 141
5.10 对相关性的解释 142
第6章 概率 143
6.1 概率的定义 143
6.2 独立事件的概率:两个或多个事件的概率 144
6.3 条件事件的概率:两个或多个事件的概率 144
6.4 使用概率的原因 145
6.5 使用贝叶斯定理计算概率 146
6.5.1 贝叶斯定理的似然性 146
6.5.2 从条件概率推导贝叶斯定理 147
6.5.3 决策树:用它来理解贝叶斯定理 148
6.6 计算概率的频率 148
6.6.1 离散变量 148
6.6.2 连续变量 149
6.6.3 正态分布 149
6.6.4 变量不是正态分布的情形 150
6.7 SAS案例研究4 151
6.7.1 问题陈述 151
6.7.2 导入数据 152
6.7.3 查看数据 152
6.7.4 定义业务问题 153
6.7.5 可视化 154
6.7.6 查看变量的基本统计信息 156
6.7.7 组织和整理数据 158
6.7.8 SAS练习1 160
6.7.9 SAS练习2 165
6.8 R案例研究4 165
6.8.1 问题陈述 165
6.8.2 导入数据 166
6.8.3 查看数据 166
6.8.4 定义业务问题 167
6.8.5 可视化 168
6.8.6 查看变量的基本统计信息 169
6.8.7 组织和整理数据 170
6.8.8 执行分析 173
6.8.9 R练习 179
第7章 样本和抽样分布 181
7.1 了解样本 181
7.2 抽样分布 185
7.2.1 离散均匀分布 187
7.2.2 二项分布 188
7.2.3 连续均匀分布 189
7.2.4 泊松分布 190
7.2.5 概率分布的使用 190
7.3 中心极限定理 190
7.4 大数定律 191
7.5 使用统计数据进行业务决策 192
7.6 参数检验 193
7.7 非参数检验 194
7.8 SAS案例研究5 195
7.8.1 问题陈述 195
7.8.2 导入数据 195
7.8.3 查看数据 196
7.8.4 组织和整理数据 197
7.8.5 执行分析 201
7.9 R案例研究5 204
7.9.1 问题陈述 204
7.9.2 导入数据 204
7.9.3 收集和组织数据 204
7.9.4 可视化 205
7.9.5 执行分析 207
第8章 分析的置信区间和正确性 213
8.1 确定统计结果的方式 213
8.2 关于P值 216
8.3 假设检验中的错误 218
8.4 SAS案例研究6 219
8.4.1 问题陈述 219
8.4.2 导入数据 219
8.4.3 查看数据 220
8.4.4 组织和整理数据 221
8.4.5 执行分析 222
8.5 R案例研究6 223
8.5.1 问题陈述 223
8.5.2 导入数据 223
8.5.3 查看数据 223
8.5.4 组织和整理数据 225
8.5.5 执行分析 226
第9章 结论和见解 229
9.1 关于见解 229
9.1.1 描述统计 230
9.1.2 图表 231
9.1.3 推断统计 231
9.1.4 差异统计 232
9.2 SAS案例研究7 232
9.2.1 问题陈述 233
9.2.2 导入数据 233
9.2.3 查看数据 233
9.2.4 组织和整理数据 233
9.2.5 可视化 234
9.2.6 执行分析 239
9.3 R案例研究7 240
9.3.1 问题陈述 240
9.3.2 导入数据 241
9.3.3 查看数据 241
9.3.4 组织和整理数据 241
9.3.5 可视化 242
9.3.6 执行分析 244
內容試閱
在过去的10年中,分析和数据科学作为业务决策的支持功能而走在技术发展的前沿,业务分析师还是鲜为人知的职业选择。随着数据存储成本的急剧下降和数据量的蓬勃增 长,首席经验官(Chief eXperience Officer,CXO)和现代经理人都迫切需要掌握分析和数据科学,以便在企业经营的每个点上做出明智的决策。
如何开始分析和数据科学职业生涯?
本书将告诉你如何通过定义、收集、组织、可视化、分析和见解(DCOVA&I)过程执行数据分析并解决问题。这是一个非常完整而严密的过程,因此,即使数据非常新颖或你对问题不太熟悉,也可以通过使用逐步检查表进行推论来解决问题。最后,为了实现分析输出,需要以简单的业务术语来理解结论或见解。
本书将介绍如何使用两种流行的软件工具SAS和R对业务数据进行分析,SAS是收费软件,它是受监管部门(如银行、临床研究、保险等)数据分析领域的领导者。R是开源软件,它在没有监管机构的行业中很流行,如零售、技术(包括ITES)、商务流程外包(Business Process Outsourcing,BPO)等。因此,无论你从事哪个行业,本书都将为你提供更快地做出更好决策所需的知识和技能。
在阅读本书时,不需要在两个最受欢迎的软件工具之间做出选择,因为我们为这两个软件提供了一致的研究案例。
企业如何在合理时间内将自己的数据转换为有用的信息?
这个问题对于成功开展业务至关重要。仅当信息在正确的时间可供管理层使用时,企业才能做出正确的决定。为此,需要进行业务分析(简单地说,就是对大量数据进行统计),以得出有助于业务决策的结论和模型。
统计技术可分为描述统计、推断统计、差异统计、关联统计和预测统计5个主要类型。本书将着重于DCOVA&I过程在SAS和R中的应用,并介绍如何解释与描述性、差异性和关联性统计技术有关的统计信息。
内容介绍
本书共分为9章,内容如下:
第1章分析的过程,介绍数据分析的定义、简单的分析示例、数据分析师的日常工作、从事该项工作应具备的一些特质以及分析和统计的历史等。
第2章了解SAS和R,详细说明了本书选择SAS和R作为分析平台的原因,并介绍这两款软件的安装方式。
第3章使用SAS和R进行数据处理,提出DCOVA&I框架,并阐释定义阶段的重要意义、常见业务问题的基本理解、从ERP到业务分析SaaS的数据流、数据完整性检查等。
第4章使用SAS和R发现有关数据的基本信息,介绍描述性统计的意义,并阐释集中趋势的度量、散布的度量、频率分布、差异分析和方差等概念。
第5章可视化,介绍数据可视化技术,包括可视化的定义、进行可视化的理由、常见图表类型和相关案例研究等。
第6章概率,解释独立事件的概率和条件事件的概率、贝叶斯定理、计算概率的频率,并提供相应的SAS和R案例研究。
第7章样本和抽样分布,详细介绍抽样方法、抽样分布类型、中心极限定理、大数定律、参数检验和非参数检验等。
第8章分析的置信区间和正确性,阐述置信区间和P值的概念,并讨论假设检验中的错误。
第9章结论和见解,介绍描述统计、图表、推断统计、差异统计和见解生成之间的关系,了解这些有助于数据分析师解释SAS和R生成的结果。
本书约定
在本书中有许多区分不同类型信息的文本样式,以下是这些样式的一些示例以及对它们的含义的解释。
(1)在界面词汇后面使用括号附加对应的中文含义,方便读者对照查看。以下段落是一个示例:
要创建箱形图,可以选择Tasks(任务)| Graph(图形)| Box Plot(箱形图)命令,如 图6-9所示。
(2)代码块显示如下:
* 删除RESOLUTION TIME中的1个观察值,因为它包含缺失值 *
DATA WORK.RESOLUTION;
SET WORK.RESOLUTION;
WHERE RESOLUTION_TIME NE.; RUN;
PROC MEANS DATA= WORK.RESOLUTION;
VAR RESOLUTION_TIME; RUN;
(3)新术语和重要单词以中英文对照的形式表示,中文在前,如下所示:
当要查看连续变量(如时间、年龄、收入)出现的概率分布时,获得的将是一条连续曲线,因为这些变量可以具有许多值,包括小数值。连续变量的分布称为连续分布的概率密度(Continuous Distributions,Probability Densities)。当此概率密度曲线的形状像钟形时,称为正态分布(Normal Distribution)。自然发生的现象遵循正态分布。
关于作者
Subhashini Sharma Tripathi是一位数据分析专家,在与GE Money、渣打银行、Tata Motors Finance和Citi GDM合作10年后,于2012年开始从事教学、撰写博客和提供咨询等工作。在工作期间,她坚信数据科学和分析技术有助于减少对个体经验的依赖。此外,她认为,这为现代经理人提供了一种决定性的方法,可以更快、更准确地解决许多现实问题。在这个不断发展的业务环境中,它还有助于定义长期战略并提供更好的选择。换句话说,借助大数据分析,企业管理者可以获得更有价值的经营指导。
Subhashini是pexitics.com的创始人,她的第一个产品是Pexitics Talent Score。该公司可提供有效的人力资源管理工具,并提供分析咨询服务。
作者致谢
这是我的第一本书,写作的经历像是一次激动人心但又坎坷不平的旅行。本书的写作过程也与pexitics.com的创建和发布紧密联系在一起。
没有家人和Apress编辑团队的大力支持和鼓励,尤其是Celestin Suresh John的帮助,本书的写作旅程就不可能抵达终点。衷心感谢我的母亲M. Tripathi博士给予我的从语言到行动的无微不至的支持和帮助。
Mark L. Berenson、David M. Levine和Timothy C. Krehbiel所著的Basic Business Statistics12th Edition(《基础商业统计(第12版)》)对我的思考过程和本书的写作产生了重大影响。我在该书中学习了DCOVA流程。在处理该过程时,我添加了另一个阶段,称为见解生成(Insight Generation),现在我使用的就是DCOVA&I过程。
当我在2002年开始进行基于数字的决策时,缺乏结构化和系统性的指导,很多事情都是自我发现和自学的。我写这本书的目的是让从事分析和数据科学的有志之士能够以结构化的方式充满信心地解决实际业务问题,从而踏上成功之路。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 大陸用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2024 (香港)大書城有限公司  All Rights Reserved.