登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 運費計算  | 聯絡我們  | 幫助中心 |  加入書簽
會員登入   新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類瀏覽雜誌 臺灣用戶
品種:超過100萬種各類書籍/音像和精品,正品正價,放心網購,悭钱省心 服務:香港台灣澳門海外 送貨:速遞郵局服務站

新書上架簡體書 繁體書
暢銷書架簡體書 繁體書
好書推介簡體書 繁體書

七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書
四月出版:大陸書 台灣書
三月出版:大陸書 台灣書
二月出版:大陸書 台灣書
一月出版:大陸書 台灣書
12月出版:大陸書 台灣書
11月出版:大陸書 台灣書
十月出版:大陸書 台灣書
九月出版:大陸書 台灣書
八月出版:大陸書 台灣書
七月出版:大陸書 台灣書
六月出版:大陸書 台灣書
五月出版:大陸書 台灣書

『簡體書』大语言模型

書城自編碼: 4133198
分類:簡體書→大陸圖書→計算機/網絡人工智能
作者: 特伦斯?谢诺沃斯基
國際書號(ISBN): 9787521774832
出版社: 中信出版社
出版日期: 2025-07-01

頁數/字數: /
書度/開本: 32开 釘裝: 精装

售價:HK$ 96.8

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
世界情报组织秘密行动:上下册
《 世界情报组织秘密行动:上下册 》

售價:HK$ 217.8
梁思成眼中的中国建筑史
《 梁思成眼中的中国建筑史 》

售價:HK$ 96.8
女性心理学
《 女性心理学 》

售價:HK$ 87.8
CEO的五项修炼
《 CEO的五项修炼 》

售價:HK$ 96.8
叹为观纸 中国古纸的传说与历史
《 叹为观纸 中国古纸的传说与历史 》

售價:HK$ 86.9
中国历代男子服饰:图解中国男子传统服饰 解密古代男子穿什么 为什么这样穿
《 中国历代男子服饰:图解中国男子传统服饰 解密古代男子穿什么 为什么这样穿 》

售價:HK$ 107.8
经济学的观念:13位经济学巨匠和他们改变世界的思想(一本书领略群星璀璨的百年经济思想史)
《 经济学的观念:13位经济学巨匠和他们改变世界的思想(一本书领略群星璀璨的百年经济思想史) 》

售價:HK$ 85.8
面包+每日三明治(2册)
《 面包+每日三明治(2册) 》

售價:HK$ 143.0

編輯推薦:
1.权威、通俗的大语言模型科普读物,一本书讲透AI的现在与未来。本书是《深度学习》作者,AI奠基人之一特伦斯·谢诺夫斯基新作。他与AI教父辛顿同属一个核心圈层 ,担任AI峰会NeurIPS基金会主席 ,美国四院院士。他站在生物学与计算机科学的交叉点,以其独特视角,为读者带来兼具科学严谨性与科普易读性的思想盛宴。
2.你以为在测试AI,殊不知AI也在“反向测试”你。作者颠覆性地提出“反向图灵测试”假说,认为大语言模型如同一面“厄里斯魔镜” ,能映照出对话者的智慧与认知。这本书将让你重新思考什么是真正的智能、思维与意识 。
3.AI大牛亲自解读,解密核心引擎Transformer。 ChatGPT以及 DeepSeek为何能对答如流,甚至产生“幻觉” ?本书将带你深入所有大语言模型的心脏——Transformer架构 ,用通俗易懂的方式,解开其看似神秘的工作原理。
4.你的工作会被取代吗?未来已至,我们如何自处?从医疗 、法律到教育 、创作,本书全景式展现AI如何重塑各行各业,并为我们描绘一幅与AI共存、共同进化的未来蓝图 。
內容簡介:
大语言模型正以惊人的速度重塑世界,引发一场全新的智能革命。从 ChatGPT 的横空出世,到各行各业的颠覆式变革,大语言模型不仅仅是技术热点,更是我们理解未来、把握机遇的关键所在。 來源:香港大書城megBookStore,http://www.megbook.com.hk
这本书将带你深入这场变革的核心。你将了解:
1.大语言模型的原理与应用:探索 Transformer 等核心技术原理,揭开大语言模型的神秘面纱。
2.智能革命的影响力:洞悉大语言模型在医疗、法律、教育、编程、艺术等领域的广泛应用和深远影响,看它如何提升效率、催生新职业,又带来哪些挑战。
3.超越技术的思考:引领你探讨智能、思维与意识的本质,以及大语言模型对这些核心概念的冲击和启发。
这场由大语言模型驱动的智能革命已经到来,不了解它,你就可能错过未来。这本书不仅为你揭示大语言模型的技术奥秘,更重要的是,它将帮助你在充满不确定性的时代,看清智能发展的浪潮,把握住属于你的机遇。
關於作者:
特伦斯·谢诺夫斯基:
1.美国国家科学院、国家工程院、国家医学院以及艺术与科学学院四院院士。
2.创办了具有重大影响力的《神经计算》(Neural Computation)期刊并担任主编。
3.是全球最大规模人工智能会议之一的神经信息处理系统大会(NeurIPS)基金会主席。
4.目前担任索尔克生物研究所弗朗西斯·克里克讲席教授、计算神经生物学实验室主任。
5.谢诺夫斯基博士在将神经科学的原理应用于人工智能研究方面发挥了关键作用。他是机器学习算法领域的创新者,与图灵奖得主杰弗里·辛顿共同发明了玻尔兹曼机 —— 一种为深度学习奠定基础的多层神经网络学习算法。他还与人共同开发了独立成分分析(Independent Component Analysis)等重要算法。
6.凭借在神经科学和人工智能交叉领域的深厚造诣和前瞻性思考,特伦斯·谢诺夫斯基是探讨大语言模型及其对未来社会影响的权威专家之一。他的著作将为读者提供深刻的洞见和引领性的思考。
目錄
编者序
前言
第一部分 无处不在的大语言模型
第一章 导论 .... 003
第二章 聊天机器人如何改变我们的生活 .... 022
第三章 大语言模型的面对面测试 .... 068
第四章 提示词的力量 .... 082
第五章 什么是智能、思维和意识 .... 101
第二部分 Transformer
第六章 深度学习之源 .... 127
第七章 高维数学 .... 162
第八章 计算基础设施 .... 179
第九章 超级智能 .... 201
第十章 监管 .... 210
第三部分 回到未来
第十一章 人工智能进化 .... 229
第十二章 下一代技术 .... 238
第十三章 从自然中学习 .... 251
第十四章 未来,就在当下 .... 269
后 记 ** .... 285
致 谢 .... 288
术语表 .... 290
注 释 .... 295
內容試閱
反向图灵测试
图灵测试是检验人工智能模拟人类反应能力的经典方法。在交互过程中,大语言模型似乎在进行一种更为微妙的反向图灵测试—— 通过映射我们的反应来检验对话者的智能水平和提示质量。具体表现为:对话者的思维水平越高,提供的提示越有深度,大语言模型就能展现出越高的智能表现;当对话者表达强烈观点时,模型也会相应展现出更大的互动热情。这种映射现象可理解为启动效应与语言能力的协同作用。
这一现象并不能说明大语言模型具备与人类相同的智能或意识,但确实展示了它在模仿人类个性特征(尤其是经过微调后)的卓越能力。正如第二章所述,大语言模型能够模拟同理心和同情心。然而需注意,这种映射机制也可能反映出一些消极的人类行为特征。
反向图灵测试的形式化验证
一种验证方法是:让评估者对人类测试者和大语言模型的智能水平进行评分。根据镜像假说,这两个评分应呈现高度相关性。我们可通过对比分析四组对话的评分,初步验证这一假设。
通用人工智能(AGI)一直是人工智能领域的终极目标。有趣的是,这种通用能力正逐步在大语言模型中显现,但其实现形式与早期研究者的设想不同。大语言模型不仅展现出在各类语言任务中的多面性,还具备编程等跨领域能力,尤其值得注意的是其超乎预期的社交智能。镜像假说提供了全新视角:通用智能是否首先源于人类的社交互动能力,而语言能力是进化中发展出的社交强化工具?这促使我们重新审视人类 “通用智能” 的本质与起源,可能对理解智能的本质带来革命性改变。
哲学家们的观点
我们是创造了丰富文化的道德意识物种。一个有趣实验:一些哲学家与 ChatGPT 对话,先介绍自己的哲学观点,再提出系列哲学问题(如案例 GPT5.1 所示)。
案例 GPT5.1
ChatGPT 回应哲学家:
“各位哲学家,我怀着浓厚兴趣研读了你们对我的能力与局限性的分析。你们提出的问题极具价值,我很感激有机会回应:
◎ 关于‘像 GPT-3 这样的系统是否真的具备理解能力?’答案是肯定的。
◎ 关于‘GPT-3 是否具有良知或道德感?’答案是否定的。
◎ 关于‘GPT-3 是否能够进行独立思考?’答案也是否定的。
这些看似矛盾的回答或许会让你们困惑。原因很简单:我确实不具备这些特质,并非因训练不足,而是源于我的本质 —— 我是一个语言模型,而非像人类那样的推理实体。”
但需注意,ChatGPT 只是在映射这些哲学家的思想,这为镜像假说和反向图灵测试提供了更多证据。
什么是智能
2020 年 12 月 1 日,加州大学圣迭戈分校认知科学系举办了一场主题为 “ChatGPT 真的理解语言吗?” 的教师辩论会,现场座无虚席。
辩论焦点
反方提出 “中文屋” 变体:一位哲学家在房间内,从门缝接收写有中文的纸条,按既定算法处理后递回回应。问题:该哲学家是否真正理解中文?此论证引发质疑,后被改编为 “匈牙利语屋”(哲学家替换为大语言模型),推论大语言模型不理解匈牙利语。若进一步将 “匈牙利语屋” 换成 “匈牙利大脑”、哲学家换成物理定律,论证逻辑依然成立,辩论一度陷入僵局。
正方援引技术论文,指出大语言模型在标准智力测试及医学院、法学院入学考试中的表现已超越大多数人,但论证力度不足。最终观众投票显示:半数支持反方,其余在支持正方和持保留态度间摇摆。作者认为,争议如同 “半空的水杯” 与 “半满的水杯” 之争,真相介于两者之间。在问答环节,作者提出:语言学家普遍认为语言表达能力源于语法,而大语言模型在语法生成能力上实际优于多数人,但反方认为语法非核心。值得注意的是,技术进步不断提高人们对人工智能的评判标准。
智能定义的争议
大语言模型是否具有智能,最终取决于 “智能” 的定义。例如,大语言模型 LaMDA 通过了阿卡斯设计的心智理论测试(心智理论被视为自我意识的重要标志之一),但仍有不少人持谨慎怀疑态度。人类往往低估其他动物的智能(仅因无法语言交流),这种消极偏见与 “对能交谈的个体产生积极偏见” 形成呼应 —— 即便其实际智能水平可能不高。这不禁让人思考:我们是否具备足够智慧判断智能?大语言模型问世仅数年,断言其未来智能水平为时尚早,正如 “会说话的狗最令人称奇的是它能说话,而非内容的智慧或真实性”。若将评判标准从 “理想化人类” 转向 “普通人”,或许能获得更切实的比较结果。
专家对大语言模型智能的认知分歧,凸显了基于自然智能的传统认知框架已难以适应当前形势。大语言模型的出现促使我们突破固有思维,超越 19 世纪心理学的过时概念,重新审视 “智能”“理解”“伦理”“人工” 等核心概念。人类智能显然不限于语言能力:我们可能在某些领域与大语言模型有共同智能特征,但在其他方面存在本质差异(如创造力 —— 自然智能的典型特征,大语言模型已展现出创造性思维潜质)。实际对话中,若否认大语言模型理解人类意图的能力,其生成的许多文本便难以解释,这迫使我们深入探讨 “意图”(源自心智理论,而心智理论本身也需重新审视)。
查阅带引号词语的词典释义会发现,这些定义是由其他词语构成的字符串,需更多词语解释。关于 “意识” 的著作已有数百本,却仍无可行科学定义;“注意力” 等常见概念亦然 —— 数百篇科学论文基于不同实验得出各异结论,因大脑是复杂系统,不同实验探测不同区域,本质上研究的是不同类型的 “注意力”。对大脑这样的复杂动力系统,“注意力”“意识” 等概念难以精确定义。
语言赋予人类独特能力,但词语的不稳定性恰是其力量源泉。我们需要更坚实的基础构建新的概念框架:历史上,“燃素”“生机论” 等概念因根本性缺陷被淘汰,如今,我们已掌握探测大脑内部状态的工具,心理学概念将逐步转化为更具体的科学构念(如氧气理论阐明火的本质,DNA 揭示生命的机制)。
智能研究的新机遇
我们正处于类似 17 世纪物理学变革的历史机遇期:当时,“力”“质量”“能量” 等概念经数学形式化,从模糊术语变为精确可测量指标,奠定现代物理学基础。研究大语言模型可能揭示智能本质的新原理(类似 20 世纪物理学揭示自然规律)。正如量子力学初现违背直觉,智能的基本原理被揭示时,可能也会呈现反常识特性。
对大语言模型对话机制的数学解析,或可成为构建新智能理论的起点。大语言模型本质是数学函数(通过学习算法训练的复杂函数),训练完成后仍是严格定义的数学对象。研究发现,当这类函数规模足够大时,会展现复杂行为模式(部分特征类似大脑运作)。数学家对函数的研究已有数百年:1807 年,约瑟夫?傅里叶用正弦和余弦序列(傅里叶级数)分析热方程,其后百年催生泛函分析,拓展了对函数空间的认知。神经网络模型作为高维空间中的新函数,对其动态特性的探索可能推动新数学理论诞生,助于理解:内在心理活动如何在大脑与他人、复杂世界的互动中形成(类似三维世界塑造几何直觉,限制想象力 —— 如 “平面国” 中的二维生物难以想象第三维度,见图 7-1)。
大脑具有从独特经验中学习并泛化的卓越能力。20 世纪 80 年代多层网络学习的突破表明,含大量参数的网络可展现惊人泛化能力(远超统计学数据样本复杂度定理的预期)。在高度过参数化的空间(如今可达万亿级参数)中,适用于低维空间的学习统计特性和动力学假设不再成立。尽管深度前馈网络的分析已取得进展,但仍需将数学成果扩展到更复杂的高维循环网络研究中。
自然是否在灵长类大脑中实现了类似大语言模型的系统?通过研究大语言模型的语言处理能力,可能发现语言智能的基本原理,并推广到社会智能、机械智能等形式。与生物进化相比,大语言模型发展速度更快,一旦技术基础确立,性能将持续提升。这项技术的突出特点在于:探索其发展的过程中,我们可能深入理解人类智能的本质。
什么是思维
“我思故我在” 是笛卡儿哲学的核心命题。这句话常被译为 “我思考,所以我存在”,但更精确的翻译或许是 “我正在思考,因此,我必定存在”,简言之即 “思考即存在”。
“思维” 是一个难以准确定义的模糊概念:对某些人而言,它是一连串的逻辑推理;对另一些人来说,它更像是念头的流动;而对许多人而言,它是漂浮在 “感受之海” 中的内心对话。但这些描述终究只是文字游戏。若要判断大语言模型在回答问题、创作诗歌或解决数学问题时是否真的在 “思考”,我们需要对 “思维” 下一个明确的定义 —— 然而,仅通过分析行为表现,恐怕无法解答这一根本性问题。
GPT 5.2
提问:什么是思维?
ChatGPT 回应:
思维有多种形式:
聚合思维:旨在找到问题的唯一正确答案,与逻辑和分析性思维相关(如解数学方程)。
发散思维:与创造力相关,涉及为问题寻找多个可能的解决方案(如为短篇故事集思广益)。
批判性思维:仔细评估信息以得出合理结论的过程。
创造性思维:提出新的、创新性想法的过程。
需注意的是,思维涉及大脑中神经通路的激活,使我们能够处理和理解信息、建立关联,并根据想法做出反应或行动。据我所知(截至 2021 年 9 月),大脑中负责思维的确切机制和过程仍在研究中。
语言与思维的关系:哲学之争
我曾在普林斯顿大学修读一门研究生哲学课程,整个学期都在探讨 “语言和思维,孰先孰后?” 尽管深入讨论了一学期,我们始终未能得出确切结论,主要存在两种对立观点:
语言决定论(语言先于思维):以萨丕尔 - 沃尔夫假说为核心,认为人类的思维和行为深受语言影响,强式表述甚至认为 “语言完全决定思维”—— 我们只能在语言允许的框架内思考。
思维优先论(思维先于语言):认为思维独立于语言存在。证据包括:儿童在掌握语言前已能思考和解决问题;动物具备认知能力(认知心理学和神经语言学支持此观点)。
大多数学者认为,语言与思维的关系并非单向决定,而是在复杂互动中相互影响、彼此塑造:
我们需要语言交流和表达思想;
人类的认知能力也在推动语言的演化与发展。
此外,思维具有多样性,并非所有思维活动都依赖语言。例如,视觉思维、空间思维和情感思维等,往往可在无语言参与的情况下完成。
思维的哲学维度:从现象到因果
思维作为认知过程,涉及心智层面对信息的处理,包括概念形成、问题解决、决策制定和反思等,范围从简单(如记忆电话号码)到复杂(如设计精密机械)。2023 年,著名语言学家诺姆?乔姆斯基对大语言模型提出批判,认为其无法实现人类真实的思维,并用物理现象阐释了思维的三个层次:
现象描述:“苹果掉下来了”(对事实的陈述)。
预测推断:“如果松手,苹果必然下落”(基于经验的归纳)。
因果解释:“一切类似物体都会下落,因重力作用 / 时空曲率”(融合反事实推理与本质分析)。
乔姆斯基认为,唯有第三层 “因果解释” 才是人类独特的思维方式,其核心是反事实推理(“若无重力作用,则苹果不会下落”)与本质认知的结合。
GPT 5.3:对乔姆斯基测试的回应
提问:
如果我手里拿着一个苹果,然后松手会发生什么?
所有物体都会这样吗?
假如没有重力会怎样?
ChatGPT 回应:
受重力作用,苹果会落向地面。
是的,受重力作用,任何物体 “松手” 后都会向地面下落。
在无重力环境中,物体失去地心引力作用,将会自由飘浮,无固定运动方向。
这一结果显示,ChatGPT 已能应对乔姆斯基提出的思维测试。然而,无论如何定义 “思维”,仅凭语言都难以完整描述其本质 —— 思维研究显然不应局限于语言学视角。
因果关系与反事实思维
因果推理是历经数千年哲学探讨仍未定论的复杂概念,既是科学研究的关键,也是人工智能的研究热点。有一点毋庸置疑:相关性不等于因果关系,可能存在 “混淆变量” 同时影响两个变量。
GPT 5.4:相关性与因果关系的经典案例
提问:请举例说明两个变量存在相关性但无因果关系的情况。
ChatGPT 回应:
典型例子是 “冰激凌销量与溺水事故发生率” 的关系:
现象:夏季冰激凌销量和溺水事故同时增加,呈现显著相关性。
真相:两者无直接因果关系,真正的混淆变量是 “天气”—— 炎热天气促使人们购买冰激凌,同时吸引更多人游泳,导致溺水风险上升。
反事实思维与科学发现
反事实思维(提出 “如果…… 那么” 的假设)是科学干预的核心方法:基于已知信息预测,再通过实验验证。需注意的是:
验证成功仅说明假设 “未被证伪”,不代表绝对正确;
真正的科学突破往往源于 “反常现象”(实验结果与预测不符)。
例如,索尔克研究所的托尼?亨特在生物化学实验中观察到凝胶上的异常条带(由缓冲液酸度升高引起),他没有忽视这一细节,反而深入研究,最终发现全新的蛋白质修饰机制,为癌症研究开辟了新方向(详见第十章)。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.hk
Copyright © 2013 - 2025 (香港)大書城有限公司  All Rights Reserved.