新書推薦:

《
抉择时刻:那些原本可以改变世界的演讲
》
售價:HK$
65.8

《
海外中国研究·元代江南政治社会史研究
》
售價:HK$
118.8

《
养元筑基调气血
》
售價:HK$
76.8

《
永夜微光:拉康与未竟之精神分析革命
》
售價:HK$
129.8

《
古希腊社会生活史
》
售價:HK$
54.8

《
维特根斯坦传
》
售價:HK$
63.8

《
暮日耀光:张居正与明代中后期政局
》
售價:HK$
206.8

《
厚土中华
》
售價:HK$
107.8
|
| 編輯推薦: |
|
本书突破传统语义分析范式,首次系统构建”知识驱动+数据驱动”的双轮框架,不仅揭秘了大语言模型在深层语义理解中的革命性作用,更通过工业级案例展现技术落地路径。翻开本书,您将获得解锁文本智能认知核心的密钥。
|
| 內容簡介: |
《框架语义分析:理论、方法与实践》系统阐述了框架语义分析的核心理论与前沿方法,聚焦自然语言处理中语义理解的关键技术,内容涵盖从传统知识指导的框架识别到基于大语言模型的创新方法,深入探讨了关系建模、区域检测和标记注意力等特色模型,凸显了多技术融合与可解释性优势。通过系统化实验验证与案例分析,本书为语义角色标注、信息抽取等任务提供了实用解决方案,兼具理论深度与实践价值。來源:香港大書城megBookStore,http://www.megbook.com.hk 本书适合自然语言处理研究者、高校师生及工业界研发人员阅读学习。
|
| 目錄:
|
第1章 绪论 001 1.1 框架语义分析 002 1.1.1 框架语义知识库 002 1.1.2 框架语义分析任务描述 006 1.1.3 框架语义分析语料资源 008 1.2 框架语义分析方法概述 010 1.2.1 目标词识别方法 010 1.2.2 框架识别方法 012 1.2.3 框架语义角色标注方法 016 1.3 框架语义分析的评价指标 025 1.4 框架语义分析的挑战 026 1.5 本章小结 028
第2章 知识指导的框架识别方法 029 2.1 相关工作 032 2.1.1 框架识别 032 2.1.2 知识表示 032 2.2 任务定义 033 2.3 基于图的框架知识表示 033 2.3.1 面向框架网的图卷积网络 034 2.3.2 面向框架定义的表示 035 2.3.3 面向框架元素的表示 036 2.3.4 基于注意力的融合表示 037 2.4 知识指导的框架识别模型 038 2.4.1 目标词编码器 038 2.4.2 框架网编码器 040 2.4.3 模型训练与预测 040 2.5 实验与结果分析 041 2.5.1 实验环境设置 041 2.5.2 对比实验结果 042 2.5.3 消融实验结果 045 2.6 样例分析 046 2.7 本章小结 047
第3章 面向关系建模的框架语义分析方法 049 3.1 相关工作 052 3.1.1 流水线模式的方法 052 3.1.2 联合建模的方法 053 3.2 任务定义 054 3.3 面向关系建模的框架语义分析模型 054 3.3.1 模型总体结构 054 3.3.2 上下文编码 055 3.3.3 框架识别 056 3.3.4 跨度表示 057 3.3.5 论元识别 058 3.3.6 角色分类 060 3.3.7 模型训练和预测 061 3.4 实验与结果分析 062 3.4.1 实验环境设置 062 3.4.2 对比实验结果 064 3.4.3 消融实验结果 067 3.5 本章小结 070
第4章 基于区域检测的框架语义分析方法 072 4.1 相关工作 074 4.1.1 基于表格填充的方法 074 4.1.2 基于表格编码的方法 075 4.2 任务定义 075 4.3 基于区域检测的框架语义分析模型 076 4.3.1 融合显著性嵌入的编码器 077 4.3.2 基于卷积网络的表格编码器 077 4.3.3 潜在目标词与论元区域检测 080 4.3.4 面向区域的框架与角色分类 082 4.3.5 模型联合训练 084 4.4 实验与结果分析 085 4.4.1 实验环境设置 085 4.4.2 对比实验结果 087 4.4.3 消融实验结果 089 4.4.4 超参数与效率分析 092 4.5 样例分析 094 4.5.1 目标词预测样例分析 094 4.5.2 语义结构预测样例分析 095 4.6 本章小结 096
第5章 基于标记注意力的框架语义分析方法 098 5.1 相关工作 101 5.1.1 标记及基于标记的跨度表示 101 5.1.2 基于标记的框架语义分析方法 102 5.2 任务定义 103 5.3 基于标记注意力的框架分类模型 103 5.3.1 标记注意力输入表示 104 5.3.2 标记表示框架分类 107 5.4 基于标记注意力的框架语义角色标注模型 108 5.4.1 潜在论元生成 109 5.4.2 框架语义角色标注 110 5.5 实验与结果分析 113 5.5.1 实验环境设置 113 5.5.2 对比实验结果 114 5.5.3 消融实验结果 120 5.5.4 运行效率分析 123 5.6 样例分析 125 5.7 本章小结 127
第6章 基于大语言模型的框架语义分析方法 128 6.1 相关工作 129 6.2 零样本和少样本框架语义分析方法 130 6.2.1 提示设计的要素与原则 130 6.2.2 零样本框架语义分析方法 132 6.2.3 少样本框架语义分析方法 136 6.3 基于指令微调的框架语义分析方法 141 6.3.1 指令数据构建 142 6.3.2 大模型指令微调 148 6.4 实验与结果分析 149 6.4.1 实验环境设置 149 6.4.2 零样本实验结果 150 6.4.3 少样本实验结果 151 6.4.4 指令微调实验结果 153 6.5 本章小结 155
第7章 框架语义分析研究总结与发展趋势 157 7.1 研究总结 158 7.2 发展趋势 160
参考文献 162
|
| 內容試閱:
|
自然语言处理是人工智能一个重要的研究领域,也是目前人工智能取得更大突破和更广泛应用的热点领域之一。但由于自然语言具有无处不在的歧义性、高度的抽象性、近乎无穷的语义组合性和持续的进化性,理解语言往往需要具备一定的知识和推理能力,这些都为计算机处理自然语言带来了巨大的挑战。近年来,虽然以深度学习和大数据驱动的预训练语言模型(pre-trained language models, PLMs)和大语言模型(large language models, LLMs)发展迅猛,并促进了相关任务性能的大幅度提升,但在实际应用中仍然需要融合各类反映人类认知经验或根据人类认知构建的各种形式的知识,如语言知识、世界知识、常识知识等。反映人类认知经验的框架语义知识是其中一类非常重要的语言知识,如何将框架语义知识与自然语言理解模型进行关联与融合是提升现有模型语言理解能力的重要途径之一。 框架语义学是由美国著名语言学家Charles J. Fillmore提出的一种语言认知与表示理论。框架语义通过“框架”这一认知结构,将语言表征与客观世界相联系,将反映人类认知的经验表示成结构化的框架,并通过认知联系构建框架之间的关联,从而形成一个网状的认知结构。相关研究表明,将反映人类认知的框架语义知识融合到文本的语义表示中,对于提升如阅读理解、关系抽取、事件抽取、摘要抽取等自然语言理解任务的性能具有重要作用。框架语义知识库构建和框架语义分析是将框架语义知识应用到各类自然语言处理任务中的两项关键技术。当前,框架语义知识库建设已取得了较大的进展,形成了多个较大规模的框架语义知识库,如面向英语的FrameNet、面向汉语的Chinese FrameNet(CFN)等。 框架语义分析是将框架语义知识与自然语言进行关联的关键技术,其目标是从自然语言描述的文本中抽取出框架语义结构。该任务自2002年被提出以来,受到了学术界的广泛关注,其技术的发展大致经历了四个阶段:基于特征工程的方法、基于分布式表示的方法、基于预训练模型的方法、基于大语言模型的方法。随着以卷积神经网络CNN(convolutional neural network)、长短时记忆网络LSTM(long short-term memory)、图卷积网络GCN(graph convolutional network)、Transformer等为代表的深度神经网络的普及应用,基于预训练模型和基于大语言模型的方法成了框架语义分析的主流技术路线。 本书在梳理框架语义分析技术脉络的基础上,结合本人近几年的研究成果,系统介绍基于预训练模型和大语言模型的框架语义分析理论和方法,力求形成以下特色: 第一,系统性。本书从理论体系、方法体系和技术应用三个维度系统构建了框架语义分析的技术体系。在理论层面,全面阐释了框架语义的认知机理、知识库构建、数据资源建设等基础理论;在方法层面,系统梳理了从目标词识别、框架识别、框架语义角色标注,到端到端联合识别的框架语义分析方法体系;在技术层面,在介绍传统方法的基础上,综合应用了多种深度学习的最新技术,形成了层次分明、结构严谨的内容体系,充分体现了内容的系统性。 第二,前沿性。本书结合深度学习领域的最新技术趋势,深度整合了包括CNN、LSTM、GCN、Transformer及大语言模型(large language models,LLMs)在内的前沿技术,详细解析了各类模型在框架语义分析中的适配原理,为读者提供了兼具理论深度和技术前沿性的框架语义分析理论与方法。 第三,创新性。本书针对框架语义分析中的知识表示与融合应用、跨度语义表示与跨度关系建模、统一建模与错误传播等难点问题,提出了创新性的解决策略以及实现方法,为难点问题的解决提供了新思路和新方法,这些创新点显著提升了方法的性能和适用边界。 第四,实践性。本书秉持“理论指导实践”的编写理念,为每个方法设置了完整的实验验证体系。通过精心设计的对比实验、消融实验和应用案例,既验证了方法的有效性,又提供了包括参数调优、结果评估在内的详细实施指南,确保每一个方法能够直接服务于工程实践。 山西大学李茹教授、新加坡资讯通信研究院李晓黎教授、北京大学常宝宝教授为本书的撰写提出了宝贵意见,山西工程科技职业大学郭燕萍副教授为本书的校稿付出了辛勤的劳动,山西大学自然语言处理研究团队、山西大学计算机学院、山西工程科技职业大学为本书的撰写提供了良好的实验环境和办公场所。本书的出版得到了化学工业出版社的大力支持。在此,对本书出版给予支持和帮助的个人和单位表示由衷的感谢。 本书是山西省基础研究计划资助项目“面向英汉双语的多框架语义分析关键技术研究(No.202203021211286)”和广西多源信息挖掘与安全重点实验室开放基金项目“基于图的框架语义场景识别方法研究(No.MIMS22-10)”的研究成果。 由于笔者水平有限,书中内容难免存在疏漏之处,敬请广大读者批评指正,提出宝贵意见。
著者
|
|