新書推薦:

《
五个夸张的数学故事:支持儿童直接建立数学思维
》
售價:HK$
54.9

《
书写中国:从书迹流变溯源中华文明史 尔文智识生活系列 寻根汉字追踪文脉溯源中华理解中国
》
售價:HK$
173.8

《
餐桌边的哲学家:论饮食与人类
》
售價:HK$
52.8

《
经营:稻盛和夫谈原点
》
售價:HK$
86.9

《
魑魅魍魉:我们的心魔和怪物的意义
》
售價:HK$
97.9

《
湘江商潮起:东汉长沙郡商业研究
》
售價:HK$
74.8

《
舰船耐火材料
》
售價:HK$
283.8

《
东亚学(第六辑)
》
售價:HK$
107.8
|
| 編輯推薦: |
“当代国外语言学与应用语言学文库(升级版)”是主要面向高校英语专业高年级本科生、研究生及英语教师的一套大型的、开放性的系列丛书。本升级版或保留原有经典图书品种,或继之以经典图书的新版,或引进国外语言学与应用语言学领域的新锐力作以进一步拓展学科领域,希望它能继续对我国语言学教学与研究和外语教学与研究起到积极的推动作用。
《词频研究》是“当代国外语言学与应用语言学文库(升级版)”中的一本,既可作为计量语言学领域的入门读物,也可作为高阶研究者的参考书。
·通过直观图表、几何解释和简明模型推导,为缺乏统计学和计量学知识的初学者降低了学习难度
·提供详尽指导和具体方法,使读者快速学会利用简单工具实现词频统计
·通过对不同语言、不同文本的横向比较,帮助读者感知语言的共性,洞察各类文本在词频分布上的殊异之处
|
| 內容簡介: |
本书以词频为切入点,凭借丰富的数据实例和严密的数学推导,提出了多个词汇丰富度计量指标,系统梳理了词频研究的背景、概念、方法、理论模型及应用等,不仅让我们看到了语言现象背后的数量规律,更为了解语言的生成机制提供了科学依据。
來源:香港大書城megBookStore,http://www.megbook.com.hk 本书汇集了诸多专家的智慧,为我们理解语言的本质、文本的特征以及语言与人的关系提供了宝贵的视角。在如今大语言模型蓬勃发展的时代,本书的价值将愈发凸显。
|
| 關於作者: |
|
扬-约维茨·波佩斯库(Ioan-Iovitz Popescu):罗马尼亚物理学家和语言学家,布加勒斯特大学物理系名誉教授,罗马尼亚科学院院士,在语言学领域的主要研究方向为计量语言学。
|
| 目錄:
|
Contents
Preface xix
1 Introduction 1
2 Problems and presentations 5
2.1 Problems 5
2.2 Presentations 9
3 The h- and related points 17
3.1 The h-point 17
3.2 The k-point 35
3.3 The m-point 48
3.4 Gini’s coefficient and the n-point 54
3.5 The role of N and V 70
4 The geometry of word frequencies 73
4.1 Introduction 73
4.2 The rank frequency distribution 75
4.3 The spectrum 81
5 The dynamics of word classes 87
6 Thematic concentration of the text 95
7 Crowding, pace filling and compactness 101
7.1 Crowding 101
7.2 Pace filling 103
7.3 Compactness 107
8 Autosemantic text structure 111
8.1 Introduction 111
8.2 The probability of co-occurrence 113
8.3 The construction of a graph 121
8.4 Degrees 124
9 Distribution models 127
9.1 General theory 127
9.2 Special cases 130
9.3 Applications 133
9.4 The spectrum 143
9.5 Evaluations 152
9.6 Ord’s criterion 154
9.7 Repeat rate and entropy 165
9.8 Word classes 185
10 The relation of frequency to other word properties 195
11 Word frequency and position in sentence 203
11.1 Introduction 203
11.2 Runs of binary data 206
11.3 Runs of multiple data 209
11.4 Absolute positions 210
11.5 Relative position 214
11.6 Frequency motifs 218
11.7 Distances between hapax legomena 227
12 The type-token relation 231
12.1 Introduction 231
12.2 Standard measurement 234
12.3 K?hler-Galle method 239
12.4 The ratio method 240
12.5 Stratified measurement (the window method) 241
12.6 The TTR of F-motifs 244
13 Conclusions 249
14 Appendix: Texts 253
References 265
Subject index 271
Author index 275
|
|