- UID
- 49
- 阅读权限
- 100
- 精华
- 魅力
-
- 信用
-
- 注册时间
- 2007-6-17
- 在线时间
- 小时
- 最后登录
- 1970-1-1
|
发信人: liuchangjie (so much to learn,so little we know), 信区: EnglishWorld
标 题: 英语单词的长度和音节数
发信站: 水木社区 (Sun Mar 24 09:37:43 2013), 站内 [累计积分奖励: 0/100]
最近对自己的vocabulary进行了整理,对于英语的words有一些有意思的发现。
首先是英语单词的长度,利用了List Of All English Words Database Software的数据库,该数据库中共有189444个单词,包含单词的复数,-ed,-ing,不加more、most构成的比较级、最高级形式,首字母缩略词等;不含紧缩形式(can't之类的)以及包含空格、连词符号的词(school bus、roll-up之类的)。统计结果如下(第一列代表n-letter,第二列是n-letter的单词数量):
1 2
2 36
3 988
4 5759
5 11251
6 18478
7 26121
8 30748
9 26489
10 21297
11 16004
12 11508
13 7933
14 5197
15 3223
16 1956
17 1136
18 599
19 329
20 160
21 64
22 30
23 17
24 9
25 2
27 2
28 3
30 2
45 1
可见8个字母的单词最多,有30748个。
其次是单词的音节。我利用LDCOE5建立一个含26760个单词的数据库(基本是手动建立的),这基本上是我词汇量的上限了,其中所有词汇都在LDCOE5中有单独的entry,不含有空格、连词符号的词,不含变形形式。关于这些单词的音节数量,统计结果如下:
monosyllable 1 3918
disyllable 2 10959
trisyllable 3 7041
quadrisyllable 4 3443
pentasyllable 5 1158
hexasyllable 6 207
heptasyllable 7 29
octasyllable 8 5
可见两个音节的单词是最多的。其中5个8音节单词是utilitarianism(u|til|i|tar|i|an|is|m),neocolonialism,interdenominational,electroencephalogram,electroencephalograph,另有一些极品长词暂且不论。单音节词数量也不少,最长的有八个字母(如schmooze, squashed等词)。
在这26760个单词中,一共有68025个音节,去掉重复的,一共有7730个音节!其中有3316个音节只出现了一次,出现100次以上的音节如下:
1 1326 a
2 1273 i
3 1104 er
4 864 ing
5 863 o
6 851 in
7 831 tion
8 686 e
9 651 re
10 633 un
11 564 y
12 563 ter
13 560 ble
14 512 al
15 509 con
16 492 ly
17 425 de
18 405 ry
19 405 ty
20 375 ti
21 369 en
22 360 u
23 350 ed
24 336 di
25 308 per
26 307 ra
27 306 an
28 291 ri
29 288 ta
30 286 dis
31 286 ex
32 265 ver
33 264 ma
34 258 to
35 256 man
36 250 ic
37 245 com
38 240 der
39 221 tive
40 218 na
41 210 la
42 202 ca
43 201 tor
44 200 ni
45 198 pro
46 197 ment
47 192 m
48 188 li
49 181 is
50 180 im
51 177 pre
52 175 ous
53 169 si
54 167 less
55 166 ac
56 165 mo
57 164 cal
58 158 sion
59 154 ful
60 149 ci
61 146 ar
62 140 co
63 138 pa
64 137 cy
65 137 or
66 135 be
67 135 mi
68 129 bi
69 128 mis
70 128 out
71 128 vi
72 127 le
73 127 par
74 126 ate
75 125 tu
76 124 ro
77 124 tic
78 122 ist
79 121 gy
80 120 ad
81 120 as
82 118 on
83 115 fi
84 114 tal
85 114 ten
86 112 so
87 111 pe
88 110 po
89 109 ize
90 108 no
91 106 el
92 103 cu
93 103 te
94 102 ish
95 102 su
96 100 men
97 100 sub
汉语总共也就四百来个音节(不含声调变化),英语音节我估计也就这八千个左右。
其实通过音节记单词和通过字根记单词有异曲同工之妙,举个例子,在我这26760个单词中,含有cious音节的单词只有39个,分别是gracious, luscious, precious, spacious, specious, vicious(这6个是双音节);atrocious, audacious, auspicious, capacious, capricious, delicious, fallacious, ferocious, judicious, loquacious, lubricious, malicious, mendacious, officious, pernicious, precocious, pugnacious, rapacious, sagacious, salacious, suspicious, tenacious, ungracious, vivacious, voracious(这25个是三音节);bootylicious, efficacious, inauspicious, injudicious, meretricious, perspicacious, pertinacious, suspiciously(这8个是四音节),而且cious在这些词中发音还是一模一样的,一口气(约1分钟)读下来感觉很爽(这39个词中,双音节词primary stress在第一个音节;三音节词primary stress在第二个音节;四音节词的第一个音节是secondary stress,第三个音节是primary stress,suspiciously除外),而单词只要读熟了,拼写基本就不是问题了,至于意义,可以通过词根判断,再加上一定的死记硬背、例句、搭配等等,很快就把这些词都搞定了。当然,知道单词的含义还只是刚入门,要真正掌握一个单词,把单词收入自己囊中,只有多读多写多说了。
附件有个音频,内容是:atrocious, audacious, auspicious, bodacious, bootylicious, capacious, capricious, class consciousness, conscious, consciousness, consciousness raising, delicious, efficacious, fallacious, ferocious, gracious, inauspicious, injudicious, judicious, loquacious, lubricious, luscious, malicious, mendacious, meretricious, officious, pernicious, pernicious anaemia, perspicacious, pugnacious, precious, precious metal, precious stone, precocious, pugnacious, rapacious, sagacious, salacious, self-conscious, semi-precious, spacious, specious, stream of consciousness, subconscious, suspicious, suspiciously, tenacious, unconscious, ungracious, vicious, vicious circle, vivacious, voracious.每个词(组)读了两遍,总共也不过97秒啊。上面的词在我看来,最难的是conscious, gracious, precious, suspicious, vicious这5个,因为它们最常用,在学习型词典里义项最多(也不过几项)、例句最多,其他的词都是纸老虎而已。
统计中简单用到了List Of All English Words Database Software, Microsoft Excel 2010, Edit Plus v3.50, AntConc,没有编程。
在整理的过程中,也发现自己之前的一些错误,比如lieutenant,自己一直发作/lju:ten…/,因为有个习语in lieu of sth中的lieu我一直就发作/lju:/(其实也可以发作/lu:/),事实上lieutenant英音是/lef’ten…/(这里的f来得很蹊跷啊,有人知道origin吗?),美音是/lu:’ten…/这里lieu-ten-ant三个音节中的lieu也真够奇怪的。tenant是个单词,lieu也是个单词,lieutenant也是个单词,单词拼写中含有lieu的词还有halieutic, milieu, purlieus,还有就是lieutenancy之类的变形了。
还有parliament(par-lia-ment),我一直把第二个音节lia发作leer一样的音,现在发现其实ia只发一个schwa或者/i/音,不是一个diphthong。
另外一个收获就是英语中由动词加-ed、-ing后缀构成的形容词,数量不少,但是这些形容词和动词的分词形式一模一样,我自己一般很少用这些词,顶多用用interesting, inspiring, boring, exciting, insulting, grasping之类带有感情色彩的词,而且都是用在连系动词之后作表语。事实上,很多-ed、-ing形式的形容词在词典中都单列条目,例句多多,比如说marked,unmarked,headed之类的我们一看就知道意思的词,其实也可以用在名词前作定语,而我自己却很少这么用,以后要多用。等有空再整理一下在词典中单列为形容词、名词的-ed、-ing形式的条目。
|
|