|
本帖最后由 喬治兄 于 2020-3-29 18:56 编辑
lbhl 兄:
是可以算一個區間的數量
隨機抽樣 30 頁數一下有多少 headwords 求出每頁平均值和標準異差
每頁平均值 x 頁數....= headwords 該書的平均值
headwords 平均值 (+/-) 3 x (標準異差 x 頁數) ...........約莫是該書的 headwords 區間的數量
min headwords = headwords 平均值 - 3 x (標準異差 x 頁數)
mean headwords = 平均值 x 頁數
max headwords = headwords 平均值 + 3 x (標準異差 x 頁數)
+/- ....一個標準異差的量 68% confidence interval
+/- ....兩個標準異差的量 95% confidence interval
+/- ....三個標準異差的量 99.7% confidence interval
min headwords < mean headwords < max headwords
辭典詞彙量估算匹配
https://www.pdawiki.com/forum/thread-33621-1-1.html
|
|