|
本帖最后由 喬治兄 于 2019-6-6 01:08 编辑
小弟不才深感各位同好製作辭典之辛勞
只因幾個抽樣概念欲與同好們分享
若用抽樣的 Defect Rate 來看匹配密合度也能有所答案
假設如下:
詞首表單字有 3000 個 (single plan sampling) 若您選定的 4個字表的 Wordlists 都是 20萬的字表 (所謂的 Lot Size N)
而經由 vlookup 在 Lot Size N 分別對映到的單字數 a (Accept Number ) 分別為
a = 2000 ,2500 , 2800, 2900
AQL=acceptance quality level
LTPD=lot tolerance percent defective
AOQL=aver outgoing quality limit
OC=operating characteristic curve
AOQ=average outgoing quality .............後面的幾張表為 AOQ: 請留意一下, 當達到某個值時幾乎為 0 Loss
也就是說以 L(Q0)=95% , L(Q1)=10%......(Type I, II) 的失誤率是相當低的
倘若把 Lot Size N 當成是未知數則計算出的值應可為對那辭典匹配率的估算值.......詳見10,11樓
若把 AQL 當成 匹配率
a = 2000 , 65.3%
a = 2500 , 82.2%
a = 2800 , 92.6%
a = 2900 , 96.1%
誠如 Budha 兄所言此法並不精確, 純亂槍打鳥, 小弟思考在三, 此法....應該不屬...奇技淫巧.. 之範疇望同好們多加指正......感謝大德
此法僅僅是只能作為沒太多時間製作圖片式辭典的一個參考依據
PS.
所有的解釋只是想陳述由此概念來選擇匹配的Wordlist優劣而已
純.......參考
并不需要真的去計算
而是了解此現象
把定量分析的性質
轉化作為定性之選擇字表的依據的應用
|
|