TA的每日心情 | 难过 2020-2-18 14:09 |
---|
签到天数: 1 天 [LV.1]初来乍到
秀才
- 积分
- 407
|
6楼
楼主 |
发表于 2013-1-9 02:57:19
|
只看该作者
4# supernj
呵呵,你先讲讲哪里导入格式,哪里导入内容,以及格式的格式,我告诉你如何分离。
sxingbai 发表于 2013-1-8 21:45
可以先從此處(http://www.babylon.com/products/glossary-builder.html)下載安裝Babylon Glossary Builder。
然後,你可以很方便的自建一個Excel文檔(比如sample.xlsx)。第一列錄入若干关键字,第二列是正文1(比如音標或詞性),第三列是正文2(比如解釋),第四列是正文3(比如例句)........在這個excel文檔中你所錄入的都是“内容”也就是將來會在babylon所能看到的東西。這些東西中你不可以包含html語句,比如<font size=5>whole</font>、<font face="Kingsoft Phonetic Plain, Tahoma">(hol,hJl; houl)</font>等等,只能是“内容”,否則babylon會將這些html語句也當作“内容”原封不動的顯示出來,而不會做加粗、字號、斜体等動作。
接下來你就可以運行Babylon Glossary Builder了。它是向導式的,前幾步很常規了,bu lah....bu lah....
到了第三步(the title is Data Source)導入剛才的那個sample.xlsx,也就是所謂的“内容”。(到這一步回答了“哪里导入内容”這個問題)
第4步(the title is Data Table),確定哪一列是關鍵字列,確認正文1、正文2、正文3順序。。。。
下面將要回答“哪里导入格式”這個問題:就在這個頁面,右下角有一個“Advnced styling...”的按鈕,點擊。ok你可以用html語句定義格式了,excel的第一列什麽格式、第二列什麽字體、第三列是否加粗,第四列什麽顔色。。。。everything, you name it.
然後,bu lah....bu lah....一個.bgl就生成了,就可以用babylon查詢單詞了。
過程很簡單吧,但是現在我就卡在“得到excel文檔”這一步。因爲用GetDict把.mdx文件導出為.txt文件以後,“内容”與“格式”(也就是html語句)是融合在一起的。而從以上我所敍述的babylon字典的製作過程中卻可以看出Babylon Glossary Builder要求這兩者是分開的。而且在“内容”excel中,第一列如果關鍵詞,所有行都必須是關鍵詞(這個沒問題,excel很容易從.txt文件中把這一列切割出來);第二列如果是音標,如前所述,所有行都必須是音標(這也容易切出)。
但是如果遇到詞性、解釋、例句。。。等等,這些就不是這麽簡單了。因爲一個單詞也許可以就一種拼寫,但是詞性可以有n個、解釋n+n個、例句n*n個。這麽多項目必須每類一列(也就是詞性1獨佔一列,詞性2獨佔一列。。。。。例句1獨佔一列,例句2獨佔一列。。。例句n獨佔一列,例句n+1獨佔一列),而且行與行之間,共同的列還必須對齊(因爲只有這樣後面你才可以對這一列定義html格式)。如果只有十幾個單詞,你可以人工做分列、對齊這些工作,但是一部字典幾萬個單詞,顯然人工來做就不現實。
所以對於如何分离,想聼聼你的高見。
也許換個思路,也有別的方法做出一部babylon字典,想聼聼大家的指點,謝謝! |
|