查看: 1317|回复: 5
打印 上一主题 下一主题

[教程] 制作图片版的一点心得

[复制链接]

该用户从未签到

539

主题

3046

回帖

25万

积分

翰林院编修

Rank: 11Rank: 11Rank: 11Rank: 11

积分
251476

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

跳转到指定楼层
1
发表于 2018-9-17 16:43:04 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
我做了很多图片版了,用某人的话说,都快成精了。其实我一直都是用tsiank的这个教程帖做的,做一次看一次,这里补充一些他的帖子里没有讲的心得。

1. 教程帖里面的width="1080px",建议换成width="100%"。这样可以让图像适应宽度

2. 图像一定不要用 tif 格式!Goldendict 显示不了。正确的做法是把 tif 转成png,不要转成jpg,jpg图片更大

3. 保存 txt 的时候,记得选择UTF-8无签名(也就是无BOM)

4. 用 mdxbuilder 打包图像的时候,记得路径最后不要加「\」,正确的路径是「C:\某某词典\图像」,不是「C:\某某词典\图像\」

下面是一些用FineReader 的心得,众所周知,这个软件OCR效果很好,有了它的帮助,我们才能快速做出索引的呀。

1. 打开图像后,建议先做预处理、让软件识别一下最佳分辨率,这样OCR效果更好

2. 要善用「区域模板」功能。我们做图片版,一般都是只让软件识别索引部分的,我们可以自定义某一页的特征(表格啊、文本啊),然后让所有页面加载区域模板。

3. 要善用「橡皮擦」功能,有的索引里面有干扰识别的内容,比如常见的「………………」分隔符。有两种办法,一种是让软件按文本识别,一种是用橡皮擦擦掉。

4. 保存成果的时候,要选「无格式」的,因为我们不需要软件保留什么粗体啊倾斜啊这样的格式

FineReader 的心得说得比较简略,主要是现在不方便截图。以后慢慢补充。

评分

3

查看全部评分

  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    2
    发表于 2018-9-18 00:51:06 | 只看该作者
    本帖最后由 喬治兄 于 2018-9-18 02:46 编辑

    感謝 klwo2 兄適時地指點迷津
    非常簡明扼要的點出了實務的重點
    非常受用
    謝謝

    另外 klwo2 兄能否麻煩您再一次指點迷津一下
    小弟看了很久實在看不太懂

    謝謝您了
    感恩

    請教 Mdxbuilder 所附件下的demo 檔的幾個疑問
    ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
    index
    CSS: <a href="entry://css">demo</a><br>
    Sound: <br>
    <a href="entry://sound">demo using link</a><br>
    <a href="entry://bgsound">BGSound demo</a><br>
    Graphic: <a href="entry://graphic">demo</a><br>
    In page link: <a href="entry://#section name">link to view source</a>
    <br>1<br>2<br>3<br>4<br>5<br>6<br>7<br>8<br>9<br><br>1<br>2<br>3<br>4<br>5<br>6<br>7<br>8<br>9<br>0<br>0<br>
    some dummy lines<p>
    <a name="section name">View Source:</a>
    <a href="source://index">view</a>
    </>
    css
    <head>
    <link rel="stylesheet" type="text/css" href="inline0.css" />
    <link rel="stylesheet" type="text/css" href="inline1.css" />
    </head>
    <body>
    <p id="p0">This line should appear green.</p>
    <p id="p1">This line should appear red</p>
    <a href="source://#">Source code</a>

    </body>
    </>
    sound
    Sound test, please click this: <a href="sound://test.spx"><img src="/playIcon.jpg"></img></a>
    </>
    bgsound
    You should be able to use the "speaker" button in the up-right to play audio now
    <BGSound src="/test.spx">
    </>
    graphic
    This entry can show a graphic as this: <img src="/mdict.gif">mdict.gif</img>
    a very large photo: <img src="/1.jpg">1.jpg</img>
    </>
    internal redirect to "graphic"
    @@@LINK=graphic
    </>
    cross page link with section
    <a href="entry://index#section name">jump</a>
    </>
    ------------------------------------------------------------------------------------------------------------------------------------------------------------------
    <a href="entry://headword">abc</a> ------------------->此用法是否轉跳headword的那個詞頭

    <a href="entry://index#section name"> ------------------->此用法是???????????????也是跳轉到index的那個詞頭,#section name--->不知作用????
    是否跳到 詞頭 index 的這個 <a href="entry://#section name">

    <a href="source://#">Source code</a> ------------------->此用法好像不會跳轉只是Source code 下多了下劃線

    <a name="section name">    -------------------> 此用法好像無作用也沒顯示 View Source:

    <a href="source://index"> -------------------> 此用法是否顯示 index 詞頭下含html 語法

    <BGSound src="/test.spx"> ------------------->此在 bgsound 的詞頭並沒有發出 test 的聲音, 用法是???????????????

    点评

    第一个是,剩下几条我都没用过啊  发表于 2018-9-18 08:57
  • TA的每日心情
    开心
    2018-5-26 18:12
  • 签到天数: 11 天

    [LV.3]偶尔看看II

    19

    主题

    120

    回帖

    9106

    积分

    进士

    Rank: 8Rank: 8

    积分
    9106
    3
    发表于 2018-9-18 04:38:37 | 只看该作者
    本帖最后由 Charlieqiu 于 2018-9-18 05:03 编辑

    图片索引难弄,图片清晰度也难调... 尤其是古文字,如果清晰度没调好,那就彻底糊了,真的要小心,宁愿保持原格式体积大点清晰点,也不要为了缩小一点体积而毁了整个词典的价值。古文字类资料最好不要转纯黑白,还是保持原格式吧,除非水平高超...

    点评

    我一般不改格式清晰度,所以我的东西是硬盘杀手哈哈哈  发表于 2018-9-18 08:58
  • TA的每日心情
    无聊
    2019-1-29 19:23
  • 签到天数: 1 天

    [LV.1]初来乍到

    1

    主题

    30

    回帖

    186

    积分

    童生

    Rank: 2

    积分
    186
    4
    发表于 2019-11-4 16:57:57 | 只看该作者
    多谢分享了