查看: 1435|回复: 6
打印 上一主题 下一主题

[词典讨论] 多年前的waverley pictorial dictionary真的不错

[复制链接]

该用户从未签到

13

主题

206

回帖

673

积分

举人

Rank: 4

积分
673
跳转到指定楼层
1
发表于 2015-9-28 03:13:54 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
这个waverley pictorial dictionary在译文论坛上评价也很不错,在archive.org载了8件套的全集,虽然是给学生用的词典,但是写得真心很好,如果可以转成MDX使用率肯定会大大增加,就是阅读起来也很有趣,虽然很古老

该用户从未签到

539

主题

3046

回帖

25万

积分

翰林院编修

Rank: 11Rank: 11Rank: 11Rank: 11

积分
252362

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

2
发表于 2015-9-29 20:52:18 | 只看该作者
哈哈,这个倒是可以。

楼主看这里【图像版mdict字典制作方法 】:https://www.pdawiki.com/forum/fo ... hread&tid=13451

把djvu 花个几分钟转成图片,索引手动校对一下就好了。

我就是看了这个帖子入门的,嘿嘿。

该用户从未签到

13

主题

206

回帖

673

积分

举人

Rank: 4

积分
673
3
 楼主| 发表于 2015-9-30 04:48:54 | 只看该作者
是文字版的pdf的,不是完全图像版的

该用户从未签到

539

主题

3046

回帖

25万

积分

翰林院编修

Rank: 11Rank: 11Rank: 11Rank: 11

积分
252362

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

4
发表于 2015-9-30 08:42:37 | 只看该作者
2008yvaine 发表于 2015-9-30 04:48
是文字版的pdf的,不是完全图像版的

文字版pdf就更簡單了啊!直接用文字做就好了嘛!

你要是還不會,把東西發到網盤上,這裏給個鏈接,一起教你做啦

该用户从未签到

2121

主题

2961

回帖

6万

积分

翰林院修撰

不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

Rank: 12Rank: 12Rank: 12

积分
61056

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

5
发表于 2015-9-30 13:01:53 | 只看该作者
2008yvaine 发表于 2015-9-30 04:48
是文字版的pdf的,不是完全图像版的


这个我还真研究过,要利用那 PDF 做出文字(含音标)准确、完美的 mdx ,难度相当于用煮好的茶叶蛋孵出小鸡来。

该用户从未签到

40

主题

299

回帖

6503

积分

被盗用户

积分
6503

灌水大神章小蜜蜂章笑傲江湖章

6
发表于 2015-9-30 16:18:19 | 只看该作者
Oeasy 发表于 2015-9-30 13:01
这个我还真研究过,要利用那 PDF 做出文字(含音标)准确、完美的 mdx ,难度相当于用煮好的茶叶蛋孵出 ...

深有体会。前几天试做 Roget's Super Thesaurus, 4th Edition,首先从PDF提取内容就困难重重。
pdftohtml、pdf2htmlEX、Pdflib TET、Solid Converter 提取的xml或html各有各的问题,最后还是 Adobe Reader 提取出 txt 自己加格式,但 PDF 里的 small caps 没法保留格式,导致释义和synonym混在一起,没法区分,只能放弃。

该用户从未签到

13

主题

206

回帖

673

积分

举人

Rank: 4

积分
673
7
 楼主| 发表于 2015-10-1 03:53:28 | 只看该作者
几位大神发声,看来真的难度太大,真能PDF看看了