查看: 24839|回复: 44
打印 上一主题 下一主题

[索引] 词库制作中可能有用的软件、技术整理[201710919]

  [复制链接]

该用户从未签到

2121

主题

2961

回帖

6万

积分

翰林院修撰

不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

Rank: 12Rank: 12Rank: 12

积分
61056

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

跳转到指定楼层
1
发表于 2013-8-25 10:34:14 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 Oeasy 于 2017-9-19 15:42 编辑


FAQ
>>  未加密的 mdx 如何转为txt?
工具①,GetDict.exe by yhssdl。下载地址:
http://pan.baidu.com/share/link? ... 67&uk=305151372

>>
[实例][解压mdx/mdd再打包为mdx/mdd][乱][多图]  https://www.pdawiki.com/forum/fo ... hread&tid=13388


老马的原创空间 http://www.cnblogs.com/stronghorse/


bgl-> txt https://www.pdawiki.com/forum/fo ... &fromuid=147948






整理中,欢迎补充
mdx制作非常简单,但是要获取源文件,或把词典做得很漂亮有的时候是需要下一番功夫的。
正则表达式Regular Expression, html, xml, div+css,
编码,尤其是汉字编码的一些知识,神马UTF, GBK, unicode。。。{:10_300:}
程序设计语言:
Python;C++;
Perl
JavaScript : http://www.w3school.com.cn/js/jsref_decodeURIComponent.asp
VBS/VBA
http://www31.ocn.ne.jp/~h_ishida/scripts.html
数据库软件:
Navicat Premium
SQLiteSpy,PowerBuilder
SQLite Expert Professional
软件:
MDict,MdxBuilder: http://www.octopus-studio.com/download.cn.htm

文本编辑器类:Notepad, Notepad++, EmEditor, UltraEdit, EditPlus,
Replace Pioneer http://zhidao.baidu.com/link?url ... KEcUNfmzOo7nLH8BSNq
Raptor 3 http://softfie.com/software/hacktool-raptor.html
awk 4 Windows :http://sourceforge.net/projects/ ... -1-bin.zip/download

Microft Office:Word, Excel, Access
Adobe: Adobe Director (某些光盘是用Macromedia软件做的,用这个可以提取语音),Adobe Acrobat Pro
OCR:ABBYY FineReader
DWS: Tlex
浏览器:Firefox, Chrome

解压缩软件


离线下载类:
wget, Teleport Pro, OfflineExplorer
其他
Fiddler 2,
SQLiteSpy
yhssdl的GetDict2.6
AudioTranscoder
按键精灵
Tvangeste / dictzip-win32
https://github.com/Tvangeste/dictzip-win32/releases/

dsl相关软件:
DSLGD

有参考价值的技术(讨论)贴:
0. superfan89
[英汉-汉英] 21世纪大英汉词典&新汉英大词典【11/8/1更新】: https://www.pdawiki.com/forum/thread-7022-1-1.html, 帖子附件有ydDumper源代码
https://github.com/superfan89/IDMSKconv IDMSKconv源码
http://dicwizard.jp/jamming_ug.html
https://www.pdawiki.com/forum/fo ... ctionary&page=3 63楼

1. chigre
【直播完成】一个在线词典的离线MDX化制作[2012-11-29]:https://www.pdawiki.com/forum/thread-10260-1-1.html
各种格式词典数据转TXT文本的工具软件(.BGL .LSD .LD2 .MDX STARDICT) https://www.pdawiki.com/forum/thread-10267-1-1.html
[其他语种] Z意汉汉意词典转制效果: https://www.pdawiki.com/forum/thread-10796-1-1.html

2. Hugh
【图文】手把手教你[转换]+[排版] MDX格式词库: https://www.pdawiki.com/forum/thread-10689-1-1.html

3. ldlcau
mdict版制作方法和常用工具: https://www.pdawiki.com/forum/thread-899-1-1.html

4. Oeasy
【2013.07.06】如何利用Microsoft Word排版制作.mdx? : https://www.pdawiki.com/forum/thread-10801-1-1.html

5. jjcizi
[BlueDict] 一种把Excel转换为MDX的方法: https://www.pdawiki.com/forum/thread-9600-1-1.html

6. sunsmile23
汉英词典的汉字显示问题: https://www.pdawiki.com/forum/thread-10809-1-1.html
vba如何正确地输出UTF-8编码文件: https://www.pdawiki.com/forum/thread-10832-1-1.html

7. sjn01
求助,能否将Collins COBUILD 高阶英汉词典做成MDX?:https://www.pdawiki.com/forum/thread-6626-1-1.html

8. 惟吾无为
linux下制作离线百度百科的思路(含成品): https://www.pdawiki.com/forum/thread-9256-1-1.html

9. freegut
分享Lingvo到MDict的转换经验: https://www.pdawiki.com/forum/thread-5386-1-1.html

8. zhu1234
Mdx制作流程: https://www.pdawiki.com/forum/thread-9440-1-1.html

9. 发哥
[英-英] ◆Dictionary of American Slang and Colloquial Expressions【20081222】:https://www.pdawiki.com/forum/fo ... ighlight=pdf%2Bword 8楼有pdf到html的经验。

10. FHYVUCBRUG
https://www.pdawiki.com/forum/thread-10617-9-1.html 第219、220、222、224楼。网盘有ConvToSpx.py

11. 手把手教你转换辞典
http://bbs.emagic.org.cn/forum.p ... ntable&tid=5278
http://www31.ocn.ne.jp/~h_ishida/scripts.html


--
http://blog.yeshj.com/luodean/
老马的原创空间:http://www.comicer.com/stronghorse/index.htm
---
1.  Ultra Edit中如何删除包含特定内容的行?
如某文件中有些行含有特定内容PTTAddress
a. 使用替换功能,勾选正则表达式(Regular Expressions),替换内容为%*PTTAddress*^p,替换为为空;
b. 删除空行,使用替换功能,替换内容为^r^n^r^n,替换为为^r^n;
a. 使用搜索功能,勾选列出所含内容的行(List Lines Containing Characters),搜索内容为PTTAddress;
b. 在搜索结果中选择拷贝到粘贴板;
c. 新建一空白文件,然后ctrl+v。


2. 使用wget如何登录后再下载
http://tilt.lib.tsinghua.edu.cn/node/213

3. 如何批量修改文件后缀名?
http://zhidao.baidu.com/question/423790075.html

4. 如何把多个文本文档合并成一个
http://zhidao.baidu.com/question/172524472.html

5. EPWING转txt
http://coffeejp.com/bbs/thread-170502-1-1.html
另:数千部日文小说和EBwin字典网盘分享 http://www.douban.com/group/topic/26642847/
http://www.coffeejp.com/bbs/forum-22-1.html

6. bgl2StarDict
http://code.google.com/p/stardict-3/wiki/ConvertBabylon

7. Lingoes灵格斯电子词典LD2(LDF)文件单词提取器
http://code.google.com/p/lingoes-extractor/
-
https://github.com/windylea/lingoes-converter

8. lsd 2 dsl
http://alabaxblog.info/2013/02/lsd-to-dsl-mass/
http://www.windylea.com/blog/201 ... or-abbyy-lingvo-x5/

9. An Analysis of MDX/MDD File Format
https://bitbucket.org/xwang/mdict-analysis
http://m.newsmth.net/article/LinuxDev/56948?p=1
http://mdict.codeplex.com/

10.
http://hanzisearcher.cnblogs.com/

11. RegEx Dotext 1.0
mdx制作必备:RegEx Dotext 1.0,可合并词条,提取信息等
https://pdawiki.com/forum/thread-11430-1-1.html

12. awk+wget实现批下载
http://blog.sina.com.cn/s/blog_4a1f59bf0100nifm.html

13. 【awk学习】gawk+wget+grep写的小爬虫
http://bbs.byr.cn/#!article/Linux/104263

14. wget批量下载文件后,如何重命名!
http://www.linuxsir.org/bbs/thread321272.html

15. http://www.regexlab.com/

16. EBDump
http://www31.ocn.ne.jp/~h_ishida/EBDump.html
http://www31.ocn.ne.jp/~h_ishida/EBDump/EBDump.html

17. Python抓取网页&批量下载文件方法初探(正则表达式+BeautifulSoup)
http://www.360doc.com/content/13/0929/20/11729272_318036381.shtml

18. [转]用python爬虫抓站的一些技巧总结
http://hi.baidu.com/txcbg/item/9b10b9562c275b9408be176a

19. Python爬虫入门教程
http://blog.csdn.net/column/details/why-bug.html

=========
EPWING相关:
http://hp.vector.co.jp/authors/VA021723/dessed/

评分

2

查看全部评分

本帖被以下淘专辑推荐:

该用户从未签到

12

主题

407

回帖

1万

积分

翰林院编修

Rank: 11Rank: 11Rank: 11Rank: 11

积分
11211

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

来自 14楼
发表于 2014-6-2 11:26:50 | 只看该作者
本帖最后由 meigen 于 2014-10-7 01:45 编辑

提取Epwing词典图片的java代码
Epwing的图片分为两种, 一种是彩图(カラー図版)一种是单色图(モノクロ), 两种图片格式不同需要分别分析
首先是彩图
格式说明:每张图片以“data”(64 61 74 61)为起点标志,data后面四位是该图片的数据大小,比如“6B E3 00 00”表示这个图片大小是58219字节;后面是数据部分,要提取的内容就是这个
提取有两种情况,一种是先用ebDump导出txt格式,然后用txt来提取,一种是直接用HONMON文件提取,省去了中间步骤
先介绍用ebdump导出txt格式然后提取彩图
  1. final static char[] DIGITS = {
  2.     '0' , '1' , '2' , '3' , '4' , '5' , '6' , '7' ,
  3.     '8' , '9' , 'A' , 'B' , 'C' , 'D' , 'E' , 'F'
  4. };
  5. public static String toHex(int i) {
  6.         char[] buf = {'0', '0', '0', '0', '0', '0', '0', '0'};
  7.         int charPos = 8;
  8.         int mask = 0xf;
  9.         do {
  10.             buf[--charPos] = digits[i & mask];
  11.             i >>>= 4;
  12.         } while (i != 0);
  13.         if(charPos > 4) charPos = 4;
  14.         return new String(buf, charPos, (8 - charPos));
  15. }
  16. static void getColorPic(String f, String path) {
  17.     try {
  18.         BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(f), "Shift_JIS"));
  19.         OutputStream out = null;
  20.         String line = "";
  21.         String block = "";
  22.         byte[] bs = new byte[2048];
  23.         int idx = 0;
  24.         if (!path.endsWith("/")) path += "/";
  25.         File fl = new File(path);
  26.         if(!fl.exists()) fl.mkdirs();
  27.         while (((line = reader.readLine()) != null)) {
  28.             if (line.startsWith("block")) {
  29.                 block = line.substring(6, line.indexOf("("));
  30.                 System.out.println(block);
  31.                 idx = 0;
  32.             }
  33.             if (line.startsWith("0")) {
  34.                 for(int i=0; i<16; i++) {
  35.                     int a = CHARS.indexOf(line.charAt(5+3*i));
  36.                     int b = CHARS.indexOf(line.charAt(6+3*i));
  37.                     bs[idx++] = (byte) (a << 4 | b);
  38.                 }
  39.             }
  40.             int dts = -1;
  41.             int ws = 0;
  42.             if (idx == 2048) {
  43.                 for (int i=0; i<2044; i++) {
  44.                     if (bs[i]==0x64 && bs[i+1]==0x61 && bs[i+2]==0x74 && bs[i+3]==0x61) {
  45.                         dts = i;
  46.                     }
  47.                 }
  48.                 if (dts != -1) {
  49.                     if (out != null) {
  50.                         out.write(bs, 0, dts);
  51.                         out.flush();
  52.                         out.close();
  53.                     }
  54.                     out = new BufferedOutputStream(new FileOutputStream(path+block+toHex(dts)+".bmp"));
  55.                     if(dts > 2040) ws = dts-2040;
  56.                     else out.write(bs, dts + 8, 2040 - dts);
  57.                 } else if (out != null) out.write(bs, ws, 2048 - ws);
  58.                 idx = 0;
  59.             }
  60.         }
  61.         reader.close();
  62.         if (out != null) {
  63.             out.flush();
  64.             out.close();
  65.         }
  66.     } catch (Exception e) {
  67.         e.printStackTrace();
  68.     }
  69. }
复制代码
getColorPic(String f, String path) 参数说明: f是图片导出的txt文件, path是保存图片的路径

点评

请问,还有 EPWING 转 MDX 的 工具 吗?  发表于 2018-9-6 14:32

评分

1

查看全部评分

该用户从未签到

12

主题

407

回帖

1万

积分

翰林院编修

Rank: 11Rank: 11Rank: 11Rank: 11

积分
11211

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

来自 16楼
发表于 2014-6-2 17:03:11 | 只看该作者
本帖最后由 meigen 于 2014-10-10 20:19 编辑

接14楼,单色图的提取稍微麻烦些,他里面只有数据部分而缺少文件头,这个是比较头疼的事情
先用ebdump提取出词典文本(本文),然后在里面获取单色图的代码(<1F44>开头,<1F64>结尾)
可以看到
<1F44><0001><w=200,h=256>xxx<1F64>[0001A4BD:0027]
这里的w=200,h=256表示图片的尺寸,这个参数后面会用到
然后<1F64>后面的这一段[0001A4BD:0027]就是单色图数据地址了
先写个Demo 把所有地址都提取出来,顺便排一下序,去掉重复:
  1. static void getMonoTag(String f) {
  2.     try {
  3.         BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(f+".txt"), "Shift_JIS"));
  4.         BufferedWriter writer = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(f+".mono.txt"), "UTF-8"));
  5.         String line;
  6.         ArrayList<String> monos = new ArrayList<String>();
  7.         while (((line = reader.readLine()) != null)) {
  8.             while (line.contains("<1F64>")) {
  9.                 line = line.substring(line.indexOf("<1F64>") + 6);
  10.                 monos.add(line.substring(0, 15));
  11.             }
  12.         }
  13.         reader.close();
  14.         String[] monoa = new String[monos.size()];
  15.         monos.toArray(monoa);
  16.         Arrays.sort(monoa);
  17.         String last = "";
  18.         for (int i=0; i<monoa.length; i++) {
  19.             if (!monoa[i].equals(last))
  20.                 writer.write(monoa[i] + "\r\n");
  21.             last = monoa[i];
  22.         }
  23.         writer.close();
  24.     } catch (Exception e) {
  25.         e.printStackTrace();
  26.     }
  27. }
复制代码

得到了一个.mono.txt的文件
然后开始提取:
上面有提到w=200,h=256这两个参数,不过epwing好像弄反了,200是高,256是宽。 - -
提取过程中需要手动加上图像的文件头,可自行百度bmp文件格式
  1. static final int WIDTH = 256;
  2. static final int HEIGHT = 200;
  3. static final int WIDTH2 = 32;
  4. static final int SIZE = WIDTH2 * HEIGHT;
  5. static final int FILE_LEN = SIZE + 62;
  6. static byte[] filehead = {0x42, 0x4d,
  7.     (byte) (FILE_LEN & 0xff), (byte) ((FILE_LEN >> 8) & 0xff), (byte) ((FILE_LEN >> 16) & 0xff), (byte) ((FILE_LEN >> 24) & 0xff),
  8.     0, 0, 0, 0, 0x3e, 0, 0, 0};
  9. static byte[] infohead = {0x28, 0, 0, 0,
  10.     (byte) (WIDTH & 0xff), (byte) ((WIDTH >> 8) & 0xff), (byte) ((WIDTH >> 16) & 0xff), (byte) ((WIDTH >> 24) & 0xff),
  11.     (byte) (HEIGHT & 0xff), (byte) ((HEIGHT >> 8) & 0xff), (byte) ((HEIGHT >> 16) & 0xff), (byte) ((HEIGHT >> 24) & 0xff),
  12.     1, 0, 1, 0, 0, 0, 0, 0,
  13.     (byte) (SIZE & 0xff), (byte) ((SIZE >> 8) & 0xff), (byte) ((SIZE >> 16) & 0xff), (byte) ((SIZE >> 24) & 0xff),
  14.     0, 0, 0, 0, 0, 0, 0, 0, 2, 0, 0, 0, 2, 0, 0, 0, -1, -1, -1, 0, 0, 0, 0, 0};
  15. static void getMonoPic(String f, String m) {
  16.     try {
  17.         BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(f+".txt"), "Shift_JIS"));
  18.         BufferedReader reader2 = new BufferedReader(new InputStreamReader(new FileInputStream(m+".txt"), "UTF-8"));
  19.         OutputStream out = null;
  20.         String line = "";
  21.         String line2 = reader2.readLine();
  22.         int block = 0;
  23.         int block2 = Integer.parseInt(line2.substring(1, 9), 16);
  24.         int offs = Integer.parseInt(line2.substring(10, 14), 16);
  25.         byte[] temp = new byte[2048];
  26.         byte[] data = new byte[WIDTH2 * HEIGHT];
  27.         int[] idxs = new int[WIDTH2 * HEIGHT];
  28.         for (int i=0; i<HEIGHT; i++) {
  29.             idxs[i * WIDTH2] = (HEIGHT - 1 - i) * WIDTH2;
  30.             for (int j=1; j<WIDTH2; j++)
  31.                 idxs[i * WIDTH2 + j] = idxs[i * WIDTH2 + j - 1] + 1;
  32.         }
  33.         int idx = 0;
  34.         int didx = 0;
  35.         while (((line = reader.readLine()) != null)) {
  36.             if(line.startsWith("block")) {
  37.                 block = Integer.parseInt(line.substring(6, 11), 16);
  38.                 idx = 0;
  39.             }
  40.             if(line.startsWith("0")) {
  41.                 for(int i=0; i<16; i++) {
  42.                     int a = CHARS.indexOf(line.charAt(5+3*i));
  43.                     int b = CHARS.indexOf(line.charAt(6+3*i));
  44.                     temp[idx++] = (byte) (a << 4 | b);
  45.                 }
  46.             }
  47.             if (idx == 2048) {
  48.                 if(block < block2) continue;
  49.                 int start = offs;
  50.                 if(didx != 0) start = 0;
  51.                 for(int i=0; i<2048; i++) {
  52.                     if(i >= start)
  53.                         data[idxs[didx++]] = temp[i];
  54.                     if(didx == WIDTH2 * HEIGHT) {
  55.                         System.out.println(toHex(block2)+"."+toHex(offs));
  56.                         out = new BufferedOutputStream(new FileOutputStream("pic/"+toHex(block2)+toHex(offs)+".bmp"));
  57.                         out.write(filehead);
  58.                         out.write(infohead);
  59.                         out.write(data);
  60.                         out.flush();
  61.                         out.close();
  62.                         line2 = reader2.readLine();
  63.                         if(line2 == null || line2.equals("")) {
  64.                             reader.close();
  65.                             reader2.close();
  66.                             return;
  67.                         }
  68.                         block2 = Integer.parseInt(line2.substring(1, 9), 16);
  69.                         offs = Integer.parseInt(line2.substring(10, 14), 16);
  70.                         didx = 0;
  71.                     }
  72.                 }
  73.                 idx = 0;
  74.             }
  75.         }
  76.         reader.close();
  77.         reader2.close();
  78.     } catch (Exception e) {
  79.         e.printStackTrace();
  80.     }
  81. }
复制代码

待编辑...

回15楼:
能把代码用附件形式上传么?顺便使用说明用英文。

代码有一些要改动的地方, 我完善一下就传附件
另外用英文说明这...{:11_336:}
我先用中文注释一下, 然后再慢慢翻译

评分

1

查看全部评分

  • TA的每日心情
    开心
    2019-8-11 07:55
  • 签到天数: 606 天

    [LV.9]以坛为家II

    22

    主题

    1128

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11878

    小蜜蜂章笑傲江湖章灌水大神章

    2
    发表于 2013-8-25 17:56:54 来自手机 | 只看该作者
    楼主辛苦了。

    该用户从未签到

    8

    主题

    18

    回帖

    308

    积分

    秀才

    Rank: 3Rank: 3

    积分
    308
    3
    发表于 2013-8-28 11:29:54 | 只看该作者

    该用户从未签到

    13

    主题

    146

    回帖

    4197

    积分

    贡士

    Rank: 6Rank: 6

    积分
    4197
    4
    发表于 2013-10-23 12:56:25 | 只看该作者
    这帖子太好了。现在上的课正好跟html,jsp,sql有关,可以有针对性地学一学了~~

    该用户从未签到

    0

    主题

    417

    回帖

    6416

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    6416

    笑傲江湖章灌水大神章

    5
    发表于 2013-10-24 09:37:16 | 只看该作者
    辛苦了!
  • TA的每日心情
    开心
    2021-1-11 09:04
  • 签到天数: 83 天

    [LV.6]常住居民II

    30

    主题

    933

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15823

    灌水大神章小蜜蜂章笑傲江湖章

    6
    发表于 2013-11-1 23:10:03 | 只看该作者
    对我们这些没有软件基础的可咋整?

    该用户从未签到

    2

    主题

    16

    回帖

    76

    积分

    被盗用户

    积分
    76
    7
    发表于 2013-11-3 10:47:35 | 只看该作者
    不懂,只知道怎么使用,仅以回帖表示赞同
  • TA的每日心情
    慵懒
    2023-3-15 17:43
  • 签到天数: 14 天

    [LV.3]偶尔看看II

    7

    主题

    52

    回帖

    583

    积分

    举人

    Rank: 4

    积分
    583
    8
    发表于 2013-11-7 08:29:45 | 只看该作者
    楼主辛苦了,谢谢分享

    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    9
     楼主| 发表于 2013-11-8 00:02:28 | 只看该作者
    高手们都歇了,或者对词典不感兴趣。
    其实目前新的词典资源,主要集中在iOS、Android应用上,一些数据dat啊,db啊,都有加密,要破解啊,技术含量很高噢。
    -
    一些扫描的词典,要做成pdf,基本就只有靠神人出手了。网络合作校对或录入?我从来不觉得这事儿靠谱,志同道合的、对同一语种同一词典感兴趣的人太少太少。慢慢等吧。{:5_214:}

    该用户从未签到

    40

    主题

    177

    回帖

    1628

    积分

    版主

    Rank: 10Rank: 10Rank: 10

    积分
    1628

    灌水大神章小蜜蜂章笑傲江湖章管理组专用章

    10
    发表于 2013-11-11 10:58:55 | 只看该作者
    一直想制作啊,太复杂了,文科生一枚,看得我头晕。
    其实我只是想制作一个自己个人的词典,因为自己从事英语教学,有些单词讲解有自己的方式,要是加进去,以后备课就方便了。
  • TA的每日心情
    开心
    2021-4-9 21:23
  • 签到天数: 48 天

    [LV.5]常住居民I

    6

    主题

    270

    回帖

    1466

    积分

    解元

    Rank: 5Rank: 5

    积分
    1466

    灌水大神章

    11
    发表于 2014-1-21 18:03:13 | 只看该作者
    看看,学习!谢谢

    该用户从未签到

    24

    主题

    701

    回帖

    4442

    积分

    翰林院修撰

    不傲嬌的傲嬌

    Rank: 12Rank: 12Rank: 12

    积分
    4442

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    12
    发表于 2014-2-18 10:51:18 来自手机 | 只看该作者
    这个很赞!
    最近打算扒维基来着。

    该用户从未签到

    34

    主题

    755

    回帖

    2705

    积分

    解元

    Rank: 5Rank: 5

    积分
    2705

    灌水大神章小蜜蜂章笑傲江湖章

    13
    发表于 2014-6-1 17:32:34 | 只看该作者
    好贴收藏。

    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    15
     楼主| 发表于 2014-6-2 14:18:15 | 只看该作者
    meigen 发表于 2014-6-2 11:26
    提取Epwing词典图片的java代码
    Epwing的图片分为两种, 一种是彩图(カラー図版)一种是单色图(モノクロ), 两 ...

    {:5_227:}

    论坛用了防转载插件还是什么的,复制代码的时候后边会加上一堆乱码。
    能把代码用附件形式上传么?顺便使用说明用英文。
    辛苦辛苦~

    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    17
     楼主| 发表于 2014-6-2 19:29:10 | 只看该作者
    本帖最后由 Oeasy 于 2014-6-2 19:31 编辑
    meigen 发表于 2014-6-2 17:03
    接14楼, 单色图的提取稍微麻烦些, 他里面只有数据部分而缺少文件头, 这个是比较头疼的事情
    我们可以先到词 ...


    {:10_240:}

    。。。。
    其实GoldenDict支持EPWING了,尚稍有瑕疵,但已然近乎完美,不敢要求更多,感谢Abs62大神。
    http://goldendict.org/forum/viewtopic.php?f=4&t=2922
    http://goldendict.org/forum/view ... =2091&start=300
    不过能把EPWING转出文本 & 图片,制作为dsl、mdx等,进行个性化排版,这些啊,始终是让人愉悦和有成就感的事情。。。{:10_228:}

    该用户从未签到

    2

    主题

    17

    回帖

    126

    积分

    童生

    Rank: 2

    积分
    126
    18
    发表于 2014-6-8 18:42:15 | 只看该作者
    这个帖子太棒了!必须好好学习一下啊。
  • TA的每日心情
    奋斗
    2018-12-10 10:05
  • 签到天数: 19 天

    [LV.4]偶尔看看III

    1

    主题

    23

    回帖

    426

    积分

    秀才

    Rank: 3Rank: 3

    积分
    426
    19
    发表于 2014-6-23 15:54:42 | 只看该作者
    几位大神都离开啊,只求不定期更新词库
  • TA的每日心情
    开心
    2021-5-6 12:15
  • 签到天数: 2 天

    [LV.1]初来乍到

    3

    主题

    240

    回帖

    865

    积分

    举人

    Rank: 4

    积分
    865

    灌水大神章小蜜蜂章笑傲江湖章

    20
    发表于 2014-7-31 20:23:48 | 只看该作者
    。。。长期学习阵地

    该用户从未签到

    0

    主题

    60

    回帖

    469

    积分

    被盗用户

    积分
    469
    21
    发表于 2014-8-21 08:12:58 | 只看该作者
    文本编辑器:Editpad无论是对正则的支持还是替换的速度已经把EmEditor、Notepad++之流甩开几条街了。

    该用户从未签到

    0

    主题

    195

    回帖

    1557

    积分

    被盗用户

    积分
    1557
    22
    发表于 2015-1-2 00:39:31 | 只看该作者
    其实几个程序员常用的文本编辑器功能都蛮强大的,ue功能最多,复杂,emediter不错,对中日韩字体支持最好
  • TA的每日心情
    开心
    2019-5-18 14:33
  • 签到天数: 12 天

    [LV.3]偶尔看看II

    7

    主题

    720

    回帖

    6824

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    6824

    灌水大神章小蜜蜂章笑傲江湖章

    23
    发表于 2015-10-18 00:11:23 来自手机 | 只看该作者
    meigen 发表于 2014-6-2 17:03
    接14楼,单色图的提取稍微麻烦些,他里面只有数据部分而缺少文件头,这个是比较头疼的事情
    先用ebdump提取 ...

    好文,谢谢。

    该用户从未签到

    2

    主题

    224

    回帖

    1506

    积分

    被盗用户

    积分
    1506

    灌水大神章

    25
    发表于 2016-1-30 21:11:09 | 只看该作者
    不懂,仅以回帖表示赞同