查看: 3372|回复: 20
打印 上一主题 下一主题

[工具] 支持全文检索(包括全文正则匹配),正则查询(模糊查询)的字典软件

[复制链接]
  • TA的每日心情
    擦汗
    前天 07:00
  • 签到天数: 1090 天

    [LV.10]以坛为家III

    124

    主题

    1772

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10477

    灌水大神章小蜜蜂章笑傲江湖章

    跳转到指定楼层
    1
    发表于 2013-11-3 13:12:47 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 spoony1971 于 2013-11-3 13:16 编辑

    我是一个命令行爱好者,使用自已的script查询类stardict词典,已使用多年,支持全文检索(包括全文正则匹配),正则查询(模糊查询),真人语音,合成音等。

    如果有人感兴趣的话,我准备给配上个界面,把他们发布出来( android版本)。

    为提高查询效率,词典格式与现有的略有不同。之前因为格式与mdx不同,不想市面上再多一种格式,所以从来都是自用。
  • TA的每日心情
    擦汗
    前天 07:00
  • 签到天数: 1090 天

    [LV.10]以坛为家III

    124

    主题

    1772

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10477

    灌水大神章小蜜蜂章笑傲江湖章

    推荐
     楼主| 发表于 2013-11-9 19:46:51 | 只看该作者
    本帖最后由 spoony1971 于 2013-11-16 11:46 编辑

    先放出linux 64 bits 命令行版本,android版本mdict已经很强,mdict也已支持全文检索,模糊查询。正则查询需求好像不大,没人用的话不值得做gui的工作。
    http://yunpan.cn/Q9tSjrmiZSEqY

    其中tdict为查询工具,convertdict则将stardict格式转为tdict格式。



    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    2
    发表于 2013-11-3 15:18:20 | 只看该作者
    好东西啊, 不过是我个人对移动版无爱,从来都是在PC上用。
    楼主可以参考:
    1. http://ng-comp.com/fora/android.htm
    2. http://baohaojun.github.io/crossdict-readme-cn.html ; https://github.com/baohaojun/BTAndroidWebViewSelection

    ---
    https://github.com/fxsjy/diaosi {:5_227:}希望是桌面版的。

    该用户从未签到

    258

    主题

    1651

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    19159

    灌水大神章小蜜蜂章笑傲江湖章

    3
    发表于 2013-11-3 22:58:14 来自手机 | 只看该作者
    好东东

    该用户从未签到

    258

    主题

    1651

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    19159

    灌水大神章小蜜蜂章笑傲江湖章

    4
    发表于 2013-11-3 23:44:23 来自手机 | 只看该作者
    强烈期盼安卓版上市。 词库是自己 diy么?
  • TA的每日心情
    擦汗
    前天 07:00
  • 签到天数: 1090 天

    [LV.10]以坛为家III

    124

    主题

    1772

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10477

    灌水大神章小蜜蜂章笑傲江湖章

    5
     楼主| 发表于 2013-11-4 08:32:03 | 只看该作者
    zhu1234 发表于 2013-11-3 23:44
    强烈期盼安卓版上市。 词库是自己 diy么?

    词库可从stardict或mdx转过来,工具已经有了。我现在Linux机器上用的就是转过来的

    该用户从未签到

    13

    主题

    454

    回帖

    3027

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3027

    灌水大神章

    6
    发表于 2013-11-4 15:48:31 | 只看该作者
    本帖最后由 惟吾无为 于 2013-11-4 16:06 编辑

    同为命令行爱好者,但没你爱的深。
    ---
    我对格式很感兴趣,我也有类似的模糊的计划。不过没有具体实施。
    打算参考下你的。有文档或者网址没?
    ---
    --===== 以下仅为构思========
    我的文件格式类似于squashfs之类的文件系统,可以直接挂载浏览,也可以随机读取指定块(也有一个直接采用sqlite的方案)。
    流式的,可以命令行生成词典。可能使用tlv结构体。(要在我那可怜的384Mhz 64M内存的路由器上制作维基。)
    不能写(或者只能在文件结尾追加,或者配个数据库,或者共用全局的配置(保存该词典界面配置,包括书签?)数据库或额外数据(保存对词典的修改或动态生成的页面,也包括书签?或者网络缓存?)数据库)。
    有基本的词条查找能力。
    也有一个lua脚本模仿(甚至直接作为)cgi来处理查询请求,完成扩展功能。
    甚至可加载指定位置的起始脚本。。。
    反正就是实现一个框架,给出必需的功能(如tts,音视频播放,甚至简单的语音和图像识别)。少设限制,来保证可扩展性。给出一些mod(例如上面所说的基本查询和执行查询脚本),方便词典的开发。
    理论上,可以实现同时词典、小说阅读器、文档阅读器甚至浏览器。
    ---
  • TA的每日心情
    擦汗
    前天 07:00
  • 签到天数: 1090 天

    [LV.10]以坛为家III

    124

    主题

    1772

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10477

    灌水大神章小蜜蜂章笑傲江湖章

    7
     楼主| 发表于 2013-11-4 17:10:01 | 只看该作者
    本帖最后由 spoony1971 于 2013-11-4 17:17 编辑
    惟吾无为 发表于 2013-11-4 15:48
    同为命令行爱好者,但没你爱的深。
    ---
    我对格式很感兴趣,我也有类似的模糊的计划。不过没有具体实施。
    ...


    我也有文件系统的设想,现在的btrfs使用的是B+-tree查询,词库格式转变为压缩btrfs虚拟文件系统的话查询效率很高,linux又原生支持btrfs,不用编程,一个绝佳的字典软件就诞生了。

    该用户从未签到

    258

    主题

    1651

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    19159

    灌水大神章小蜜蜂章笑傲江湖章

    8
    发表于 2013-11-4 19:51:20 | 只看该作者
    继续期盼……

    该用户从未签到

    13

    主题

    75

    回帖

    2491

    积分

    解元

    Rank: 5Rank: 5

    积分
    2491

    灌水大神章小蜜蜂章笑傲江湖章

    9
    发表于 2013-11-4 20:22:01 | 只看该作者
    這個支持
    不過希望能有iOS版本的

    该用户从未签到

    13

    主题

    454

    回帖

    3027

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3027

    灌水大神章

    10
    发表于 2013-11-4 20:32:06 | 只看该作者
    spoony1971 发表于 2013-11-4 17:10
    我也有文件系统的设想,现在的btrfs使用的是B+-tree查询,词库格式转变为压缩btrfs虚拟文件系统的话查询 ...

    你的词典格式还没说呢?
  • TA的每日心情
    擦汗
    前天 07:00
  • 签到天数: 1090 天

    [LV.10]以坛为家III

    124

    主题

    1772

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10477

    灌水大神章小蜜蜂章笑傲江湖章

    11
     楼主| 发表于 2013-11-4 23:04:46 | 只看该作者
    惟吾无为 发表于 2013-11-4 20:32
    你的词典格式还没说呢?

    还没有文档,但与stardict相似

    该用户从未签到

    11

    主题

    125

    回帖

    822

    积分

    举人

    Rank: 4

    积分
    822

    灌水大神章小蜜蜂章笑傲江湖章

    12
    发表于 2013-11-5 00:22:55 | 只看该作者
    期待大神们^_^,等我放假了也好好学学

    该用户从未签到

    12

    主题

    407

    回帖

    1万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    11211

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    13
    发表于 2013-11-9 00:11:37 | 只看该作者
    楼上的都是大神,给我做的话我就只会sqlite{:5_227:}

    该用户从未签到

    2

    主题

    16

    回帖

    76

    积分

    被盗用户

    积分
    76
    14
    发表于 2013-11-9 09:06:21 | 只看该作者
    支持楼主,希望早日发出

    该用户从未签到

    258

    主题

    1651

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    19159

    灌水大神章小蜜蜂章笑傲江湖章

    15
    发表于 2013-11-9 12:12:05 | 只看该作者
    不知道进度如何了?

    该用户从未签到

    11

    主题

    125

    回帖

    822

    积分

    举人

    Rank: 4

    积分
    822

    灌水大神章小蜜蜂章笑傲江湖章

    17
    发表于 2013-11-10 11:04:40 | 只看该作者
    很不错,果断收下了,谢谢

    该用户从未签到

    13

    主题

    454

    回帖

    3027

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3027

    灌水大神章

    18
    发表于 2013-11-14 16:26:07 | 只看该作者
    spoony1971 发表于 2013-11-9 19:46
    先放出linux 64 bits 命令行版本,android版本mdict已经很强,mdict也已支持全文检索,模糊查询。正则查询需 ...

    把那些scripts打个包吧。方便的话,给下tdict的源码或文档,学习下。
    过几周就能发布维基解析器了,正好有时间看。
    ------
    你的词典有考虑过集成lua脚本吗?这样灵活些。可移植性也不错。
  • TA的每日心情
    擦汗
    前天 07:00
  • 签到天数: 1090 天

    [LV.10]以坛为家III

    124

    主题

    1772

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    10477

    灌水大神章小蜜蜂章笑傲江湖章

    19
     楼主| 发表于 2013-11-16 12:00:34 | 只看该作者
    目前script还很凌乱,和很多开发环境混合在一起,需要不少简化。先发一部分:
    html 字典:
    tdict $dictionary "$word"|w3m -dump -T text/html
    markdown 字典:
    tdict ~/dict/$1 "$2" |markdown |w3m -T text/html
    集成vim (可进一步集成各种语音等,multiple vim plugins):
    tdict $dictionary "$word"|w3m -dump -T text/html|vim "+file $word" -
    集成语音:
    twav "$word" & tdict $dictionary "$word"|w3m -dump -T text/html|vim "+file $word" -

    该用户从未签到

    13

    主题

    454

    回帖

    3027

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3027

    灌水大神章

    20
    发表于 2013-11-16 14:56:14 | 只看该作者
    spoony1971 发表于 2013-11-16 12:00
    目前script还很凌乱,和很多开发环境混合在一起,需要不少简化。先发一部分:
    html 字典:
    tdict $dictio ...

    麻烦的话就算了。我能理解。

    该用户从未签到

    14

    主题

    209

    回帖

    -1万

    积分

    禁止发言

    积分
    -10022
    21
    发表于 2014-4-1 09:01:50 | 只看该作者
    thank you very much