查看: 1103|回复: 7
打印 上一主题 下一主题

[求助] The Little Dict 无法用MDX Server对外输出吗?

[复制链接]
  • TA的每日心情
    无聊
    2019-12-16 23:45
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    3

    主题

    75

    回帖

    218

    积分

    童生

    Rank: 2

    积分
    218
    跳转到指定楼层
    1
    发表于 2019-12-6 15:15:11 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 orjendjem 于 2019-12-6 15:20 编辑

    可能有些人知道有个Python程序叫MDX Server,它可以将MDX词典对外输出。
    MDX Server

    我有个想法就是从The Little Dict导出来一些我需要的东西,如单词解释、音标等。
    [英汉] [2019.3.13]多功能百宝箱词典 - The little dict

    假如说你有个牛津在线词典的爬虫,并有它的MDX词库的话,你只要把爬虫里的网站地址改为 http://localhost:8000 就行了。我已测试过爬虫能正常运行,还能从我的离线服务器爬取到东西了,Server程序和爬虫两个并行运作毫无问题。左右备好了工具,自己离线整理资料时再也不用担心被官方网站被拦截、封IP了。

    问题是,在MDX Server别的MDX词典都能正常导入,等几秒就可以。但是偏偏就是The Little Dict就不肯进门。

    这下我发愁了,我试过重新下载TLD词库,照样不行。

    各位大哥有时间可以试一下吗?看看能不能把TLD导入到MDX Server。若不行的话请给个意见这个怎么解决。

    谢谢!!
  • TA的每日心情
    慵懒
    2020-4-10 13:19
  • 签到天数: 269 天

    [LV.8]以坛为家I

    16

    主题

    897

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    13141

    QQ 章

    2
    发表于 2019-12-6 15:37:13 | 只看该作者
    不懂什么情况,我将the little dict用在Anki上也显示不全,而且有时干脆显示不出来,希望大神能解答一下
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    73

    主题

    1552

    回帖

    9万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    96973

    QQ 章笑傲江湖章灌水大神章推广专家

    3
    发表于 2019-12-6 16:15:54 | 只看该作者
    估计可能的原因:The Little Dict 使用了比较多的javascript,词条也多,对电脑性能要求比较高。我之前在虚拟机中使用,就一直索引了半天也无法打开,只能放弃。
  • TA的每日心情
    无聊
    2019-12-16 23:45
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    3

    主题

    75

    回帖

    218

    积分

    童生

    Rank: 2

    积分
    218
    4
     楼主| 发表于 2019-12-6 16:18:38 | 只看该作者
    我爱深蓝 发表于 2019-12-6 15:37
    不懂什么情况,我将the little dict用在Anki上也显示不全,而且有时干脆显示不出来,希望大神能解答一下 ...

    原来anki也不行啊
  • TA的每日心情
    无聊
    2019-12-16 23:45
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    3

    主题

    75

    回帖

    218

    积分

    童生

    Rank: 2

    积分
    218
    5
     楼主| 发表于 2019-12-6 16:21:12 | 只看该作者
    VimVim 发表于 2019-12-6 16:15
    估计可能的原因:The Little Dict 使用了比较多的javascript,词条也多,对电脑性能要求比较高。我之前在虚 ...

    嗯,说的也是呢。昨天试了解压它的mdx,小小150mb左右的mdx源文件居然变成了个1.5GB左右的大胖子txt了。看来没有高档机子就搞不定TLD了。
  • TA的每日心情
    奋斗
    2022-6-1 19:02
  • 签到天数: 377 天

    [LV.9]以坛为家II

    27

    主题

    556

    回帖

    15万

    积分

    状元

    喜欢折腾,但能力有限

    Rank: 9Rank: 9Rank: 9

    积分
    150901

    灌水大神章笑傲江湖章管理组专用章

    6
    发表于 2019-12-6 17:20:20 | 只看该作者
    控制台打印调试呀,一步一步找出错误的地方
  • TA的每日心情
    擦汗
    2020-6-6 16:10
  • 签到天数: 164 天

    [LV.7]常住居民III

    12

    主题

    709

    回帖

    4591

    积分

    贡士

    Rank: 6Rank: 6

    积分
    4591
    7
    发表于 2020-2-11 12:59:13 | 只看该作者
    楼主很有想法阿。MDXserver可以细分导出吗? 那可是太好了。
    我能想到的方法就是把词典数据导入mysql,然后用tomcat连接运行服务
  • TA的每日心情
    奋斗
    2020-5-22 08:16
  • 签到天数: 47 天

    [LV.5]常住居民I

    3

    主题

    192

    回帖

    9785

    积分

    进士

    Rank: 8Rank: 8

    积分
    9785

    QQ 章笑傲江湖章灌水大神章

    8
    发表于 2021-12-29 04:32:58 | 只看该作者
    我观察了一下,原因在于词典加载的js代码里面调用了一个『ini』配置文件,但MDX Server并不读取这个文件,而TLD词典的js是这样判断的:若读不到,就隐藏,结果所有内容都隐藏了……

    解决方法:
    ①首先把ini文件放在MDX Server的mdx子文件夹
    ②修改mdx_server.py
    大概在第42行加点内容:
    1. content_type_map = {
    2.     'html': 'text/html; charset=utf-8',
    3.     'js': 'application/x-javascript',
    4.     'ico': 'image/x-icon',
    5.     'css': 'text/css',
    6.     'jpg': 'image/jpeg',
    7.     'png': 'image/png',
    8.     'gif': 'image/gif',
    9.     'mp3': 'audio/mpeg',
    10.     'mp4': 'audio/mp4',
    11.     'wav': 'audio/wav',
    12.     'spx': 'audio/ogg',
    13.     'ogg': 'audio/ogg',
    14.     'eot': 'font/opentype',
    15.     'svg': 'text/xml',
    16.     'ini': 'text/ini', #代码的第42行 我所加的部分
    17.     'ttf': 'application/x-font-ttf',
    18.     'woff': 'application/x-font-woff',
    19.     'woff2': 'application/font-woff2',
    20. }
    复制代码

    ③完事