查看: 628|回复: 7
打印 上一主题 下一主题

[讨论] 想把《新編英和活用大辞典》的词条顺序号给修复了

[复制链接]
  • TA的每日心情
    奋斗
    2018-7-12 01:46
  • 签到天数: 109 天

    [LV.6]常住居民II

    9

    主题

    146

    回帖

    6728

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    6728
    跳转到指定楼层
    1
    发表于 2018-6-19 19:09:19 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 jiaoyidongxi 于 2018-6-19 19:21 编辑

    《研究社新編英和活用大辞典》应该是论坛上已知最好的版本,句型高亮,js 折叠效果等。是从 EPWING 上转换而来,但转换后的排版词条里不同释义的顺序号乱了,而且乱的非常规律,2 - 3 - 1 这样。导出文本看了下,顺序号全都在首行开头,而尾行部分也很规律,可以连成以顺序号为开头的单行,最后用正则重新排序。当然,以上全都是脑洞,还是想手把手求教。


    源文本,
  • TA的每日心情

    2018-6-16 18:13
  • 签到天数: 158 天

    [LV.7]常住居民III

    22

    主题

    255

    回帖

    6055

    积分

    禁止发言

    积分
    6055

    灌水大神章

    2
    发表于 2018-6-19 19:34:20 | 只看该作者
    论坛上会做词典的都不再出手了,尤其是教程 对于没有学过计算机来说,比较吃力
    真的希望各位版主,写点大致的步骤,主攻那些章节
  • TA的每日心情
    慵懒
    2018-11-26 11:30
  • 签到天数: 130 天

    [LV.7]常住居民III

    2

    主题

    214

    回帖

    2056

    积分

    禁止发言

    积分
    2056
    3
    发表于 2018-6-19 19:59:01 | 只看该作者
    本帖最后由 cixiplc66 于 2018-6-19 20:29 编辑

    要编程吧,只依靠编辑器里的正则估计难实现
    把1部分往前提,或者2以后往后移动
    好像只有一部分并非全部是顺序颠倒

    评分

    1

    查看全部评分

  • TA的每日心情
    慵懒
    2018-11-26 11:30
  • 签到天数: 130 天

    [LV.7]常住居民III

    2

    主题

    214

    回帖

    2056

    积分

    禁止发言

    积分
    2056
    4
    发表于 2018-6-19 20:55:17 | 只看该作者
    本帖最后由 cixiplc66 于 2018-6-19 21:05 编辑

    像sick 也有3个相同词头,但是标记为2,1和无标记
    这本词典源文件还是有点乱
    才发现词头可以重复吗,对于重复词头 词典都怎么处理的呢

    123分部内容单独为相同的词头,牵扯到词头排序 老复杂了
  • TA的每日心情
    奋斗
    2022-6-1 19:02
  • 签到天数: 377 天

    [LV.9]以坛为家II

    27

    主题

    556

    回帖

    15万

    积分

    状元

    喜欢折腾,但能力有限

    Rank: 9Rank: 9Rank: 9

    积分
    150901

    灌水大神章笑傲江湖章管理组专用章

    5
    发表于 2018-6-20 11:10:48 | 只看该作者
    改了下js,来处理这个情况,不过我只是简单的测试了一下,可能还有其他情况没考虑。
    而且目前的情况是,同一词条不同词义是分开的单独词条,像mdict这种分开显示的应该就没用。
    最好处理源文件把词条合并了,那样改动源文件的序号也比较简单了,应该可以通过正则来改了。

    kcollo.rar

    624 Bytes, 下载次数: 11, 下载积分: 米 -5 粒

    评分

    1

    查看全部评分

  • TA的每日心情
    奋斗
    2018-7-12 01:46
  • 签到天数: 109 天

    [LV.6]常住居民II

    9

    主题

    146

    回帖

    6728

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    6728
    6
     楼主| 发表于 2018-6-20 19:57:55 | 只看该作者
    simonfire 发表于 2018-6-20 11:10
    改了下js,来处理这个情况,不过我只是简单的测试了一下,可能还有其他情况没考虑。
    而且目前的情况是,同 ...

    这个 js 是把 sup 序列号变正序了,但释义排序本身没动;嘛,是个「好方法」,对强迫党来说是个好的欺骗手段 :^)))
    看到各位都很热情的出谋划策,外加这 js ,反倒觉得无所谓了,反正只是内容排序颠倒,内容本身并不影响。
    关于词条分开部分对我个人来说没事,纯 GD 党。
    确实,sup 顺序号并不是全部颠倒,粗糙地说,sup 号总计 3K 多,至少大半是倒的。
    顺便一并感谢楼上/里外诸位。
  • TA的每日心情
    奋斗
    2018-7-12 01:46
  • 签到天数: 109 天

    [LV.6]常住居民II

    9

    主题

    146

    回帖

    6728

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    6728
    7
     楼主| 发表于 2018-6-20 20:18:26 | 只看该作者
    本帖最后由 jiaoyidongxi 于 2018-6-20 20:20 编辑
    simonfire 发表于 2018-6-20 11:10
    改了下js,来处理这个情况,不过我只是简单的测试了一下,可能还有其他情况没考虑。
    而且目前的情况是,同 ...


    说到 js,我还有个求教,就不开新帖了,待会重新编辑一下主楼的贴。
    CACD 也是部好词典,是剑桥早期风格词典,即一个单词以不同变形词排一起作释义,所以这本词典排版不知是本来就这样,还是原制作者的转换改动所致,加了一堆 @@@link,这在 GD 上显示就出现了查一个词由于变形词的缘故,导致重复显示。这里随便举 2 个词作例子,如 duplicate, mimic。我试过在原文本上插入 js 外链,然后从 stackoverflow 上看来的 js 去重代码,以及你对 bing 双解词典去重的代码依葫芦画瓢把 class 换掉照搬上去都无效,所以还是求教下。
  • TA的每日心情

    2019-2-16 21:57
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    19

    主题

    500

    回帖

    6373

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    6373
    8
    发表于 2019-7-16 10:57:28 | 只看该作者
    我已经修好了,有空传上来