查看: 5174|回复: 33
打印 上一主题 下一主题

[英汉汉英] 冇道双语例句

[复制链接]
  • TA的每日心情
    擦汗
    2018-11-19 07:53
  • 签到天数: 2 天

    [LV.1]初来乍到

    3

    主题

    59

    回帖

    743

    积分

    举人

    Rank: 4

    积分
    743
    跳转到指定楼层
    1
    发表于 2017-2-23 13:54:35 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 暗潮涌 于 2017-2-23 20:35 编辑

    冇道双语例句,抓取与有道官网,用wordnet词头撞得,抓下来源文件近7个G,发现MdxBuilder大文件版也转不出来,加上电脑烂的原因,故删除所有标签,只保留纯文本

    欢迎有精力的人能进行排版,源文件待会发

    头回制作,多多关照

    纯文本:链接: https://pan.baidu.com/s/1bpmXWbP 密码: nv18















    源文件:链接: https://pan.baidu.com/s/1slbajff 密码: ve58

    评分

    3

    查看全部评分

    本帖被以下淘专辑推荐:

  • TA的每日心情
    开心
    2023-1-18 23:24
  • 签到天数: 211 天

    [LV.7]常住居民III

    427

    主题

    4539

    回帖

    9万

    积分

    超级版主

    Rank: 12Rank: 12Rank: 12

    积分
    92011

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章城管大队长

    推荐
    发表于 2017-2-23 15:05:32 | 只看该作者
    本帖最后由 kyletruman 于 2017-2-23 18:47 编辑

    被高亮的关键词颜色值
    1.     color: #638c0b;
    复制代码
    中文例句颜色可以设成
    1. #777;
    复制代码


    另外,楼主的级别是彩色蜥蜴,也就是可以设置阅读权限来避免外部搜索引擎搜到帖子下面的回复
  • TA的每日心情
    开心
    昨天 00:57
  • 签到天数: 1832 天

    [LV.Master]伴坛终老

    5

    主题

    2259

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    28203

    笑傲江湖章灌水大神章

    推荐
    发表于 2017-2-24 00:16:54 | 只看该作者
    感谢分享。说一下目前看到的情况:
    1. 每条例句的来源没有被保留,太可惜了
    2. 因标签的删除,使原本每个单词在例句里会被加粗体都被删除了
    3. 后面的例句有些都会被重复数次
    4. 解开mdx后发现<br>后竟接</>,估计可删除
    5. 解开mdx后发现有重复的</>接着</>
    6. 有些词条里有乱码
    7. 词条没排序
  • TA的每日心情
    开心
    2023-1-18 23:24
  • 签到天数: 211 天

    [LV.7]常住居民III

    427

    主题

    4539

    回帖

    9万

    积分

    超级版主

    Rank: 12Rank: 12Rank: 12

    积分
    92011

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章城管大队长

    推荐
    发表于 2017-2-24 00:22:26 | 只看该作者
    freecomic101 发表于 2017-2-24 00:16
    感谢分享。说一下目前看到的情况:
    1. 每条例句的来源没有被保留,太可惜了
    2. 因标签的删除,使原本每个 ...

    标签基本上删完了,只留下换行符<br>,没有办法调用CSS排版。如果要删标签,至少应该保留英文例句标签、高亮英语关键词标签、中文翻译标签、联网发音喇叭标签
  • TA的每日心情
    奋斗
    昨天 09:58
  • 签到天数: 1625 天

    [LV.Master]伴坛终老

    73

    主题

    4466

    回帖

    6万

    积分

    翰林院孔目

    Rank: 10Rank: 10Rank: 10

    积分
    60593

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

    2
    发表于 2017-2-23 14:24:20 | 只看该作者
    谢谢暗潮涌分享!!!

    该用户从未签到

    16

    主题

    1074

    回帖

    3万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    31794

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    3
    发表于 2017-2-23 15:03:24 | 只看该作者
    感谢楼主制作分享!下载使用了。

    该用户从未签到

    5

    主题

    472

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    12265

    灌水大神章

    5
    发表于 2017-2-23 15:26:01 | 只看该作者
    十分感谢。例句很好。
  • TA的每日心情
    擦汗
    2018-11-19 07:53
  • 签到天数: 2 天

    [LV.1]初来乍到

    3

    主题

    59

    回帖

    743

    积分

    举人

    Rank: 4

    积分
    743
    6
     楼主| 发表于 2017-2-23 16:59:04 | 只看该作者
    kyletruman 发表于 2017-2-23 15:05
    被高亮的关键词颜色值

    另外,楼主的级别是彩色蜥蜴,也就是可以设置阅读权限来避免外部搜索引擎搜到帖子 ...

    刚才看了一下好像权限不够 不能用hide代码。

    点评

    不需要用hide代码,设置阅读权限就行了  发表于 2017-2-23 17:00
  • TA的每日心情
    擦汗
    2018-11-19 07:53
  • 签到天数: 2 天

    [LV.1]初来乍到

    3

    主题

    59

    回帖

    743

    积分

    举人

    Rank: 4

    积分
    743
    7
     楼主| 发表于 2017-2-23 17:07:57 | 只看该作者
    kyletruman 发表于 2017-2-23 15:05
    被高亮的关键词颜色值

    另外,楼主的级别是彩色蜥蜴,也就是可以设置阅读权限来避免外部搜索引擎搜到帖子 ...

    额 没找到。。第一次发,能教一下吗?

    点评

    重新编辑帖子,最下面应该有阅读权限的选项卡,以前有,现在应该有  发表于 2017-2-23 18:13
  • TA的每日心情
    郁闷
    2018-5-17 09:15
  • 签到天数: 1 天

    [LV.1]初来乍到

    56

    主题

    490

    回帖

    1万

    积分

    分区版主

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    12730

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    8
    发表于 2017-2-23 17:30:13 | 只看该作者
    请把源文件拆分成500多MB一个档案这样处理反倒快点。等你的源文件。
  • TA的每日心情
    擦汗
    2018-11-19 07:53
  • 签到天数: 2 天

    [LV.1]初来乍到

    3

    主题

    59

    回帖

    743

    积分

    举人

    Rank: 4

    积分
    743
    9
     楼主| 发表于 2017-2-23 17:37:32 | 只看该作者
    y8888 发表于 2017-2-23 17:30
    请把源文件拆分成500多MB一个档案这样处理反倒快点。等你的源文件。

    恩 估计还要三个小时。。。 你知道那个阅读权限在哪里设置吗?找不到。。。
  • TA的每日心情
    开心
    昨天 19:36
  • 签到天数: 624 天

    [LV.9]以坛为家II

    539

    主题

    1981

    回帖

    5万

    积分

    超级版主

    Rank: 12Rank: 12Rank: 12

    积分
    53357

    翰林院专用章推广专家灌水大神章笑傲江湖章小蜜蜂章管理组专用章QQ 章

    10
    发表于 2017-2-23 22:33:27 | 只看该作者
    7g的压缩包?不会吧。。。。你压缩了吗?7z压缩格式压缩文本压缩率很高的。
  • TA的每日心情
    开心
    昨天 00:57
  • 签到天数: 1832 天

    [LV.Master]伴坛终老

    5

    主题

    2259

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    28203

    笑傲江湖章灌水大神章

    13
    发表于 2017-2-24 00:29:02 | 只看该作者
    kyletruman 发表于 2017-2-24 00:22
    标签基本上删完了,只留下换行符,没有办法调用CSS排版。如果要删标签,至少应该保留英文例句标签、高亮 ...

    利用正则硬要排出中英文的CSS也是可以,只差单词高显没办法了。
    不过我看到重复例句问题,显然抓词时就有问题,於是就懒得动手了,免得浪费时间。
  • TA的每日心情

    2019-12-16 20:24
  • 签到天数: 2 天

    [LV.1]初来乍到

    0

    主题

    5

    回帖

    122

    积分

    童生

    Rank: 2

    积分
    122
    15
    发表于 2017-2-24 08:26:30 | 只看该作者
    有了这个例句库,就可以把在线查询给关了

    该用户从未签到

    2

    主题

    39

    回帖

    115

    积分

    童生

    Rank: 2

    积分
    115
    16
    发表于 2017-2-24 08:53:48 | 只看该作者
    感谢楼主分享。
    发现resource最后两个例句是重复的。
    另外,发现有些常见短语查不到,如in view of
    再次感谢楼主分享。
  • TA的每日心情
    擦汗
    2018-11-19 07:53
  • 签到天数: 2 天

    [LV.1]初来乍到

    3

    主题

    59

    回帖

    743

    积分

    举人

    Rank: 4

    积分
    743
    17
     楼主| 发表于 2017-2-24 18:26:35 | 只看该作者
    freecomic101 发表于 2017-2-24 00:16
    感谢分享。说一下目前看到的情况:
    1. 每条例句的来源没有被保留,太可惜了
    2. 因标签的删除,使原本每个 ...

    关于重复
    抓取与有道,有道本身有重复例句,例如"resource" www.youdao.com/example/blng/eng/ ... =dict.main.moreblng,可以自行用EmEditor去重
  • TA的每日心情
    开心
    昨天 00:57
  • 签到天数: 1832 天

    [LV.Master]伴坛终老

    5

    主题

    2259

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    28203

    笑傲江湖章灌水大神章

    18
    发表于 2017-2-24 18:44:24 | 只看该作者
    暗潮涌 发表于 2017-2-24 18:26
    关于重复
    抓取与有道,有道本身有重复例句,例如"resource" www.youdao.com/example/blng/eng/resource/ ...

    原来如此,我误解了,感谢楼主告知
  • TA的每日心情
    慵懒
    2022-1-27 16:35
  • 签到天数: 260 天

    [LV.8]以坛为家I

    8

    主题

    547

    回帖

    3026

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3026
    19
    发表于 2017-3-8 00:29:09 | 只看该作者
    真是个大工程啊

    该用户从未签到

    34

    主题

    202

    回帖

    832

    积分

    禁止发言

    积分
    832
    20
    发表于 2017-3-23 17:27:33 | 只看该作者
    我也一直有这个想法,如果能把朗文双解的例句也给抓出来就更好了
  • TA的每日心情
    开心
    2018-4-2 14:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    0

    主题

    375

    回帖

    1209

    积分

    解元

    Rank: 5Rank: 5

    积分
    1209

    灌水大神章

    21
    发表于 2017-3-24 13:55:41 | 只看该作者
    感谢慷慨的分享

    该用户从未签到

    14

    主题

    281

    回帖

    4490

    积分

    贡士

    Rank: 6Rank: 6

    积分
    4490

    灌水大神章小蜜蜂章笑傲江湖章

    22
    发表于 2017-3-28 11:07:00 | 只看该作者
    没有了啊,谁能再发一下么?

    该用户从未签到

    0

    主题

    284

    回帖

    500

    积分

    禁止发言

    积分
    500
    23
    发表于 2017-3-28 14:36:48 | 只看该作者

    thx for sharing.
  • TA的每日心情

    2020-10-22 07:38
  • 签到天数: 78 天

    [LV.6]常住居民II

    0

    主题

    87

    回帖

    936

    积分

    举人

    Rank: 4

    积分
    936
    24
    发表于 2017-6-25 22:20:27 | 只看该作者
    感谢分享,求再次分享!
  • TA的每日心情
    开心
    2018-10-5 09:01
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    1

    主题

    49

    回帖

    339

    积分

    秀才

    Rank: 3Rank: 3

    积分
    339
    25
    发表于 2017-7-4 15:58:16 | 只看该作者
    分享的文件链接没有了,请楼主重发。谢谢