查看: 386|回复: 0
打印 上一主题 下一主题

[词典求助] 联合国3G大的汉英双语语料库怎么用

[复制链接]
  • TA的每日心情
    无聊
    2018-7-16 21:27
  • 签到天数: 1 天

    [LV.1]初来乍到

    40

    主题

    267

    回帖

    5812

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    5812
    跳转到指定楼层
    1
    发表于 2022-1-5 04:25:48 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    Download the UN Parallel Corpus
    我下载了。解压了大约有3G大的。不过不知道怎么打开用。有高手请教下

    XML文件:
    UNv1.0-TEI.zh.tar.gz.00

    Plain-text bitexts
    We also make available plain-text bitexts that span all documents for a specific language pair and can be used more readily with SMT training pipelines. Inside a language-pair specific archive consists of a plain-text file for each language and one file with ids.
    链接

    https://conferences.unite.un.org ... adOverview#download