查看: 1797|回复: 21
打印 上一主题 下一主题

[语言讨论] data mining 条 @牛高双解

[复制链接]

该用户从未签到

2121

主题

2961

回帖

6万

积分

翰林院修撰

不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

Rank: 12Rank: 12Rank: 12

积分
61056

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

跳转到指定楼层
1
发表于 2016-10-10 10:47:09 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

data mining
牛津高階英漢雙解詞典(第八版)光碟
looking at large amounts of information that has been collected on a computer and using it to provide new information 數據採集;數據挖掘


牛津高阶英汉双解词典 第 8 版


该用户从未签到

2121

主题

2961

回帖

6万

积分

翰林院修撰

不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

Rank: 12Rank: 12Rank: 12

积分
61056

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

2
 楼主| 发表于 2016-10-10 10:58:17 | 只看该作者

另外,查 data capture 条也有惊喜。

光盘版:
       
简体纸版:
       
  • TA的每日心情
    开心
    2020-3-25 07:07
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    129

    主题

    2409

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    17783

    灌水大神章小蜜蜂章笑傲江湖章

    3
    发表于 2016-10-10 11:00:09 | 只看该作者
    可能因为英文解释里使用了that has been collected, 所以编译者可能认为再用采集不太合适或准确?
    可能认为mining侧重processing的层面?

    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    4
     楼主| 发表于 2016-10-10 11:21:13 | 只看该作者
    elusty 发表于 2016-10-10 11:00
    可能因为英文解释里使用了that has been collected, 所以编译者可能认为再用采集不太合适或准确?
    可能认 ...


    “数据挖掘”可以说是个术语了,和 data mining 一一对应。 http://baike.baidu.com/view/7893.htm
    数据挖掘(英语:Data mining)


    《牛津·外研社英汉汉英词典》《新世纪英汉大词典》《英汉大词典》(第 2 版)倒是都只给了“数据挖掘”一个义。

    http://www.collinsdictionary.com/dictionary/english/data-mining
    CED 释义:
    the gathering of information from pre-existing data stored in a database, such as one held by a supermarket about customers' shopping habits


    《柯林斯COBUILD高阶英汉双解学习词典》 http://www.iciba.com/data%20mining
    Data mining involves collecting information from data stored in a database, for example in order to find out about people's shopping habits.
    Data mining is used to analyse individuals' buying habits. Data mining is used to analyse individuals' buying habits.
    数据采掘用来分析个体的购买习惯。
    -
    data mining
    n
    【计】数据挖掘(从数据库已有资料中采集信息,如超市以此方式了解消费者的购物习惯):
    Data mining is used to analyse individual's buying habits.  数据挖掘用来分析个人的购物习惯。
    下图为《新世纪英汉大词典》



  • TA的每日心情
    慵懒
    2022-10-27 16:11
  • 签到天数: 326 天

    [LV.8]以坛为家I

    130

    主题

    3638

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    20089

    灌水大神章小蜜蜂章笑傲江湖章

    5
    发表于 2016-10-10 11:29:06 | 只看该作者
    一度以为这些电子版是从繁体直接转换而来,都是台湾、香港的用语习惯,而不是真正符合简中用语习惯的版本。后来发现不对,比如 software 在牛津高阶8中,释义给出了“软件”、“软体”,同时涵盖了简体和繁体的说法,例句中都是“软件”,这说明牛津8的简体电子版还是以简中为主体的,并非单纯从繁体转换。
    看到这个帖子又晕了,不理解电子版和纸质版为什么在有些词上面还是给出的译文不同。data capture 明显应该是翻成 数据采集 更准确,纸质版完胜,电子版不知为何连 数据采集 这个译文都没有。真的搞不懂了,难道电子版和纸质版是不同的编译团队?不知道牛高 8 的 app 里这两个词条的译文是怎样的?
  • TA的每日心情
    慵懒
    2022-10-27 16:11
  • 签到天数: 326 天

    [LV.8]以坛为家I

    130

    主题

    3638

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    20089

    灌水大神章小蜜蜂章笑傲江湖章

    6
    发表于 2016-10-10 11:34:00 | 只看该作者
    elusty 发表于 2016-10-10 11:00
    可能因为英文解释里使用了that has been collected, 所以编译者可能认为再用采集不太合适或准确?
    可能认 ...

    看不懂这个分析是什么逻辑。感觉纸质版像是又经过内地的专家全面审校过的版本。电子版像是港台班底编的,可能也照顾了部分简中的说法,但不全面。
  • TA的每日心情
    慵懒
    2022-10-27 16:11
  • 签到天数: 326 天

    [LV.8]以坛为家I

    130

    主题

    3638

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    20089

    灌水大神章小蜜蜂章笑傲江湖章

    7
    发表于 2016-10-10 11:40:33 | 只看该作者
    Oeasy 发表于 2016-10-10 11:21
    “数据挖掘”可以说是个术语了,和 data mining 一一对应。 http://baike.baidu.com/view/7893.htm

    ...

    确实是术语,纸质版这两条都很准确。翻译中经常遇到,纸质版值得点赞!!
  • TA的每日心情
    开心
    2020-3-25 07:07
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    129

    主题

    2409

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    17783

    灌水大神章小蜜蜂章笑傲江湖章

    8
    发表于 2016-10-10 13:39:41 | 只看该作者
    本帖最后由 elusty 于 2016-10-10 13:41 编辑
    woaini123 发表于 2016-10-10 11:34
    看不懂这个分析是什么逻辑。感觉纸质版像是又经过内地的专家全面审校过的版本。电子版像是港台班底编的, ...


    我的意思是说,采集是初级的,而挖掘,是有一定去伪存真,去粗取精目的和用途的,即将无用的或价值不大的去掉,有的放矢地再次提取,然后用于统计和分析。
    这只是我的怀疑和想法,谈不上分析。另外,从中文层面,我感觉,挖掘和发掘的目的性相对采集较高。
  • TA的每日心情
    慵懒
    2022-10-27 16:11
  • 签到天数: 326 天

    [LV.8]以坛为家I

    130

    主题

    3638

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    20089

    灌水大神章小蜜蜂章笑傲江湖章

    9
    发表于 2016-10-10 13:59:12 | 只看该作者
    elusty 发表于 2016-10-10 13:39
    我的意思是说,采集是初级的,而挖掘,是有一定去伪存真,去粗取精目的和用途的,即将无用的或价值不大 ...

    恩,这样分析也有一定道理。我的理解是,这些属于术语,就尽量沿用规范通用的译法就行了。这些译法之所以固定下来,有些是习惯使然,有些是经过严密推敲,放在各种语境下都不突兀,最终确定来的。如果自己自行发挥,从词义解释去探索其他译法的可能性,换用其他说法,有点浪费精力,结果也未必好。现在很多学习型词典对术语处理的不严谨,喜欢从语文解释性的角度去生成一个非惯用的对应说法,最后给读者带来更多的困惑。
  • TA的每日心情
    开心
    2020-3-25 07:07
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    129

    主题

    2409

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    17783

    灌水大神章小蜜蜂章笑傲江湖章

    10
    发表于 2016-10-10 14:05:58 | 只看该作者
    本帖最后由 elusty 于 2016-10-10 14:38 编辑
    woaini123 发表于 2016-10-10 13:59
    恩,这样分析也有一定道理。我的理解是,这些属于术语,就尽量沿用规范通用的译法就行了。这些译法之所以 ...


    那倒是。不过,许多IT界的术语一个是历史短,一个是不同地区或不同细分领域的人可能有不同的说法,再有IT界的说法有时也不一定准确,所以编译词典时经过推敲和参考更多资料,本着便于更多人理解的目的编译,也并非不可取。
    例如,采矿和建筑中说“牛腿”,可能业内人都知道,但是对于非业内或者学习者,可能就不太明白了,或许多点儿解释,或者家标注也未尝不可。

    ****
    又进一步学习了一下,感谢O版发这个帖子:
    数据挖掘(Data Mining)从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。与之相似的概念称为知识发现。

    Data mining is a process used by companies to turn raw data into useful information. By using software to look for patterns in large batches of data, businesses can learn more about their customers and develop more effective marketing strategies as well as increase sales and decrease costs. Data mining depends on effective data collection and warehousing as well as computer processing.
    个人观点:虽然数据挖掘或数据发现大多用于计算机科学,数据库和算法范畴,但是普通企业应用也应该比较广了,虽然没有多么复杂和高深的算法,可能有些企业只是简单地统计一下百分比或pattern。
    所以,较为权威的英英词典都使用了especially computerized, usually with database. 从普及角度看,英文译文仅翻译成“数据挖掘”对于查询的学习者可能还是不得要领,接着还要去查专业资料。
    从这个角度看,词典解释长一点儿,有时也是不错的。
  • TA的每日心情
    慵懒
    2022-10-27 16:11
  • 签到天数: 326 天

    [LV.8]以坛为家I

    130

    主题

    3638

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    20089

    灌水大神章小蜜蜂章笑傲江湖章

    11
    发表于 2016-10-10 15:08:39 | 只看该作者
    本帖最后由 woaini123 于 2016-10-10 15:10 编辑
    elusty 发表于 2016-10-10 14:05
    那倒是。不过,许多IT界的术语一个是历史短,一个是不同地区或不同细分领域的人可能有不同的说法,再有 ...


    恩,解释归解释,对于专业术语,最好的方式就是有一个或者多个规范通用的译名在前,按现实中的常用度排列,后面加上详细解释。my point is, 专业术语的中文对应词不应该仅从简单的英文解释推演出来,给出一个不太通用、生搬硬套、甚至错误的译文上去。比如O大举的例子,牛津繁体电子版对data mining给出的译文居然是数据采集,明显跟实际的概念不一回事(可能是根据原文的collect推演得来的),虽然有“数据挖掘”,却排在后面,这明显是误导人。

    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    12
     楼主| 发表于 2016-10-10 15:19:07 | 只看该作者
    woaini123 发表于 2016-10-10 11:29
    一度以为这些电子版是从繁体直接转换而来,都是台湾、香港的用语习惯,而不是真正符合简中用语习惯的版本。 ...


    牛高8双解 mdx 是从繁体光盘来的,和简体纸版还是有些区别。
    必应的《权威英汉双解》已经更新为 第 8 版,源自简体,可以一用。
    http://cn.bing.com/dict/search?q=data+capture


  • TA的每日心情
    慵懒
    2022-10-27 16:11
  • 签到天数: 326 天

    [LV.8]以坛为家I

    130

    主题

    3638

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    20089

    灌水大神章小蜜蜂章笑傲江湖章

    13
    发表于 2016-10-10 15:25:59 | 只看该作者
    Oeasy 发表于 2016-10-10 15:19
    牛高8双解 mdx 是从繁体光盘来的,和简体纸版还是有些区别。
    必应的《权威英汉双解》已经更新为 第 8  ...

    牛高 App 是简体版不?牛高 mdx 是从繁体光盘来,那 software 都优先翻成了软件,这怎么解释?这个繁体不是来自港台?
  • TA的每日心情
    开心
    2020-3-25 07:07
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    129

    主题

    2409

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    17783

    灌水大神章小蜜蜂章笑傲江湖章

    14
    发表于 2016-10-10 15:39:41 | 只看该作者
    本帖最后由 elusty 于 2016-10-10 15:53 编辑
    woaini123 发表于 2016-10-10 15:08
    恩,解释归解释,对于专业术语,最好的方式就是有一个或者多个规范通用的译名在前,按现实中的常用度排 ...


    你说的有道理。
    术语的确定,也是一个各方角力和实际应用演变的过程。有时候,学者们确定了术语,但是在一般人使用过程中,可能会出现更通俗更通用的说法,最后原来确定的那个术语反而没有什么人用了。
    绝大多数术语都是需要进一步解释,人们才能大体知道意思的。说数据采集其实也不算多大错误,数据挖掘也是一个数据采集过程,只不过在这个过程中加入了分析、筛选和总结。

    再举个例子,对于普通患者来说,到医院抽血、验血、查血其实都差不多。当然,纯学术的东西是另外一回事,这大概也和词典的规定性和描写性编辑原则类似。
  • TA的每日心情
    慵懒
    2022-10-27 16:11
  • 签到天数: 326 天

    [LV.8]以坛为家I

    130

    主题

    3638

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    20089

    灌水大神章小蜜蜂章笑傲江湖章

    15
    发表于 2016-10-10 15:46:13 | 只看该作者
    elusty 发表于 2016-10-10 15:39
    你说的有道理。
    术语的确定,也是一个各方角力和实际应用演变的过程。有时候,学者们确定了术语,但是在 ...


    恩,但是传达的概念是不准确的,是什么就是什么,不然就造成混乱误导,数据挖掘跟单纯的采集相差很多

    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    16
     楼主| 发表于 2016-10-10 15:47:19 | 只看该作者
    woaini123 发表于 2016-10-10 15:25
    牛高 App 是简体版不?牛高 mdx 是从繁体光盘来,那 software 都优先翻成了软件,这怎么解释?这个繁体不 ...


    app 有简体的也有繁体的。
    cn 牛津高阶英汉双解词典(第8版)  开发商:The Commercial Press (Beijing), Ltd. https://itunes.apple.com/cn/app/ ... g/id1022727104?mt=8
    hk及其他 牛津高階英漢雙解詞典 Oxford Advanced Learner's English-Chinese Dictionary 開發人員 Oxford University Press (China) https://itunes.apple.com/hk/app/ ... 18018?l=zh&mt=8
    -
    光盘版,在台湾用语前面,是有标签的,不过似乎论坛公开分享的所有版本,都没注意到那个标签。





  • TA的每日心情
    慵懒
    2022-10-27 16:11
  • 签到天数: 326 天

    [LV.8]以坛为家I

    130

    主题

    3638

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    20089

    灌水大神章小蜜蜂章笑傲江湖章

    17
    发表于 2016-10-10 15:49:12 | 只看该作者
    Oeasy 发表于 2016-10-10 15:47
    app 有简体的也有繁体的。
    cn 牛津高阶英汉双解词典(第8版)  开发商:The Commercial Press (Beijing) ...

    这个简体版 App 是真正的简体版吗?

    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    18
     楼主| 发表于 2016-10-10 15:54:17 | 只看该作者
    woaini123 发表于 2016-10-10 15:49
    这个简体版 App 是真正的简体版吗?


    这是商务印书馆官网上挂着的 http://www.cp.com.cn/digital/app.html ,这个要是假的,那就没真的了。。。

    http://www.cp.com.cn/Content/2015/06-26/1430462273.html


        本款APP为《牛津高阶英汉双解词典》应用程序的最新版本,收录了纸书第8版内容,同时增加了很多功能与特色。
        购买过本应用程序第7版的用户请购买7版与8版的捆绑包,以便享受折扣优惠价升级到最新版,而不用购买此单独发售的版本。
        未曾购买过7版的新用户,请购买此单独发售的第8版。

        产品特色:

        1. 内容全面、丰富:收录184500单词、短语和释义,英美并重。
        2. 检索方便、快捷:词典查询支持通配符等模糊查询,支持在词目、短语动词、习语和例句中查询。
        3. 发音准确、纯正:词目和例句配有英式和美式读音,发音准确纯正。例句提供在线发音。
        4. 书签、笔记添加灵活:词目和例句点击一次即可添加到书签,多种排列。书签可加入用户笔记,支持分类,导出或删除等。
        5. 显示方式自由、个性:可在英汉双解、英文词典、英汉词典间自由切换,完整模式与简洁模式。
        6. 即时跳转查看:对词典正文中的词目可随时跳转查看。
        7. 考试词汇及内置词汇:商务印书馆特别按照研究生入学考试、四六级英语考试词汇列表,针对性地组合形成考试词语词典。另外,内置词典中的牛津3000核心词、语言学习术语、主题词汇、学科词汇等。
        8. 设备间同步:利用iCloud实现不同设备间的同步。同步内容包括书签、检索记录、设置等所有个性化内容。
        9. 学习卡测试:可对指定词语以卡片形式进行学习测试。
        10. 阅读器功能:用户可复制设备中的网页、文档及其他格式内容里的文字,导入到阅读器中查阅并随时跳查词典。也可选取文字,通过 iOS 系统的“分享”功能直接查词。
        11. 参考信息实用:收录不规则动词、语法说明、常见人名、地名等内容。


  • TA的每日心情
    慵懒
    2022-10-27 16:11
  • 签到天数: 326 天

    [LV.8]以坛为家I

    130

    主题

    3638

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    20089

    灌水大神章小蜜蜂章笑傲江湖章

    19
    发表于 2016-10-10 15:56:34 | 只看该作者
    Oeasy 发表于 2016-10-10 15:54
    这是商务印书馆官网上挂着的 http://www.cp.com.cn/digital/app.html ,这个要是假的,那就没真的了。 ...

    我意思是这个 App 是真正对应纸质版的简体版还是像现有的 MDX 版一样,其实是从繁体转制而来?

    看介绍像是对应简体版纸书的

    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    20
     楼主| 发表于 2016-10-10 16:11:30 | 只看该作者
    woaini123 发表于 2016-10-10 15:56
    我意思是这个 App 是真正对应纸质版的简体版还是像现有的 MDX 版一样,其实是从繁体转制而来?

    看介绍 ...



    如果是繁体简单转换过来的就出版、上架,那商务印书馆总编辑都可以下课了。

    你查查 apparat 条。


    该用户从未签到

    221

    主题

    1015

    回帖

    7129

    积分

    禁止发言

    积分
    7129

    灌水大神章小蜜蜂章笑傲江湖章

    21
    发表于 2016-10-10 19:47:48 | 只看该作者
    这个data mining确实是个非常常用的词,例如我学统计的时候这方面也有data mining,由这个名词我联想到一个在意思上有密切联系的短语动词,sift through,这个词在新闻中用得相当频繁,一抓到啥罪犯或恐怖分子,FBI往往就要sift through罪犯的电脑、社交网络等等。

    该用户从未签到

    95

    主题

    554

    回帖

    2万

    积分

    翰林院编修

    终身学习者

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    24557

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    22
    发表于 2016-10-11 11:00:25 | 只看该作者
    数据挖掘应该是 data mining 我学习的计算机原版书本上基本都是这么写的,数据挖掘应该包括数据处理,建模,结果分析等过程。
    data capture 应该是侧重数据采集,不侧重数据处理。

    https://search.jd.com/Search?keyword=data%20mining