查看: 1416|回复: 13
打印 上一主题 下一主题

[学习讨论] 很多词典中的histogram释义是错的

[复制链接]
  • TA的每日心情
    慵懒
    2023-2-2 22:17
  • 签到天数: 931 天

    [LV.10]以坛为家III

    9

    主题

    1109

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11434

    灌水大神章笑傲江湖章推广专家

    跳转到指定楼层
    1
    发表于 2019-4-11 19:05:16 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 逆风的香 于 2019-4-12 10:47 编辑

    这并不是一个吸睛的标题。

    确实是有多部词典把histogram和bar chart弄混了,两个其实不同种类的图表。histogram是直方图,用来描述非离散变量(non-discrete variable)的分布情况,数据类型多为等比、等距的(如年龄、分数段);而bar chart是柱状图,用来描述的分类变量(categorical variable)的分布情况,数据类型多为称名(nominal)和顺序(ordinal)性质,如性别、国籍、名次等。最直观的区别是,直方图中长度不一的纵向条之间没有间隙,而柱状图的纵向条之间是有间隙的。(请看下图)

    然而,很多原文词典里直接将histogram解释为等同于bar chart,如
    Longman5
    Histogram:A bar chart
    Oxford Advanced Learner's E-C dictionary

    Histogram: bar chart
    Cambridge4

    Histogram: a bar chart

    有些原文词典解释不够精确,无法作出区分,如:
    Chambers13

    A statistical graph in which frequency distribution is shown by means of rectangles

    有些原文解释够精确,但中文翻译弄混了,如:
    牛高8

    a diagram which uses rectangles (= bars) of different heights (and sometimes different widths) to show different amounts, so that they can be compared 条形图,柱形图(以不同长度的粗线条表示不同数量以作比较)
    ➔ compare bar chart

    目前我手头的词典,只有新牛津、牛高8原文部分、麦克米伦原文词典、Merriam-Webster和OED2的解释比较好。列举部分:
    Merriam-Webster

    a representation of a frequency distribution by means of rectangles whose widths represent class intervals and whose areas are proportional to the corresponding frequencies
    新牛津

    <Statistics> a diagram consisting of rectangles whose area is proportional to the frequency of a variable and whose width is equal to the class interval.〔统计〕矩形图,直方图。

    最后给出一张从Key differences网站上复制了一个对比表格,可以更清晰地看出二者的区别:
    Basis for Comparison Histogram Bar graph
    MeaningHistogram refers to a graphical representation, that displays data by way of bars to show the frequency of numerical data.Bar graph is a pictorial representation of data that uses bars to compare different categories of data.
    IndicatesDistribution of non-discrete variablesComparison of discrete variables
    PresentsQuantitative dataCategorical data
    SpacesBars touch each other, hence there are no spaces between barsBars do not touch each other, hence there are spaces between bars.
    ElementsElements are grouped together, so that they are considered as ranges.Elements are taken as individual entities.
    Can bars be reordered?NoYes
    Width of barsNeed not to be sameSame
    (表格来源:Key differences)


    bar-graph-vs-histogram.jpg (32.85 KB, 下载次数: 0)

    bar-graph-vs-histogram.jpg

    评分

    2

    查看全部评分

    本帖被以下淘专辑推荐:

    • · 语法|主题: 67, 订阅: 14

    该用户从未签到

    129

    主题

    517

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    13035

    灌水大神章小蜜蜂章笑傲江湖章

    推荐
    发表于 2019-4-14 04:28:12 | 只看该作者
    逆风的香 发表于 2019-4-14 02:31
    日常生活中对话和统计学的概念不能糅合在一起,我们平时确实会讲我比他大几个月,但你会在图表中(直方图 ...

    你可能沒見過有以 2000.1, 2000.2 分別代表 2000 1月, 2000 2月的圖表...
  • TA的每日心情
    慵懒
    2023-2-2 22:17
  • 签到天数: 931 天

    [LV.10]以坛为家III

    9

    主题

    1109

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11434

    灌水大神章笑傲江湖章推广专家

    推荐
     楼主| 发表于 2019-4-14 02:31:47 | 只看该作者
    ucccafe 发表于 2019-4-13 13:07
    年龄数据则是非离散的?
    說對了一半,有時我們會說誰比誰年長幾個月。

    日常生活中对话和统计学的概念不能糅合在一起,我们平时确实会讲我比他大几个月,但你会在图表中(直方图)中看到1-10.5岁,10.5-21.18岁,21.18-33.333333333...岁的年龄组吗?
  • TA的每日心情
    慵懒
    2 小时前
  • 签到天数: 1593 天

    [LV.Master]伴坛终老

    2

    主题

    1733

    回帖

    16万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    168862
    推荐
    发表于 2019-4-11 20:57:09 | 只看该作者
    分析的很到位,双解词典翻译的不严谨,我们已经见怪不怪了,Learner 类的词典原文似乎也为了“照顾”学习者而“简化”了你的思考,适得其反,徒增混淆
  • TA的每日心情
    擦汗
    2021-3-1 09:31
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    4

    主题

    199

    回帖

    1184

    积分

    解元

    Rank: 5Rank: 5

    积分
    1184
    2
    发表于 2019-4-11 20:21:35 | 只看该作者
    楼主是数学分析专业的?

    该用户从未签到

    23

    主题

    553

    回帖

    4546

    积分

    贡士

    Rank: 6Rank: 6

    积分
    4546
    4
    发表于 2019-4-12 00:18:43 | 只看该作者
    美传的原文译文都是对的
  • TA的每日心情
    慵懒
    2023-2-2 22:17
  • 签到天数: 931 天

    [LV.10]以坛为家III

    9

    主题

    1109

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11434

    灌水大神章笑傲江湖章推广专家

    5
     楼主| 发表于 2019-4-12 01:00:11 | 只看该作者
    wpa 发表于 2019-4-11 13:21
    楼主是数学分析专业的?

    我是学语言学的。。。可能会有些诧异,但是语言学里也会涉及到统计学知识
  • TA的每日心情
    奋斗
    2021-10-7 11:11
  • 签到天数: 129 天

    [LV.7]常住居民III

    3

    主题

    233

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11098

    笑傲江湖章灌水大神章QQ 章

    6
    发表于 2019-4-12 05:48:46 | 只看该作者
    感谢分享,之前一直都没有注意到这个方面
  • TA的每日心情

    2019-9-19 16:59
  • 签到天数: 118 天

    [LV.6]常住居民II

    5

    主题

    199

    回帖

    5926

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    5926
    7
    发表于 2019-4-12 08:33:23 | 只看该作者
    没看太明白,按照我的理解,是不是bar chart用于不具备连续性的数据,而Histogram用于连续性数据?
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    73

    主题

    1552

    回帖

    9万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    96973

    QQ 章笑傲江湖章灌水大神章推广专家

    8
    发表于 2019-4-12 09:55:34 | 只看该作者
    我也给你的帖子纠个错:)

    原文:histogram是直方图,用来描述离散变量(discrete variable)的分布情况

    正解:直方图是描述non-discrete variables的分布情况,而非discrete variable

    评分

    1

    查看全部评分

  • TA的每日心情
    慵懒
    2023-2-2 22:17
  • 签到天数: 931 天

    [LV.10]以坛为家III

    9

    主题

    1109

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11434

    灌水大神章笑傲江湖章推广专家

    9
     楼主| 发表于 2019-4-12 18:01:32 | 只看该作者
    lg0315 发表于 2019-4-12 01:33
    没看太明白,按照我的理解,是不是bar chart用于不具备连续性的数据,而Histogram用于连续性数据? ...

    Bar chart的横轴数据确实是不连续的,因为它不能量化,而是分类变量,比如看一个班男女生测试成绩各是多少,这时横轴数据即两个:男、女,又比如试验中对比试验组、比照组和控制组的数据,这时横轴即三个数据:试验组、比照组和控制组。

    Histogram的数据其实也不是连续性(continuous)的,而是非离散的。二者的区别在于,前者数据是一段范围内的任意值,比如身高可以是175cm,用更精密的仪器测则是175.13。而年龄数据则是非离散的,你不能说我25.67岁了。

    该用户从未签到

    129

    主题

    517

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    13035

    灌水大神章小蜜蜂章笑傲江湖章

    10
    发表于 2019-4-13 20:07:43 | 只看该作者
    逆风的香 发表于 2019-4-12 18:01
    Bar chart的横轴数据确实是不连续的,因为它不能量化,而是分类变量,比如看一个班男女生测试成绩各是多 ...

    年龄数据则是非离散的?
    說對了一半,有時我們會說誰比誰年長幾個月。
  • TA的每日心情
    开心
    2023-2-17 08:38
  • 签到天数: 321 天

    [LV.8]以坛为家I

    4

    主题

    785

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    11494

    QQ 章

    13
    发表于 2019-4-14 18:42:45 | 只看该作者
    感谢楼主分享知识。我的理解是,直方图的小长方形面积是有意义的,也即横轴也是数据,而非汉字、日期等做乘法无意义的文本。
  • TA的每日心情
    慵懒
    2021-9-28 14:33
  • 签到天数: 158 天

    [LV.7]常住居民III

    5

    主题

    907

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    17310

    QQ 章灌水大神章笑傲江湖章推广专家

    14
    发表于 2019-4-27 22:36:45 | 只看该作者
    本帖最后由 atauzki 于 2019-4-27 23:00 编辑

    牛津的错误应是第七版原文就有,第八版的英文其实你对比bar chart看,也好不到哪里去(主要是挂个compare却根本没看出来什么区别,非常逗)。而ode/oeld的解释就很准确。