查看: 10119|回复: 246
打印 上一主题 下一主题

[词典校勘] ❤︎❤︎❤︎❤︎2/18/2021,英语常用词疑难用法手册2e校对

  [复制链接]
  • TA的每日心情
    开心
    2019-6-23 00:02
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    43

    主题

    391

    回帖

    5万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    54723
    跳转到指定楼层
    1
    发表于 2020-10-23 22:14:54 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 ogrishman 于 2021-2-18 22:48 编辑

    02/18/2021更新

    这是目前的校对结果和pdf文件以及扫描的图片文件:
    https://files.fm/u/x8gxnnpyc#/list/
    希望有能力的朋友帮忙制作成词库免费分享,提前谢过!
    文件总共4.2G左右,分卷压缩每个50MB,解压密码是:

    本帖隐藏的内容

    aaa





    感谢大家的祝福和版主对我帖子的高亮!我受伤的情况远比我预估的要严重,经鉴定我是3级伤残,生活自理都存在重大问题,英语对于我的用处也已不大,我的实际情况也无法让我继续做那个词典了。抱歉了诸位,让你们失望了!不过我已经在联系版主,让他能自己或者找人接替我的工作,我会把所有大家校对的结果和PDF的扫描档发给版主,制作完成后免费分享给大家。如果有朋友愿意接手这个工作也可以和我联系,不过我希望你是有技术能力也有自己词典作品的朋友(喽啰骗资料的就别来了,你们等等,反正最后会免费分享给大家的,我需要的是真心帮忙的有技术能力的朋友)。
    祝大家身体健康、学习进步,英语早日达到母语人士水平!



    12/25/2020更新

    祝大家大家圣诞节快乐!前几天被暴打的非常严重,经过医院检查才知道,两个腿一个小腿骨折,另一个腿膝盖骨折,左臂被砍伤,后脑头皮被地面摩擦的头发掉光血肉模糊,而且已经检查有轻微脑震荡。还好右手能自由活动,这才能用手机和大家沟通,看看手机度日。现在自己看到自己的样子都感觉像看恐怖片一样!这俩天排队总算把手术也做了,现在每时每刻都痛不欲生啊。我的另一个同事一个胳膊被砍的只剩一点皮肉和身体连着,一个腿骨折,头上被砍了一斧头,也有脑震荡。悲夫!放两张图片证明我所言非虚,为了不影响大家心情我就不多放细节图片了。前两天我发了个帖子,狠多人都祝我早日康复,弟在此一并谢过诸位!在此祝诸位圣诞快乐,新年快乐,一切顺利!









    12/21/2020更新
    本来计划12月25日就可以出差回来继续做这个工作,结果人算不如天算啊。年底了,公司派出去要账。其中江西的某公司人员一言不合就动手,而且是一帮人。我与另一个同事被打的头破血流,腿也断了,全身是伤,在别人的帮助下我们才得以脱身。现在我在医院躺着更新这个帖子。医生讲我应该在过年前能出院,到时候回家我再继续这个OCR的工作。给大家说一下情况,抱歉了诸位,让你们久等了。

    12/06/2020更新

    我这一阵子出差了,暂时停滞没法继续,12月25日我会继续开始这个项目工作。

    所有人都已经完成自己的校对任务,我已经开始处理制作mdx。发现有三个人不看我的操作指导,不知道是怎么操作的,反正最后给我的HTML是从Word里导出的,导致这三个HTML的结构和其他人的HTML结构完全不一样,这样根本没法统一处理。现在已经联系这三个人,让他们发送当时校对的项目文件给我,我需要重新导出HTML。

    从这件小事能看出来不管你做什么事情,工作中还是生活中,首先要了解清楚最终的需求!需求不清楚,你无论付出了多大努力都是不可能达到目标的。另外万不可自作聪明,觉得自己懂,就压根不去了解需求,这更是错上加错。






    原帖内容

    我想召集一些人共同校对OCR《英语常用词疑难用法手册第二版》的结果。具体细节如下:

    * 每人校对不超过60页
    * 我提供软件(ABBYY FineReader)和校对方法,我会录制一个视频,大家必须按照视频里的操作来进行,保证每个人的操作都是一样的
    * 我提供给每个人需要校对的PDF文件
    * 参与校对的人最终可以获得我制作的mdx格式的词库
    * 参与者收到文件后一星期内必须完成任务(我测试了一下,ABBYY FineReader OCR的结果绝大多数都是正确的,校对一页大概需要10分钟左右吧)


    没参与的人想要获得最终的mdx必须赞助,赞助的费用除掉我买书和找人扫描的成本外,剩余部分我会平均分给参与校对的朋友。

    有意参加的人回帖表明或者给我发消息。

    评分

    3

    查看全部评分

    本帖被以下淘专辑推荐:

  • TA的每日心情
    开心
    15 小时前
  • 签到天数: 814 天

    [LV.10]以坛为家III

    2

    主题

    942

    回帖

    9111

    积分

    进士

    Rank: 8Rank: 8

    积分
    9111
    推荐
    发表于 2021-2-19 14:00:38 | 只看该作者
    谁能想到在一个以交流学习为目的的论坛还能看见这么一幕悲剧呢?虽然与您素昧平生,我很感激您组织起这么一次活动,从而让我学到一些诸如abbyy软件使用的知识和技巧。我觉得任何在没有现有数据可利用的情况下,以一己之力想要电子化书籍,特别是像词典百科全书或者冷门年代久远的书籍,都是功德无量的,愿上天保佑善良的您,也希望您有朝一日重拾英语。
  • TA的每日心情
    奋斗
    2023-3-14 00:00
  • 签到天数: 615 天

    [LV.9]以坛为家II

    6

    主题

    864

    回帖

    5484

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    5484

    QQ 章

    推荐
    发表于 2020-12-21 15:11:32 | 只看该作者
    啊这……有些地方的民风的确是一言难尽
    距离精神脱贫还很遥远
    祝愿楼主能尽早恢复健康良好状态
  • TA的每日心情
    奋斗
    14 小时前
  • 签到天数: 878 天

    [LV.10]以坛为家III

    0

    主题

    1213

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15273
    推荐
    发表于 2021-2-18 08:53:53 | 只看该作者
    兄弟,还想着春节回来能听到你的好消息!既然现在已经这样了,安心养伤,多养养能恢复的,以后你继续用英语的日子还多着呢,保持良好心态,把伤养好,大家在论坛等着你健康回归!!
  • TA的每日心情
    慵懒
    昨天 08:16
  • 签到天数: 1462 天

    [LV.10]以坛为家III

    19

    主题

    1944

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15867

    灌水大神章小蜜蜂章笑傲江湖章

    推荐
    发表于 2020-11-2 17:36:36 | 只看该作者
    帮顶一下,希望更多朋友继续加入
  • TA的每日心情
    慵懒
    昨天 08:16
  • 签到天数: 1462 天

    [LV.10]以坛为家III

    19

    主题

    1944

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15867

    灌水大神章小蜜蜂章笑傲江湖章

    推荐
    发表于 2020-10-24 14:14:20 | 只看该作者
    不必等凑齐40人,每个人空余时间是不一样的。
    这两天刚好周末,现有的10多人可以开始先分配起来,校对出书的前四分之一。
  • TA的每日心情
    开心
    2020-12-20 07:51
  • 签到天数: 4 天

    [LV.2]偶尔看看I

    0

    主题

    24

    回帖

    3407

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3407

    QQ 章

    推荐
    发表于 2023-3-16 23:24:37 | 只看该作者
    感谢楼主大大
  • TA的每日心情
    开心
    2021-7-19 00:26
  • 签到天数: 505 天

    [LV.9]以坛为家II

    0

    主题

    515

    回帖

    6829

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    6829
    推荐
    发表于 2023-3-16 10:02:19 | 只看该作者
    祝楼主早日康复
  • TA的每日心情
    开心
    2022-3-25 14:16
  • 签到天数: 434 天

    [LV.9]以坛为家II

    7

    主题

    607

    回帖

    5万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    56658
    推荐
    发表于 2023-3-9 14:41:16 | 只看该作者
    希望正版早点出炉
  • TA的每日心情
    奋斗
    2022-3-22 07:50
  • 签到天数: 48 天

    [LV.5]常住居民I

    1

    主题

    104

    回帖

    1167

    积分

    解元

    Rank: 5Rank: 5

    积分
    1167
    推荐
    发表于 2021-5-20 17:24:28 | 只看该作者
    希望楼主今日一切都好,生活总有希望
  • TA的每日心情
    开心
    2022-8-18 20:20
  • 签到天数: 345 天

    [LV.8]以坛为家I

    0

    主题

    856

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    13315

    灌水大神章

    推荐
    发表于 2021-5-16 17:44:36 | 只看该作者
    谢谢楼主的分享
  • TA的每日心情

    2020-11-5 07:56
  • 签到天数: 15 天

    [LV.4]偶尔看看III

    4

    主题

    39

    回帖

    323

    积分

    禁止发言

    积分
    323
    2
    发表于 2020-10-23 23:01:07 | 只看该作者
    这个陈用仪的第二版,和第一版 内容上真的有区别么?还是出版社把完全同样的内容又出了一遍?

    点评

    有删有加,而且改了一些错误。我随便抽查了十个词条没有一个和第一版完全一样的。  发表于 2020-10-23 23:11
  • TA的每日心情
    奋斗
    2021-9-21 18:07
  • 签到天数: 167 天

    [LV.7]常住居民III

    4

    主题

    375

    回帖

    5080

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    5080

    灌水大神章

    3
    发表于 2020-10-24 00:13:59 | 只看该作者
    有兴趣参与,先报名一个~

    点评

    好的,谢谢,咱们继续等等看能凑集40人不。  发表于 2020-10-24 00:56
  • TA的每日心情
    开心
    2023-1-14 04:24
  • 签到天数: 128 天

    [LV.7]常住居民III

    2

    主题

    498

    回帖

    5217

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    5217

    灌水大神章

    4
    发表于 2020-10-24 08:56:02 | 只看该作者
    《英语常用词疑难用法手册》出第二版了,好书。报名参加。

    点评

    好的,谢谢,咱们继续等等看能凑集40人不。  发表于 2020-10-24 09:45

    该用户从未签到

    539

    主题

    3046

    回帖

    25万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    251286

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    6
    发表于 2020-10-24 09:33:26 | 只看该作者
    把我拉进来……25页可以说是非常轻松咯

    点评

    好的,谢谢,咱们继续等等看能凑集40人不。  发表于 2020-10-24 09:44
  • TA的每日心情
    开心
    2021-3-16 09:31
  • 签到天数: 41 天

    [LV.5]常住居民I

    0

    主题

    189

    回帖

    621

    积分

    举人

    Rank: 4

    积分
    621
    7
    发表于 2020-10-24 09:40:53 | 只看该作者
    25页大概需要多少小时核对

    点评

    大概4五个小时,这是估算哦。  发表于 2020-10-24 09:44
  • TA的每日心情
    奋斗
    14 小时前
  • 签到天数: 878 天

    [LV.10]以坛为家III

    0

    主题

    1213

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15273
    8
    发表于 2020-10-24 10:22:21 | 只看该作者
    从来没有干过这活,想参与一下,毕竟下了这么多好的资源,也该回馈一下,楼主,算我一个!一个小建议:人数不到40也可以开始,每个人多校对几页,能把好东西做出来最重要!

    点评

    好的,谢谢,咱们继续等等看能凑集40人不  发表于 2020-10-24 10:43
  • TA的每日心情
    慵懒
    昨天 08:16
  • 签到天数: 1462 天

    [LV.10]以坛为家III

    19

    主题

    1944

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15867

    灌水大神章小蜜蜂章笑傲江湖章

    10
    发表于 2020-10-24 13:47:31 | 只看该作者
    经典好书,报个名参加

    点评

    好的,谢谢,咱们继续等等看能凑集40人不  发表于 2020-10-24 13:53
  • TA的每日心情
    擦汗
    2021-11-10 19:44
  • 签到天数: 202 天

    [LV.7]常住居民III

    5

    主题

    310

    回帖

    4508

    积分

    贡士

    Rank: 6Rank: 6

    积分
    4508
    12
    发表于 2020-10-24 16:38:11 | 只看该作者
    零基础小白,但也默默报个名。

    点评

    谢谢支持!  发表于 2020-10-24 17:24
  • TA的每日心情
    开心
    15 小时前
  • 签到天数: 1955 天

    [LV.Master]伴坛终老

    0

    主题

    2541

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    25504

    灌水大神章QQ 章

    14
    发表于 2020-10-24 17:26:12 | 只看该作者
    没用过ABBYY FineReader,零基础学习学习,报名参加。

    点评

    谢谢支持!  发表于 2020-10-24 17:28
  • TA的每日心情
    开心
    15 小时前
  • 签到天数: 814 天

    [LV.10]以坛为家III

    2

    主题

    942

    回帖

    9111

    积分

    进士

    Rank: 8Rank: 8

    积分
    9111
    15
    发表于 2020-10-24 18:51:45 | 只看该作者
    报名参加,为好资源的诞生出自己的一份力

    点评

    谢谢支持!  发表于 2020-10-24 18:53
    谢谢????  发表于 2020-10-24 18:52
  • TA的每日心情
    无聊
    2021-1-15 05:13
  • 签到天数: 271 天

    [LV.8]以坛为家I

    11

    主题

    471

    回帖

    6760

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    6760

    灌水大神章

    17
    发表于 2020-10-24 20:21:34 | 只看该作者
    报名参加!

    另: 小小的建议: 每个人的硬件环境 (Mac 上的 ABBYY 软件版本落后太多) 和电脑软件操作知识以及对教学视频内容理解的不一致, 依然有可能导致每个人交出的结果不能完全一致, 所以建议楼主看能不能把 ABBYY FineReader OCR 这部分统一完成了, 然后分发需要校对的内容大家根据要求完成, 这样估计报名的人会多一些而且完成质量可能会更好一些.
    当然这只是个建议, 楼主作为发起人请自行定夺...

    点评

    谢谢支持!关键这个软件本身在校对这个步骤上能起到很大作用,所以最好是大家自己OCR自己的部分。Mac上我会随后测试一下看看有没有大的不通。  发表于 2020-10-24 20:43
  • TA的每日心情
    开心
    2022-2-7 08:49
  • 签到天数: 243 天

    [LV.8]以坛为家I

    6

    主题

    489

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    13274
    18
    发表于 2020-10-24 21:09:49 | 只看该作者
    做图像切图版的如何呢?我愿意赞助
  • TA的每日心情
    开心
    2022-2-7 08:49
  • 签到天数: 243 天

    [LV.8]以坛为家I

    6

    主题

    489

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    13274
    19
    发表于 2020-10-24 21:10:03 | 只看该作者
    做图像切图版的如何呢?我愿意赞助
  • TA的每日心情
    难过
    21 小时前
  • 签到天数: 914 天

    [LV.10]以坛为家III

    0

    主题

    3752

    回帖

    3万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    36799
    20
    发表于 2020-10-24 21:46:42 | 只看该作者

    报名参加,为好资源的诞生出自己的一份力; 另外,我已经买了这本书,值得做!

    点评

    谢谢支持!  发表于 2020-10-24 22:29
  • TA的每日心情
    奋斗
    16 小时前
  • 签到天数: 1047 天

    [LV.10]以坛为家III

    1

    主题

    1592

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    23059

    QQ 章

    21
    发表于 2020-10-25 15:12:26 | 只看该作者
    报名参加,几个小时还是能够挤出来的,希望早日成功。

    点评

    谢谢!  发表于 2020-10-25 16:09
  • TA的每日心情
    慵懒
    昨天 08:16
  • 签到天数: 1462 天

    [LV.10]以坛为家III

    19

    主题

    1944

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15867

    灌水大神章小蜜蜂章笑傲江湖章

    22
    发表于 2020-10-28 12:35:44 | 只看该作者
    如果对HTML代码、正则表达式很熟,可在OCR后导出html,然后直接用VSCode编辑html文件。

    很多OCR错误是相同的,可以批量代换。

    HTML标签正则替换后只需要很少几对就够用了,这样文件很小,校对时也比较清晰
    <h3></h3>
    <sup></sup>
    <p></p>
    <b><i><u> </b></i></u>
    <i></i>

    例句和解说OCR并不是分得很清,可在所有校对完成时,
    自定义一个标签<exp></exp>去用正则判断+手工调整(用<span></span>也行)

  • TA的每日心情
    开心
    2019-6-23 00:02
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    43

    主题

    391

    回帖

    5万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    54723
    23
     楼主| 发表于 2020-10-28 13:14:08 | 只看该作者
    huala 发表于 2020-10-28 12:35
    如果对HTML代码、正则表达式很熟,可在OCR后导出html,然后直接用VSCode编辑html文件。

    很多OCR错误是相同 ...

    你是说直接修改导出的HTML来校对么?在这里面批量替换不是很可靠,比如原始pdf中的一个句号“。”被识别成了字母“o”,没有办法找出所有的这种情况来批量替换的。至于这个校对软件生成的HTML那我肯定是要重度修改的,它生成太复杂。
  • TA的每日心情
    慵懒
    昨天 08:16
  • 签到天数: 1462 天

    [LV.10]以坛为家III

    19

    主题

    1944

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    15867

    灌水大神章小蜜蜂章笑傲江湖章

    24
    发表于 2020-10-28 17:32:12 | 只看该作者
    并不是说所有情况都直接批量代换
    类似句号“。”被识别成了字母“o”,替换时采用逐个检索的方法,符合即替换
  • TA的每日心情
    开心
    2019-6-23 00:02
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    43

    主题

    391

    回帖

    5万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    54723
    25
     楼主| 发表于 2020-10-28 17:57:22 | 只看该作者
    huala 发表于 2020-10-28 17:32
    并不是说所有情况都直接批量代换
    类似句号“。”被识别成了字母“o”,替换时采用逐个检索的方法,符合即替 ...

    那要把整个文件里的所有字母“o”都检查一边吗?这可能还不如用Abbyy帮助你把可能有问题的地方校对一下。我还只是举了一个例子,肯定还有其他情况,不可能手工把所有情况用肉眼观察“是否应该替换”的。