查看: 685|回复: 6
打印 上一主题 下一主题

[求助] PDF 文档 ORC 后,英文音标出现乱码,请问如何解决?

[复制链接]
  • TA的每日心情
    开心
    2022-8-3 09:49
  • 签到天数: 1500 天

    [LV.Master]伴坛终老

    61

    主题

    2041

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    21196
    跳转到指定楼层
    1
    发表于 2019-4-23 23:32:55 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

    软件是 Adobe Acrobat Pro DC 2019,使用了软件自带的文本识别功能,扫描后可以复制文本,
    但是把文本拷贝到 WORD 或文本编辑器里,音标会出现乱码,请问如何解决?




  • TA的每日心情
    慵懒
    2 小时前
  • 签到天数: 1593 天

    [LV.Master]伴坛终老

    2

    主题

    1733

    回帖

    16万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    168862
    推荐
    发表于 2019-4-24 00:08:00 | 只看该作者
    本帖最后由 Word 于 2019-4-24 00:23 编辑

    并不是乱码,只是识别错误,可以尝试不同的识别软件,效果各有不同。
    另外,一些特殊符号,需要识别库本身支持,才有可能识别正确
  • TA的每日心情
    奋斗
    2019-10-11 13:52
  • 签到天数: 142 天

    [LV.7]常住居民III

    15

    主题

    336

    回帖

    15万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    153139

    灌水大神章小蜜蜂章笑傲江湖章推广专家QQ 章

    2
    发表于 2019-4-23 23:52:26 | 只看该作者
    调编码格式为 UTF8 试试吧。

    该用户从未签到

    539

    主题

    3046

    回帖

    25万

    积分

    翰林院编修

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    251476

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    3
    发表于 2019-4-23 23:56:07 | 只看该作者
    本来就是识别错了,所以答案是无法解决。忍着
  • TA的每日心情
    慵懒
    2021-9-28 14:33
  • 签到天数: 158 天

    [LV.7]常住居民III

    5

    主题

    907

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    17310

    QQ 章灌水大神章笑傲江湖章推广专家

    5
    发表于 2019-4-24 00:16:42 | 只看该作者
    ocr又不是百分百准确,要不然人家图片词典都是白做
  • TA的每日心情
    郁闷
    2018-5-17 09:15
  • 签到天数: 1 天

    [LV.1]初来乍到

    56

    主题

    490

    回帖

    1万

    积分

    分区版主

    Rank: 11Rank: 11Rank: 11Rank: 11

    积分
    12730

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    6
    发表于 2019-4-24 07:25:44 | 只看该作者
    目前OCR只有云方面表现良好,其它的都是错误一堆。如果以句正确率来论,50%正确率算是不错了。
  • TA的每日心情
    开心
    2019-6-27 08:03
  • 签到天数: 8 天

    [LV.3]偶尔看看II

    40

    主题

    464

    回帖

    5430

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    5430

    灌水大神章

    7
    发表于 2019-4-24 11:06:24 | 只看该作者
    这个错误是识别过程中形成的,无法改变。但可以尝试所有文件识别结束后,观察分析错误规律,再用编辑软件进行替换修改。