TA的每日心情 | 开心 2019-5-28 07:39 |
---|
签到天数: 339 天 [LV.8]以坛为家I
状元
- 积分
- 42505
|
图像pdf直接可以做成词典。有时间,ocr再来做成文本一样的词典,更好。
一、pdf对照
(一)把已经ocr的pdf转换成双图层。保存为另一个pdf。
https://www.onelegal.com/blog/ho ... sing-adobe-acrobat/
如果没有make ocr,见这里最下面的方法。
https://community.adobe.com/t5/a ... flight/td-p/9193020
(二)两个pdf同时打开。窗口---平铺---垂直。后面的pdf只显示文本层。
或者只打开修改的pdf。窗口---新建窗口,再窗口---平铺---垂直。让一个pdf只显示文本层。
或者只打开修改的pdf。窗口---拆分,让pdf只显示文本层。(这个只有上下的模式。)
其实,第二步,还可以用文档比较,可以同步滚动。但是,我的软件比较的时候出问题,没有进去。
说明:acrobat自己ocr的,字体是Hidden Horz OCR。单选文本层,文字不可见。
这个用enfocus修改字体,可以显示。有些麻烦。可以试一试三的办法。
二、还想到一个办法,一边朗读,一边检查修改文本。
三、就校对来说,还可以把ocr的pdf导出为RTF。黑马校对2004(绿色)的HMCheck打开rtf,至少可以先检查一些错别字。校对保存。
然后,word里面一段一段选择朗读,对照pdf,检查修改为彩色字。最后,可以到pdf集中修改文字。
软件说明。解密版和Install似乎比较复杂,解密版的hmsc2004里面的安装文件可以在windows10运行。但是,我在word里面运行,没有成功。推荐绿色版。
|
|