签到天数: 5 天
[LV.2]偶尔看看I
61
627
16万
状元
一直被外国人名地名所困扰,最近了解到有新华社的这两本权威书籍,可谓是翻译工作者和外语工作者案头必备的工具书(当然,对于我这种普通英语学习者也是很有用的工具书)。这两本书应该放到网上供广大人民使用,推动译名的规范和统一啊。看到论坛里以前发过这两本辞典,不过都只是简单地处理了下(这两本书要做好也确实比较难,都是拉丁文还有一些私定字符),还存在少许数据缺失和排版问题。 为了提升以后使用的便捷和可靠性,还是决定了做一下,从网上找到那个excel原本后对照原书PDF进行处理。经过大量的对照发现,excel版数据准确、没有与原书相勃的地方,只不过有部分词条或内容块缺失,已发现的缺失我全部手工对照补充进去了,总共100多条。文本处理过程中还发现几处来自原书的印刷问题,已在文本中进行纠正。关于字符问题,能在Unicode中找到的字符全部Unicode化了,不再用html特殊表示;PUA(私有区)的一些字符(将近200个吧,主要是一些Unicode还未收的简化字和极少见的含附加符号的拉丁字母)没办法,就直接先用方块「⬜」代替了。其中还处理了的许多其它问题,不一一列举。 制成的mdx为两本书籍的合本,功能包含标准的正查(具体人名不一定能直接查到,可以拆成姓和名分别查,翻译的规则和惯例在那): 和额外制作的反查(反查仅供参考,可结合正查检验):
查看全部评分
steveliu0226
liushawulan
jonah_w
chigre3
klwo2
举报
评分 举报
武汉加油 发表于 2020-8-8 12:01 比如出现了 中国 (人)
签到天数: 209 天
[LV.7]常住居民III
73
1552
9万
该用户从未签到
539
3046
25万
翰林院编修
klwo2 发表于 2020-5-12 10:41 太辛苦了你 Unicode还未收的简化字,应该就是那些类推简化字吧?可以直接用原来的繁体字,别管原 ...
签到天数: 699 天
[LV.9]以坛为家II
17
1756
1万
签到天数: 122 天
12
641
3万
签到天数: 297 天
[LV.8]以坛为家I
5
634
4297
贡士
签到天数: 274 天
0
661
禁止发言
Mandolin 发表于 2020-5-12 10:48 原数据中要是使用了繁体就好了,可惜使用的是形如“”的代码,不知道使用的是什么字体,推不出原 ...
签到天数: 634 天
2595
签到天数: 249 天
15
325
6万
签到天数: 26 天
[LV.4]偶尔看看III
2
44
1006
解元
签到天数: 85 天
[LV.6]常住居民II
385
9235
进士
签到天数: 1112 天
[LV.10]以坛为家III
32
2048
12万
签到天数: 1626 天
[LV.Master]伴坛终老
4467
翰林院孔目
签到天数: 1696 天
3
2809
7万
签到天数: 81 天
1
232
1358
444
4154
42
1738
2万
签到天数: 1247 天
2219
签到天数: 185 天
8
455
签到天数: 1261 天
1503
6903
会元