查看: 16426|回复: 25
打印 上一主题 下一主题

[筹划] 朗氏德汉双解大词典 修订本

[复制链接]

该用户从未签到

19

主题

388

回帖

7702

积分

会元

Rank: 7Rank: 7Rank: 7

积分
7702

灌水大神章小蜜蜂章笑傲江湖章

跳转到指定楼层
1
发表于 2013-8-16 02:21:45 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
hi
大家好
这部朗氏德汉双解大词典 修订本是学德语的好帮手
几乎每人一本
有没有人有华为网盘的VIP
可以将这部词典的PDF 下载下来,然后OCR呢
如果可以
我负责将这部词典慢慢做出来
地址在这里
http://dl.dbank.com/c0g33hv5oc

该用户从未签到

26

主题

418

回帖

3370

积分

贡士

Rank: 6Rank: 6

积分
3370

灌水大神章小蜜蜂章笑傲江湖章

2
发表于 2013-8-16 05:30:20 | 只看该作者

该用户从未签到

26

主题

418

回帖

3370

积分

贡士

Rank: 6Rank: 6

积分
3370

灌水大神章小蜜蜂章笑傲江湖章

3
发表于 2013-8-16 05:32:49 | 只看该作者
豆瓣那个帖子是一个月前的,链接都还有效。

该用户从未签到

2121

主题

2961

回帖

6万

积分

翰林院修撰

不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

Rank: 12Rank: 12Rank: 12

积分
61056

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

4
发表于 2013-8-16 09:48:22 | 只看该作者
chigre 发表于 2013-8-16 05:32
豆瓣那个帖子是一个月前的,链接都还有效。

{:5_227:}我已下载,并上传到https://www.pdawiki.com/forum/thread-10921-1-1.html这里的网盘。子文件夹pdf中的Langenscheidt Gro_w_rterbuch Deutsch als Fremdsprache (Deutsch - Chinesisch).pdf是也。

该用户从未签到

19

主题

388

回帖

7702

积分

会元

Rank: 7Rank: 7Rank: 7

积分
7702

灌水大神章小蜜蜂章笑傲江湖章

5
 楼主| 发表于 2013-8-16 20:27:32 | 只看该作者
Oeasy童鞋威武,我手头上有这部词典的德德版本的bgl文件
可以转换成txt
我已经对过了
这部双解的跟原版德德版本完全一样,只是加多了中文注释而已
不知道有什么比较好的办法
或者可不可以用编程的方法直接使用原版的德德txt文件呢

该用户从未签到

19

主题

388

回帖

7702

积分

会元

Rank: 7Rank: 7Rank: 7

积分
7702

灌水大神章小蜜蜂章笑傲江湖章

6
 楼主| 发表于 2013-8-16 20:32:27 | 只看该作者
chigre 发表于 2013-8-16 05:32
豆瓣那个帖子是一个月前的,链接都还有效。

还真的没有注意到豆瓣有呢
我虽然也买了这本很重的词典,
但是没有用过
如果真的可以数字化
真的是功德无量

该用户从未签到

26

主题

418

回帖

3370

积分

贡士

Rank: 6Rank: 6

积分
3370

灌水大神章小蜜蜂章笑傲江湖章

7
发表于 2013-8-16 20:49:03 | 只看该作者
dingyang 发表于 2013-8-16 20:32
还真的没有注意到豆瓣有呢
我虽然也买了这本很重的词典,
但是没有用过

直接在德德那个的txt基础上操作了呗

该用户从未签到

26

主题

418

回帖

3370

积分

贡士

Rank: 6Rank: 6

积分
3370

灌水大神章小蜜蜂章笑傲江湖章

8
发表于 2013-8-16 20:51:19 | 只看该作者
dingyang 发表于 2013-8-16 20:32
还真的没有注意到豆瓣有呢
我虽然也买了这本很重的词典,
但是没有用过

直接在德德那个的txt基础上操作了呗

该用户从未签到

19

主题

388

回帖

7702

积分

会元

Rank: 7Rank: 7Rank: 7

积分
7702

灌水大神章小蜜蜂章笑傲江湖章

9
 楼主| 发表于 2013-8-16 20:57:46 | 只看该作者
这样的话,如果是多人操作,把德德的txt分页,然后用ocr得来的中文复制进去
这样也是个办法,不过这部词典内容很多,加上ocr之后还要校对
懂德语的人不多,愿意加入的人就更少
不知道chigre童鞋你的意汉双解词典是不是也是这样的制作方法?
需要的时间如何?

该用户从未签到

0

主题

16

回帖

82

积分

白身

Rank: 1

积分
82
10
发表于 2013-10-20 15:40:12 | 只看该作者
大黄真的好重,有电子版的轻松多了

该用户从未签到

13

主题

146

回帖

4197

积分

贡士

Rank: 6Rank: 6

积分
4197
11
发表于 2013-10-20 17:30:04 | 只看该作者
对这个很感兴趣啊,如果能做成电子词典简直是造福人类啊。
只不过从pdf文档ocr文本,再排版、校对,做成电子词典,是一件大工程,需要有大神牵头,做好管理和技术支持啊。
如果有大牛牵头,我一定报名啊~~

该用户从未签到

2121

主题

2961

回帖

6万

积分

翰林院修撰

不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

Rank: 12Rank: 12Rank: 12

积分
61056

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

12
发表于 2013-10-21 00:12:53 | 只看该作者
本帖最后由 Oeasy 于 2013-10-21 00:35 编辑

卡西欧有收录,不过没说是“修订本”。
http://www.casio.com.cn/dic/product/E-E500/spec.html
德汉        新德汉词典(第3版)
德汉
双解        朗氏德汉双解大词典
汉德        现代汉德词典(第二版)/汉德分类词语手册
德英
英德        牛津德英词典/牛津英德词典
会话        现代德语会话

德语有个micro SD辞典拓展卡,说不定可以xx。
http://www.casio.com.cn/dic/product/micro-SD/index.html
额,可惜那个SD卡里没《朗氏德汉双解大词典》,只有
新德汉词典
(第3版)
上海译文出版社
现代汉德词典
(第2版)
外语教学与研究出版社

这是不是说明SD卡是可能有漏洞的?所以卡西欧不敢把所有的词典都放卡里?

该用户从未签到

13

主题

146

回帖

4197

积分

贡士

Rank: 6Rank: 6

积分
4197
13
发表于 2013-10-21 12:08:21 | 只看该作者
正在用ABBYY进行OCR,5个小时了,50%,这破电脑都要废了。

该用户从未签到

13

主题

146

回帖

4197

积分

贡士

Rank: 6Rank: 6

积分
4197
14
发表于 2013-10-21 12:13:53 | 只看该作者
Oeasy 发表于 2013-10-21 00:12
卡西欧有收录,不过没说是“修订本”。
http://www.casio.com.cn/dic/product/E-E500/spec.html
德汉        新德 ...

卡西欧收录的确实是修订版,从官方的图片上可以看到。

该用户从未签到

0

主题

7

回帖

33

积分

童生

Rank: 2

积分
33
15
发表于 2013-10-30 10:13:33 | 只看该作者
不知进度如何了,真心期待这门双解词典出来~~

该用户从未签到

2

主题

19

回帖

174

积分

童生

Rank: 2

积分
174
16
发表于 2013-10-30 22:52:37 | 只看该作者
前段时间尝试过,最后人组织不起来,自己也快毕业了忙着找工作,纠结啊,真想有这么一个好词典,学德语必备啊,另外杜登德汉双解出来了

该用户从未签到

2

主题

19

回帖

174

积分

童生

Rank: 2

积分
174
17
发表于 2013-10-31 10:46:55 | 只看该作者
突然记起来,用abbyy转成html形式的话有一个好处,里面德语,汉语还有音标采用的是不同的标记,想转换成彩色版很容易,转换成txt的话将来换成彩色版会很麻烦.至于检查是不是拼写正确,建议用openoffice,可以打开html,直接检查,也很方便,标记语言不会被检查,这是我上会弄的时候的小经验

该用户从未签到

0

主题

8

回帖

110

积分

童生

Rank: 2

积分
110
18
发表于 2013-12-14 18:42:33 | 只看该作者
bbkbbk 发表于 2013-10-21 12:08
正在用ABBYY进行OCR,5个小时了,50%,这破电脑都要废了。

我用foxit phantom ORC到84%结果出错, 太奔溃了

该用户从未签到

13

主题

146

回帖

4197

积分

贡士

Rank: 6Rank: 6

积分
4197
19
发表于 2013-12-14 19:07:49 来自手机 | 只看该作者
FuX 发表于 2013-12-14 18:42
我用foxit phantom ORC到84%结果出错, 太奔溃了

建议将pdf分割成若干小文件进行处理。
反正我已经放弃了,从pdf到mdx极费耐心。

该用户从未签到

2121

主题

2961

回帖

6万

积分

翰林院修撰

不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

Rank: 12Rank: 12Rank: 12

积分
61056

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

20
发表于 2013-12-15 09:29:28 | 只看该作者
从扫描版词典到文字版的mdx,中间有十万八千里。成功先例有2+个
1. 意汉词典
http://tieba.baidu.com/p/2331683268
据c****e介绍,目前版本还有些错误,仍不完美。

2. 日汉大辞典
http://coffeejp.com/bbs/thread-198120-1-1.html
几百号人参与,其中大部分人无声无息地退出了。耗时五六年,总算做出来了,只分享给参与者。其间组织者kouun可谓是殚精竭虑、呕心沥血。在网络上组织这样的活动,对于组织者而言,面临以下问题。
①大量的参与者,其实是浑水摸鱼的
②伸手党会质疑组织者的动机
③人与人之间的交流太难了,真是太难了
---
我们来看看组织者kouun在http://coffeejp.com/bbs/thread-198120-1-1.html的一些回帖。
原帖由 lisette 于 2008-10-29 16:43 发表
[email protected]

您好!
由于您没有及时回复辞典制作工作任务分配
我们视为您不参加此工作了,
取消分给您的任务,
请您谅解
--
这不能说是中国人的效率
除10个左右真是特殊原因外,只能说一些不负责任的中国人,还有最令人气愤的是一些本来就旨在捣乱的渣子造成的
现在退出的人数(且毫无声息)已经超过了交稿人数,信不信?
放心,在咖啡,此辞典不会成为烂尾的,尽管我需要自己掏腰包打电话联系
--
谢谢您的关注
刚一注册就直接过来请求分配任务,我们一般是不予考虑的,因为被这样的(意图捣乱)注册者水过N次了
很抱歉,即便缺人手也无法让您参加
请您谅解
--

    本词典不出售,不共享,
义务规约请参见楼顶帖子
谢谢
--

shanxiazhi 发表于 2010-11-17 11:17
不过这么好的词典,学习用?工作用岂不是更好?

如果想获得,可以参加。现在只用几天就能完成承担的任务
--
大家 越来越 着急了啊,
其实主持人花费时间难以计数,比原计划延迟完工,是因为,制作者春节后生病一场,这个我想大家是能够理解的吧
大家对4年感到泄气了可以理解。可是你如果看到我们坚持了四年曙光即将出现,难道不值得高兴吗?
“遥遥无期”是不可能的,现在看来是“指日可待”,请再等等,
--
有意思,干活最多的人竟成了剥削者!
对进度,在词典群有明确的说法,所以,如果参加者了解情况,请加入群。请未参加者不要在此煽风点火。
--
不知道你这个“剥削”和 “支配劳动成果”的逻辑是从哪里学来的,

当初做这个,是因为论坛上有不少朋友想做,既然想做就肯定有个主持的,既然每个人都负担一部分,并且按照约定能够得到与劳动相适应的成果,怎么能说是被“剥削”呢?

你口口声声说“支配劳动成果”,就更奇怪了,在这个项目中,主持人只是个主持者和编辑者,他不为此牟利,也没有任何做其他用途使用的特权,竟成了支配劳动成果的“剥削者”!真不知道你这是什么逻辑!

你又口口声声说什么主持人“自己的梦想”,也是非常可笑的,梦想如果说有,那是大家想用一个电脑上好用的词典,如此而已


公开,透明当然需要,但是那是对参加者,对您一个旁观者,根本没有义务对您透什么明

这个词典是第二个也是最后一个。这个词典坚持了4年,越来越深刻地感受到什么叫 吃力不讨好,好在多数参加者都还理解,

--
呵呵,有意思,
请教,如果是您,在开始这个词典制作之初,你预计要找到100个人才能做完词典,那么,第100个人留言要做,你是不是就能确定您的进度呢?您肯定会说是的。但是您不知道,这100个人中有65个人后来退出 了, 甚至有人连个招呼都不打就退出了,那您怎么估算您的进度呢?至于现在,关于进度,我们当然有进度,成员可以在群里了解进度,成员之外,我想可以通过顶楼的帖子去了解进度。

至于您 其他“,是不是字典只是在内部参与者之间使用”之类的疑问,我想在顶楼的帖子里已经有了非常明确的说明

“到头来,所有关注过这个项目的人,都只是看客咯?”我从来没有说过关注的人是看客,但是对您,我必须得说您可能只是看客,因为,这4年来,连最基本的事实都不愿意去了解(例如仔细阅读一下顶楼的帖子),就指责我们在剥削的,仅有二位,您是其中之一。
--


{:5_227:} 一句话,靠谱的人还是太少。

该用户从未签到

0

主题

8

回帖

110

积分

童生

Rank: 2

积分
110
21
发表于 2013-12-15 14:02:45 | 只看该作者
bbkbbk 发表于 2013-12-14 19:07
建议将pdf分割成若干小文件进行处理。
反正我已经放弃了,从pdf到mdx极费耐心。

我觉得应该组建一个德语qq群方便联系什么的

该用户从未签到

0

主题

8

回帖

110

积分

童生

Rank: 2

积分
110
22
发表于 2013-12-15 14:08:52 | 只看该作者
bbkbbk 发表于 2013-12-14 19:07
建议将pdf分割成若干小文件进行处理。
反正我已经放弃了,从pdf到mdx极费耐心。

我感觉理论需要先德语模块orc一次再简体中文orc一次, 如果这样那就真的是大工程了

该用户从未签到

0

主题

8

回帖

110

积分

童生

Rank: 2

积分
110
23
发表于 2013-12-15 16:29:23 | 只看该作者
bbkbbk 发表于 2013-12-14 19:07
建议将pdf分割成若干小文件进行处理。
反正我已经放弃了,从pdf到mdx极费耐心。

而且ocr了之后的文本很多乱码

该用户从未签到

13

主题

146

回帖

4197

积分

贡士

Rank: 6Rank: 6

积分
4197
24
发表于 2013-12-15 17:30:50 | 只看该作者
FuX 发表于 2013-12-15 16:29
而且ocr了之后的文本很多乱码

abbyy finereader的效果还不错吧。德语部分就无所谓了,论坛里已经有了德德版,ocr得到中文一条条复制进去就ok了,比一条条校对来讲,工作量差不多。
这件事情要是组织一帮人来干,很容易出现楼上oeasy版大所说的情况。so,尽管有高人在做,也是单枪匹马不紧不慢地做。
我不打算参与或组织,因为pdf与纯文本的距离实在遥远,再者现有的德语词典够自己用了,对这本的需求不是很大。
  • TA的每日心情

    2021-7-7 14:11
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    1

    主题

    65

    回帖

    727

    积分

    举人

    Rank: 4

    积分
    727
    25
    发表于 2013-12-15 19:45:31 | 只看该作者
    FuX 发表于 2013-12-15 14:08
    我感觉理论需要先德语模块orc一次再简体中文orc一次, 如果这样那就真的是大工程了

    错,
    finereader 可以在ocr之前选择德语和中文,不需要二次ocr。
    问题在于,即便finereader已经非常强悍,但是ocr出来的文本,仍然需要仔细的校对。否则,出错率对字典来说太高了。