|
4楼
楼主 |
发表于 2013-12-21 09:19:41
|
只看该作者
本帖最后由 Oeasy 于 2013-12-24 22:46 编辑
再扯一下语料库相关的软件。
参考:
1. 语料库语言学在线 http://www.corpus4u.org/
2. http://zhidao.baidu.com/question/160502159.html
3. 语料库在线 http://www.cncorpus.org/
4. 語料庫資源 http://elearning.ling.sinica.edu.tw/resources.html
搜文解字 http://words.sinica.edu.tw/
顺便说一下,本人并非科班出身,所从事工作和语言、翻译、教学基本没有关系。Stephen Wolfram 说(http://www.stephenwolfram.com/pu ... -long-term-company/ ),
I've always been a great believer in learning to use the best possible tools. Computers weren't too common in England in the mid-1970s, and the first one I dealt with had paper tapes and such. But I quickly became a fairly competent programmer.
And within a couple of years I was using computers a lot in figuring out my physics. But even though I was by then using the latest and greatest American computers, I kept on bumping into problems.
I remember, I'd just had my twentieth birthday. I'd just gotten my Ph.D. And it looked like my plan to "be a physicist" was going just great.
But I wanted better tools. And I realized that the only way I was really going to get them was to build them myself.
我没Wolfram那么厉害,由于时间、精力有限,我想要了解自己感兴趣的东西,实现自己想要的功能,目前能做的也就是上网搜搜,问问牛人,自己试试。写点帖子,分享心得,算是做点公开的笔记,写得很随意,希望对感兴趣的人有所帮助。
1. AntConc http://www.antlab.sci.waseda.ac.jp/antconc_index.html ,免费的语料库检索软件,感谢Laurence Anthony
2. tlCorpus http://tshwanedje.com/corpus/ 收费的,但是,你懂的
3. WordSmith Tools http://www.lexically.net/wordsmith/index.html ,从没用过,不过想来卖五百人民币的软件,应该是不错的
--
3. CAT软件
我在学校的时候,译过一些专业性较强的文档、书籍,这个过程中,试用了很多软件,包括
3.1.1 SDL Trados http://www.translationzone.com/trados.html
3.1.2 非Trados
Déjà Vu, memoQ等
搜了下,CAT软件还有MemSource, Fluency, XTM Cloud, Lingotek , MultiCorpora, Global Sight, Clay Tablet, Wordfast, Sisulizer, Wordbee, OmegaT , VisualTran Mate etc. ,相关的辅助小软件也是琳琅满目。
3.2.1. 雪人CAT http://www.gcys.cn/
有免费版,我以前有把词典txt文本导入记忆库,原文=译文,间接地实现了较好的全文搜索功能。雪人CAT是简单、粗暴、有效的翻译辅助软件,支持国产!
3.2.2. Transmate http://www.urelitetech.com.cn/
3.2.3. 雅信CAT http://www.yiba.com/
--
Search相关
文件搜索
1.
1.1 Everything Search Engine http://www.voidtools.com/
1.2 http://www.sowsoft.com/efs-vista-sc.htm
2. Google Desktop,已死,但是这是很强大的工具,索引后,可以搜索文本里的内容,还有其他一些功能
http://blog.csdn.net/davidullua/article/details/5255917
Full Text Search
0. 词典软件
0.1 MDict PC版
Ctrl-Shift-F,可以搜索单个词典。
0.2 BlueDict
0.3 StarDict
StarDict格式在全文搜索方面,有它的优点。
0.4 spoony1971《支持全文检索(包括全文正则匹配),正则查询(模糊查询)的字典软件》https://www.pdawiki.com/forum/thread-11381-1-1.html
0.5 ABBYY Lingvo
Lingvo的FTS是它的大卖点。但是较少人制作、分享双语dsl词典。
1. FileLocator Pro
LYX1692在《[英-汉] 柯林斯、朗文、牛津、剑桥双解TXT版-【自备语料库】》(https://www.pdawiki.com/forum/thread-11546-1-1.html)用的FileLocator Pro是很好的工具,感谢他的经验分享。
参考: http://www.mythicsoft.com/filelocatorpro/ 虽然是收费的,但是,你懂的
最好的免索引全文搜索工具 - FileLocator Pro 7.0.2025 中文绿色便携版 http://www.portablesoft.org/filelocator-pro-portable/
FileLocator Pro – 无索引快速全文搜索 http://www.appinn.com/filelocator-pro/
FileLocator Pro – 无索引全文检索工具(全新中文版+赠送许可) http://www.appinn.com/filelocator-pro-gift/
FileLocator Pro是不用索引的,优点是搜索结果很全,缺点是速度相对较慢。LYX1692在他的帖子里给出了自己的妥协解决方案,也分享了文本,可以参考。
2. Archivarius 3000
jazzmood 在《[英汉-汉英] 转帖俺自己的一篇旧文——利用印象笔记 Evernote 进行跨平台双语语料检索》(https://www.pdawiki.com/forum/thread-11405-1-1.html)第10楼推荐。
参考:http://www.likasoft.com/document-search/
3. dtSearch Desktop
http://www.dtsearch.com/
这里提供一个例子。
① 把sunsmile23 的https://www.pdawiki.com/forum/thread-10797-1-1.html OALD4双解mdx导出为两万余个html,注意html首尾要加上<html><body>等标签。
<!doctype html>
<html lang="en">
<head>
</head>
<body>
</body>
</html>
② 所有html压缩,这一步可以省掉,但是压缩后显然更好,保护硬盘
③ Index
④ Search
由于文本的汉语部分没有经过分词处理,所以Index后的搜索,结果是很少的,比如搜“无聊”,只有5个结果,但是用FileLocator Pro 进行无索引搜索,则有34个结果!
好在dtSearch Desktop也可以进行Unindexed search,但是操作比较繁琐,速度也不快。
要在搜索结果(数量、排版)、索引处理之间取舍,最好的办法就是对文本进行预处理,类似Google等在线搜索引擎对互联网数据的处理,这就涉及到自然语言处理等方面的专业知识了。暂没时间、精力折腾。我觉得对于一般使用者而言,LYX1692在《[英-汉] 柯林斯、朗文、牛津、剑桥双解TXT版-【自备语料库】》(https://www.pdawiki.com/forum/thread-11546-1-1.html)分享的文本、经验已经够用了。
------
肯定有朋友会问折腾这些有什么用,我想说,没什么用,Just for fun!
http://linguistlist.org/
|
|