查看: 253|回复: 2
打印 上一主题 下一主题

[求助] 如何批量查找多义词?

[复制链接]

该用户从未签到

10

主题

126

回帖

349

积分

禁止发言

积分
349
跳转到指定楼层
1
发表于 2016-2-28 02:21:43 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
请教如果我要查找一本Mdict词典里的释义超过5个的所有的多义词,应如何操作,正则表达式应如何表达,谢谢!

该用户从未签到

40

主题

177

回帖

1628

积分

版主

Rank: 10Rank: 10Rank: 10

积分
1628

灌水大神章小蜜蜂章笑傲江湖章管理组专用章

2
发表于 2016-2-28 06:29:49 | 只看该作者
这样的看你的这个词典是如何设置的。
一般的词典,都是按义项编辑的。如这样
abandon★★★☆☆
1  VERB 动词离弃;遗弃;抛弃
2  VERB 动词中途放弃,中止[活动、工作等]
3  VERB 动词放弃[想法或思路]
4  VERB 动词放纵;使沉湎于
5  N-UNCOUNT 不可数名词放任;放纵
6  See also:abandoned;

你将Mdict词典代码弄成一个单词一行。
那么只要将不含义项5的单词标注出来,剩下就是你想要的了。
具体代码不好说的,对于义项的编辑,各个词典情况不一样。
但大致都有一个固定的标签样式。
假设是这样:
<span class="Num">5</span> N-UNCOUNT 不可数名词放任;放纵

首先,你将<span class="Num">5</span>替换成一个独一无二的符号,如“★”(事先确保这个符号在词典中不存在)

这么一来,凡是出现★的,就是超过5个义项的单词行了。
查找出现★的行,正则应该会了吧。

该用户从未签到

40

主题

177

回帖

1628

积分

版主

Rank: 10Rank: 10Rank: 10

积分
1628

灌水大神章小蜜蜂章笑傲江湖章管理组专用章

3
发表于 2016-2-28 06:52:01 | 只看该作者
本帖最后由 LYX1692 于 2016-2-28 06:56 编辑

但是,你这想法有个前提问题。
那就是,你所谓的“多义词”是什么意思?
你是从汉语角度来理解英文多义词,
还是从英语本身来理解多义词?

也就是说,abandon, 离弃;遗弃;抛弃
在你看来是一个义,还是三个义?

还有一种情况,某些单词可用作多种词性,既可作动词,还可作名词。
这是不是多义?
你又打算将这类多性词怎么处理?