查看: 759|回复: 4
打印 上一主题 下一主题

[求助] 制作Mdx字典时的一个难题

[复制链接]

该用户从未签到

14

主题

112

回帖

1032

积分

解元

Rank: 5Rank: 5

积分
1032
跳转到指定楼层
1
发表于 2009-2-18 13:40:54 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
我在制作compact html格式的txt时,有一个关键词词条后面误操作加入了很长的空白键(大概有2,3千个字节吧),在将这txt文件转成mdx时,mdxbuilder报告出现一个错误位置,16000000左右,在ultraedit中只懂得用选取方式(ctrl+shift+pagedown键)定位(这还是从zhu1234曾经发过的一个贴里学会的,谢谢他:)这么大的数字,搞得我花了好长时间才定位到这个位置,但却发现在这个字节处并没有出现问题啊,是mdxbuilder搞错了吗?还是我的txt文件有误?
我也尝试将这txt文件换成kdic格式的,同样mdxbuilder报错的地方和实际不一样,我只好在mdxbuilder定位的地方上下查询,最后才找到这个后面加了很长的空白位的关键词条.
大家有没有试过这样的问题?
我尝试将两个txt测试文件(一个是html格式,一个是kdic格式)传上来,大家帮忙看一下如何正确定位.
谢谢~

test.rar

830 Bytes, 下载次数: 7, 下载积分: 米 -5 粒

测试文件

该用户从未签到

57

主题

214

回帖

1307

积分

解元

Rank: 5Rank: 5

积分
1307

灌水大神章笑傲江湖章小蜜蜂章

QQ
2
发表于 2009-2-18 15:42:49 | 只看该作者
你的意思是如何快速找到关键字过长的词条是吧?
这个问题还真没碰到过。
不妨这样啊,kdict格式都有\t是吧,那么在emeditor里查找\t(勾选转义符),然后因emeditor会高亮显示搜索结果,而关键字过长的词条的高亮位置和普通的一定很不同,这样你用肉眼就不难找到BUG的词条咯。

[ 本帖最后由 tony4d 于 2009-2-18 15:44 编辑 ]

该用户从未签到

14

主题

112

回帖

1032

积分

解元

Rank: 5Rank: 5

积分
1032
3
 楼主| 发表于 2009-2-18 20:46:06 | 只看该作者

回复 2楼 tony4d 的帖子

嗯,那我要装一个emeditor来试一下了.谢谢!
我查了一下ultraedit的正则语法,可以用[ ^t]+$来找到这样的行.
不过我还有一个疑问,为什么mdxbuilder报告的错误定位和实际为什么不一样~

该用户从未签到

45

主题

1420

回帖

1万

积分

管理员

Rank: 13Rank: 13Rank: 13Rank: 13

积分
10971

管理组专用章

4
发表于 2009-2-19 00:30:08 | 只看该作者
如果确认是一堆空行,直接查找多个空白符号就行了。。。
UltraEdit里面可以直接按Ctrl-G 来输入位置,直接跳转。MdxBuilder报告的是出错记录的第一个字符的位置

该用户从未签到

14

主题

112

回帖

1032

积分

解元

Rank: 5Rank: 5

积分
1032
5
 楼主| 发表于 2009-2-19 09:32:50 | 只看该作者

回复 4楼 rayman 的帖子

明白了,谢谢!