TA的每日心情 | 奋斗 2021-4-4 16:28 |
---|
签到天数: 353 天 [LV.8]以坛为家I
状元
- 积分
- 10889
|
今天想提取这本字典中的辨析和搭配部分,但是没想到折腾了一天一直都失败,要么提示内存不足根本打不开,要么分割之后再进行正则匹配,除了异常缓慢之外,还一直发生未知错误(表达式应该是没写错的)。
我知道朗文单独的搭配词典和同义辨析词典已经有了,但是那都是纯英文的,我还是想弄个双解的用来阅读。
那么问题来了,为啥这本词典的文件如此大。。?各位大佬,求解!
之前garypang大佬的词组提取帖子我也看了,有人说是因为图片都是以啥64格式存在里面的?但是我把所有图片地址都匹配删除了,也只不过小了几十兆而已。。。困惑中。 |
|