本帖最后由 淳帅二代 于 2021-11-26 09:14 编辑
数据源
Abbreviations.com 大概是全世界最全的英语缩略资源词库,它的释意都是网友贡献,如果你恰好知道一些缩略词,而网站上没有,那么可以注册账号进行提交,你也可以为喜欢的词条解释投票,让它的评分、流行度更高。
其实还有许多其它缩略词网站,但查出的释意,质量都不咋地,有些小众的词就根本查不到,还是这种靠网友贡献、评分后的数据又好又全。
这份 SQLite 数据库文件中的 Abbreviations 表单,保存了从 Abbreviations.com 网站抓取的,截至 2021 年 11 月 23 日的全部缩略词数据。
这个网站是在美国,国内访问速度慢 我在图书馆,网络环境差
在有大量缩略词查的时候,体验不好。
因此将其所有的词条抓取了下来,方便本地查询。
由于词条数量太多,如果使用 csv、文本文件,几乎没有软件可以快速查询,因此将其保存到了 SQLite 数据库,查找、检索、筛选都是以毫秒计的速度。同时,还可以使用可视化数据库软件进行操作、查询,比较方便。
我本人不会做 mdx 词典,目前也没有时间学,所以希望有大佬可以将其制作成 mdx 格式。
数据量
Abbreviations 表单总共保存了 259,498 个缩略词条的 1,219,769 个解释(有时候一个缩略词有多个不同的解释),这两个数字是用下面的语句得到的:
- select count(*)
- from Abbreviations
- where rowid in (
- select rowid
- from Abbreviations
- group by Term
- );
-
- select count(*)
- from Abbreviations
- where rowid in (
- select rowid
- from Abbreviations
- group by PageNum
- );
复制代码
截图展示
表单结构Abbreviations 表单有 6 个 Column,分别是:
Term 缩略词条 Definition 该词条的解释 Rank 该解释的 Popular Rank,即流行度排行(值越小,越靠前),一个缩写词条可能有许多个解释,最流行的那个,也最有可能是你想找的 ParCatetory Parent Category,父分类 ChldDirectory Child Category,子分类
其中,这些 Column:
Term Definition ParCatetory ChldDirectory
在搜索时,都不用区分大小写。
如果不做索引,整个数据库只要占 83MB,做了索引后会让文件体积增大,但做索引可以让查询速度有很大提升,例如:
无索引时,查询 asap 花费时间 138ms 有索引时,查询 asap 花费时间 8ms
不过,也就零点几秒的差异,做不做索引,关系其实不大。
下载链接
文件大小:97.08MB
就分享这么一次,如果哪天链接失效,不再补链
|