本帖最后由 惟吾无为 于 2014-1-4 15:25 编辑
开源, GPLv2协议. 不会用git. 临时传到百度盘.
下载链接: http://pan.baidu.com/s/1nt7CIRR#dir/path=%2Fqlvwp%2Fqlvwp
重大更新, 2013年12月30日18:24之前下载的请重新下载. 现在windows上使用自带的lua可以直接打开2G大文件了.
本人于1月5日回家, 之后一个半月内没有网络, 期间回复将在元宵后统一处理. (如果过年走亲戚可能提前处理回复下)
-- zip包有份使用说明, 下面都是废话, 可以不看的 --
在linux上使用wine运行mdxbuilder很慢。所以今后我很会少转mdx。但尽力提供数学公式的更新(过年后会尝试加入zhwiki图片更新)
灰色文字于2013年12月30日18:24失效 |
现在发帖是写注意事项的,我怕明天忘了(话说我一直试图让解析器能直接在windows上运行,结果刚才才发现好几个lua解释器都只能处理2G内的文件。)
0. 所有脚本都在linux下编写测试, 理论上windows能用, 但不做保证. 编辑脚本时请使用utf8编码, unix换行符.
1. 有能力的网友可自行编译支持大文件的lua解释器。否则参考第二条处理。
2. lua解释器只能打开2G内的文件时,请先使用xml分割工具分割,然后拼接。(别用qlvwp自带的分割拼接脚本,依赖lua, 同样不起作用的)
|
预期的解析器(lvwp)速度太慢,随着我对维基的了解越来越深,才终于发现这是个多么庞大的系统了,3年前的想法如今还是实现不了,所以出现了这个版本。
本版本不再试图实现维基的环境,而是保证速度,尽量针对性地人工实现一部分功能(到时模板就是直接运行对应函数,而非处理Template空间的对应页面了)。
qlvwp包括解析器(quick_wiki_parser.lua)和数学公式转换器(convformula.lua)。并额外提供了wiki xml的分割工具和文本合并工具以及xml索引工具及单个词条提取工具。
转换策略如下:
1. 先用数学公式转换器生成数学公式对照文件。(到时可使用我提供的对照文件可跳过此步. 记住附上对应的图片mdd)
2. 用解析器处理维基标记文本。(读取数学公式对照文件来确定数学公式的图片名)
*** 提示: 解析器限于lua, 只能使用单核, 如果你是多核电脑又很赶时间, 可先分割成多个小文件, 然后开多个进程来处理它们.
功能对比. 图例:√实现 ×未实现 ○小部分实现 ◎大部分实现
功能 | 关键字 | qlvwp | mediawiki
| 粗体/斜体 | '''/'' | √ | √
| 链接 | [...]/[[...]] | ○1 | √
| 表格 | {|...|} | √ | √
| 公式 | <math> | √ | √
| 模板 | {{...}} | ×2 | √
| 列表 | (空格)*#;:- | √ | √
| 标题 | =...= | ◎3 | √
| 图片 | [[File:]] | ○4 | √
| nowiki | <nowiki>/<pre> | √ | √
| 引用 | <ref> | × | √
| 相册 | <gallary> | × | √
| 字词转换 | -{...}- | ×5 | √
| 更多特性未支持... |
注释:
1. 基础的web外接, 站内链接实现了. 图片链接直接返回原始文件名. 跨站链接未处理(转储文件从0.7版好像都没了), 姊妹项目未处理. 分类链接未处理. 就记得这些了...
2. 暂时显示出模板名和所有参数. 可用css屏蔽整个模板块, 或仅屏蔽参数块.
3. 给标题们加id锚点了, 非url字符使用维基的.XX格式. 但没有生成索引. 需要的话我下次写.
4. 图片链接只返回文件名, 其他的都丢弃了.
5. 暂时没有字词转换. 今后可能实现, 可能不. 同胞們學習下正體中文唄.
界面都是命令行。理论上cmd下亦可运行,未测试。
使用说明见usage.txt |