掌上百科 - PDAWIKI
»
首页
›
交流专区 - Discussion
›
词库制作交流区 - Dictionary-Making
›
Tidy-HTML5用于mdx源文件的技巧
查看:
1378
|
回复:
1
[讨论]
Tidy-HTML5用于mdx源文件的技巧
[复制链接]
VimVim
VimVim
当前离线
积分
96973
TA的每日心情
奋斗
2019-10-13 07:34
签到天数: 209 天
[LV.7]常住居民III
73
主题
1552
回帖
9万
积分
状元
积分
96973
发消息
电梯直达
1
楼
发表于 2019-1-7 11:10:20
|
只看该作者
|
只看大图
|
倒序浏览
|
阅读模式
本帖最后由 VimVim 于 2019-1-7 20:35 编辑
看到
@garypang
的如下帖子,介绍Tidy是个大杀器,能将html格式化的同时自动修复html里的错误:
MDX词组提取 - 从正则进阶到头发护理
https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=26645
我去官网下载了最新的版本:
http://binaries.html-tidy.org/
并做了一些试验,下图左边为源文件,右边为tidy处理后的,发现如下问题
:
1、添加了不必要的<html><head>等网页头内容,造成词条错误
2、将</>与下一个keyword行合并,造成mdx源文件格式错误
3、将</>转化为可读性差的& l t ; / & g t ;
本帖被以下淘专辑推荐:
·
中医
|
主题: 7, 订阅: 0
回复
举报
VimVim
VimVim
当前离线
积分
96973
TA的每日心情
奋斗
2019-10-13 07:34
签到天数: 209 天
[LV.7]常住居民III
73
主题
1552
回帖
9万
积分
状元
积分
96973
发消息
推荐
楼主
|
发表于 2019-1-7 20:13:31
|
只看该作者
看了以下配置文档,总算了解了,但解决问题还需要绕几弯:
http://api.html-tidy.org/tidy/quickref_5.6.0.html
针对上贴问题的解决:
Q1:配置tidy configy.txt文件:show-body-only: yes
Q2和Q3:
(1)需暂时将</>替换为<mdx/>,将关键字设置为<keyword>关键字</keyword>
(2)配置tidy configy.txt文件:new-empty-tags: mdx以及new-blocklevel-tags: keyword
(3)待tidy完成之后,再将<mdx/>恢复为</>,将<keyword>和</keyword>删除
评分
1
查看全部评分
jonah_w
点评
回复
支持
1
反对
0
评分
举报