查看: 1378|回复: 1
打印 上一主题 下一主题

[讨论] Tidy-HTML5用于mdx源文件的技巧

[复制链接]
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    73

    主题

    1552

    回帖

    9万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    96973

    QQ 章笑傲江湖章灌水大神章推广专家

    跳转到指定楼层
    1
    发表于 2019-1-7 11:10:20 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 VimVim 于 2019-1-7 20:35 编辑

    看到@garypang 的如下帖子,介绍Tidy是个大杀器,能将html格式化的同时自动修复html里的错误:

    MDX词组提取 - 从正则进阶到头发护理  https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=26645

    我去官网下载了最新的版本:http://binaries.html-tidy.org/
    并做了一些试验,下图左边为源文件,右边为tidy处理后的,发现如下问题
    1、添加了不必要的<html><head>等网页头内容,造成词条错误
    2、将</>与下一个keyword行合并,造成mdx源文件格式错误
    3、将</>转化为可读性差的& l t ; / & g t ;



    本帖被以下淘专辑推荐:

    • · 中医|主题: 7, 订阅: 0
  • TA的每日心情
    奋斗
    2019-10-13 07:34
  • 签到天数: 209 天

    [LV.7]常住居民III

    73

    主题

    1552

    回帖

    9万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    96973

    QQ 章笑傲江湖章灌水大神章推广专家

    推荐
     楼主| 发表于 2019-1-7 20:13:31 | 只看该作者
    看了以下配置文档,总算了解了,但解决问题还需要绕几弯:
    http://api.html-tidy.org/tidy/quickref_5.6.0.html

    针对上贴问题的解决:
    Q1:配置tidy configy.txt文件:show-body-only: yes
    Q2和Q3:
    (1)需暂时将</>替换为<mdx/>,将关键字设置为<keyword>关键字</keyword>
    (2)配置tidy configy.txt文件:new-empty-tags: mdx以及new-blocklevel-tags: keyword
    (3)待tidy完成之后,再将<mdx/>恢复为</>,将<keyword>和</keyword>删除

    评分

    1

    查看全部评分