查看: 414|回复: 6
打印 上一主题 下一主题

[求助] 请教 MDX解包后 样式规则如何还原成文本?

[复制链接]
  • TA的每日心情
    开心
    前天 18:05
  • 签到天数: 708 天

    [LV.9]以坛为家II

    28

    主题

    1178

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    27051
    跳转到指定楼层
    1
    发表于 2021-3-11 11:41:47 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
    本帖最后由 nullname 于 2021-3-11 11:43 编辑

    刚刚解包了一个MDX文件,发现里面的格式是这样:




    imgbb图片备份:https://i.ibb.co/6yn4jJm/3.jpg

    然后还发现了一个样式规则文本style.txt:



    imgbb图片备份:https://i.ibb.co/HtBs6Hf/2.jpg


    求助是否有什么方便的方法或工具能将样式信息(图二)还原至源MDX解压出的TXT文本(图一)当中去?

    没找到悬赏的按钮,若有帮助我会以点评或其他形式支付米。
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    2
    发表于 2021-3-11 12:52:45 | 只看该作者
    nullname 兄,不用懸賞,這個是 mdxbuilder HTML compact 的格式,解出後有 style.txt 是它的格式,你若要如圖上的格式,僅能對照 那style.txt 用正則去還原
  • TA的每日心情
    开心
    前天 18:05
  • 签到天数: 708 天

    [LV.9]以坛为家II

    28

    主题

    1178

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    27051
    3
     楼主| 发表于 2021-3-11 13:03:40 | 只看该作者
    喬治兄 发表于 2021-3-11 12:52
    nullname 兄,不用懸賞,這個是 mdxbuilder HTML compact 的格式,解出後有 style.txt 是它的格式,你若要 ...

    谢谢喬治兄,就是在用正则替换的时候发现有些嵌套的层数多一点,有些少一点,还有些标签此有彼无,很费脑筋。所以特地发帖来论坛问问有没有前人造好了轮子能直接还原的..
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    4
    发表于 2021-3-11 13:15:19 | 只看该作者
    本帖最后由 喬治兄 于 2021-3-11 13:28 编辑
    nullname 发表于 2021-3-11 13:03
    谢谢喬治兄,就是在用正则替换的时候发现有些嵌套的层数多一点,有些少一点,还有些标签此有彼无,很费脑 ...


    nullname 兄:
    先還原 `1`, `2`,`3`................
    1:
    <b style="font-size:180%;">
    後再以
    尋找  ==> <b style="font-size:180%;">(.*?)<
    替代成==> <b style="font-size:180%;">$1</b><
    大概如此吧!我正則不太會....你試試,應該能成吧
    箝套的部份....我真不知如何處理

    评分

    1

    查看全部评分

  • TA的每日心情
    开心
    前天 18:05
  • 签到天数: 708 天

    [LV.9]以坛为家II

    28

    主题

    1178

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    27051
    5
     楼主| 发表于 2021-3-11 13:36:27 | 只看该作者
    喬治兄 发表于 2021-3-11 13:15
    nullname 兄:
    先還原 `1`, `2`,`3`................
    1:

    谢谢喬治兄,已经用正则硬上了,漏网之鱼一个个手工解决
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    6
    发表于 2021-3-11 13:40:30 | 只看该作者
    本帖最后由 喬治兄 于 2021-3-11 14:37 编辑
    nullname 发表于 2021-3-11 13:36
    谢谢喬治兄,已经用正则硬上了,漏网之鱼一个个手工解决


    仁兄太客氣了,還原我也沒試過....我的正則更是不行,只是一個大概的想法,希望沒有誤導你.....
    應該是不會有箝套的,因為 HTML compact 的處理,我不知道 mdxbuilder 如何以如此簡單的編輯來判斷箝套的架構,因為沒有其他標簽明示斷點在哪,所以應該僅能以下一個標簽為斷點,mdxbuilder 應該是無法判斷,HTML compact 應該是沒有箝套的,因為到另一個標簽前就已經是一個斷點,若是有箝套架構應該是不合理也做不到吧!
    所以有箝套架構應該是不會用 HTML compact 來編輯的
    因成形的架構如此,應該是不會有漏網之魚

    bee larva
    `1`bee larva`2``2`
    蜜蜂幼蟲</br>
    </>




    `2`

    這是剛好此欄是空的,
    所以在結合時會出現 2 個
    `2``2`




    HTML compact 的方法應該是適用於編輯資料如 excel 那樣的表格,每一欄都有固定的格式,若哪一個 cell 的資料是空的,就會有留下標簽,但資料是空的狀況,來維持格式

    但此並非箝套架構.....如此而以
  • TA的每日心情
    开心
    前天 18:05
  • 签到天数: 708 天

    [LV.9]以坛为家II

    28

    主题

    1178

    回帖

    2万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    27051
    7
     楼主| 发表于 2021-3-11 18:18:04 | 只看该作者
    喬治兄 发表于 2021-3-11 13:40
    仁兄太客氣了,還原我也沒試過....我的正則更是不行,只是一個大概的想法,希望沒有誤導你.....
    應該是不 ...

    对着一堆1234看了大半天,最后看出些规律了,确实没有嵌套,我之前没仔细看,有点浮躁..叹气.. 问题已经解决