查看: 2277|回复: 18
打印 上一主题 下一主题

[索引] Python 专贴[...]

  [复制链接]

该用户从未签到

2121

主题

2961

回帖

6万

积分

翰林院修撰

不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

Rank: 12Rank: 12Rank: 12

积分
61056

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

跳转到指定楼层
1
发表于 2017-11-16 20:06:08 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 Oeasy 于 2017-11-17 10:08 编辑


大家有遇到** Python 方面的问题,不妨跟帖,说不定……

PDAWIKI 和 Python 的基情所在:
- [索引] GitHub 等地和词典有关的 http://www.pdawiki.com/forum/thread-16586-1-1.html

感谢诸位的分享。

::
- readmdict.py https://bitbucket.org/xwang/mdict-analysis
- writemdict.py https://github.com/skywind3000/writemdict

- 最新版 writemdict 生成大型mdx 解决 MdxBuilder 词条多崩溃问题 https://www.pdawiki.com/forum/thread-20577-1-1.html
    - https://github.com/skywind3000/writemdict


::光盘提取
- https://github.com/superfan89/IDMSKconv 注意,只能提取某些光盘。

- pyglossary http://t.cn/RzcE4RQ {晕。。。英文也屏蔽,转了短链接}
  - [索引] bgl 转 mdx / txt 的一点经验[20170919] http://www.pdawiki.com/forum/thread-21725-1-1.html

::爬虫:
- http://www.pdawiki.com/forum/space-uid-176917.html https://github.com/OZv?tab=repositories
- CALD http://www.pdawiki.com/forum/for ... &fromuid=147948

::
- https://github.com/PurlingNayuki/UniversalDictTools-DictUtils

- CC-CEDICT 制作脚本 http://www.pdawiki.com/forum/thread-14040-1-1.html
- FOLDOC 制作脚本 http://www.pdawiki.com/forum/thread-16004-1-1.html
- 金山词霸提取脚本 http://www.pdawiki.com/forum/thread-7100-1-1.html 注意,只能提取某些版本的某些词典
- 有道词典提取脚本 http://www.pdawiki.com/forum/thread-7022-1-1.html 注意,只能提取 n 年前有道词典的离线数据

- [索引] 写了个小脚本自动做 / 短语拆分 http://www.pdawiki.com/forum/thread-18376-1-1.html

:: GoldenDict 外部程序

- [GoldenDict] GoldenDict 调用外部程序制作词典 (2017/10/17) http://www.pdawiki.com/forum/thread-21878-1-1.html

- [作品展示] GoldenDict + Python 调用有道翻译[...] http://www.pdawiki.com/forum/thread-21988-1-1.html
- [作品展示] [完成] 商务版 蓝登书屋 韦氏英汉大学词典 图片版 http://www.pdawiki.com/forum/thread-22021-1-1.html

- [作品展示] GoldenDict + Python 调用谷歌翻译[...]  http://www.pdawiki.com/forum/thread-22027-1-1.html

- [索引] zz 终端查词 http://www.pdawiki.com/forum/thread-22032-1-1.html
- [索引] zz Online dictionary based on the console,基于控制台的在线词典 http://www.pdawiki.com/forum/thread-22031-1-1.html
- [索引] zz python-translate(Python 命**行词典) http://www.pdawiki.com/forum/thread-22028-1-1.html

- [索引] zz 使用Python开发跨平台的单词助记程序 http://www.pdawiki.com/forum/thread-21978-1-1.html

- 文字版 PDF 转 HTML https://github.com/coolwanglu/pdf2htmlEX

评分

5

查看全部评分

本帖被以下淘专辑推荐:

  • · 工具|主题: 61, 订阅: 28

该用户从未签到

95

主题

554

回帖

2万

积分

翰林院编修

终身学习者

Rank: 11Rank: 11Rank: 11Rank: 11

积分
24557

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

推荐
发表于 2017-11-17 13:59:08 | 只看该作者
本帖最后由 henices 于 2017-11-17 14:00 编辑
Oeasy 发表于 2017-11-17 10:05
我突然想到,是不是可以利用 Python 在 GoldenDict 上实现我的夙愿?

- [GoldenDict] 如何实现重复播放查 ...


cvlc --play-and-exit "http://dict.youdao.com/dictvoice?type=1&audio=hello"
cvlc --loop "http://dict.youdao.com/dictvoice?type=1&audio=hello"

该用户从未签到

2121

主题

2961

回帖

6万

积分

翰林院修撰

不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

Rank: 12Rank: 12Rank: 12

积分
61056

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

推荐
 楼主| 发表于 2017-11-16 20:23:22 | 只看该作者


假设我是某大词典的编纂者,我可以编几个脚本,定期把各大在线**词典的词头爬一遍,和自己现有词典的词头对比一下,把别人收录了自己尚未收录的给加进去……


该用户从未签到

2121

主题

2961

回帖

6万

积分

翰林院修撰

不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

Rank: 12Rank: 12Rank: 12

积分
61056

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

3
 楼主| 发表于 2017-11-16 20:33:25 | 只看该作者

利用这个 https://github.com/xpgeng/advanced_freeq 可以实现
::A Python script to generate word frequency report of English text, pdf, epub, mobi.
- 有人这么背过单词吗?找本书,先list生词,背完后去看书。 http://www.pdawiki.com/forum/thread-20773-1-1.html



该用户从未签到

2121

主题

2961

回帖

6万

积分

翰林院修撰

不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

Rank: 12Rank: 12Rank: 12

积分
61056

翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

4
 楼主| 发表于 2017-11-16 20:57:51 | 只看该作者

- 基于Python自然语言处理工具包在语料库研究中的运用 http://kns.cnki.net/KCMS/detail/ ... ename=KMYJ201505012
基于Python自然语言处理工具包在语料库研究中的运用_**旭.pdf (487.88 KB, 下载次数: 10)
- 基于语料库的非**专业学生写作词汇衔接手段研究 http://kns.cnki.net/KCMS/detail/ ... ename=2010129315.nh
- 基于**口语语料库的新通用词词表效度研究 http://kns.cnki.net/KCMS/detail/ ... ename=1015909971.nh


评分

1

查看全部评分

  • TA的每日心情
    开心
    2023-2-22 17:39
  • 签到天数: 1752 天

    [LV.Master]伴坛终老

    1

    主题

    1834

    回帖

    3万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    33981

    灌水大神章

    6
    发表于 2017-11-17 05:45:13 | 只看该作者
    感谢O大的整理和分享!自己也算是经常逛论坛了,居然没发现论坛有这么多好东西。O大有心了!

    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    7
     楼主| 发表于 2017-11-17 10:05:35 | 只看该作者

    我突然想到,是不是可以利用 Python 在 GoldenDict 上实现我的夙愿?

    - [GoldenDict] 如何实现重复播放查询词或者播放所有音频?  http://www.pdawiki.com/forum/thread-21905-1-1.html


    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    9
     楼主| 发表于 2017-11-17 17:14:06 | 只看该作者
    本帖最后由 Oeasy 于 2017-11-17 17:15 编辑
    henices 发表于 2017-11-17 13:59
    cvlc --play-and-exit "http://dict.youdao.com/dictvoice?type=1&audio=hello"
    cvlc --loop "http://dic ...



      Cool!

    留俩简单代码,备案。

    Windows 下,会用默认的播放器,播放  us_stencil1.wav 文件。

    1. import webbrowser

    2. wav_file = r"D:\us_stencil1.wav"
    3. webbrowser.open(wav_file)
    复制代码




    1. import os

    2. wav_file = r"D:\us_stencil1.wav"
    3. os.startfile(wav_file)
    复制代码




    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    10
     楼主| 发表于 2017-11-17 17:15:52 | 只看该作者

    这个很有意思,感兴趣的朋友可以试试。
    http://www.pdawiki.com/forum/for ... &fromuid=147948


    该用户从未签到

    2121

    主题

    2961

    回帖

    6万

    积分

    翰林院修撰

    不忘初心。送分大人,灌水砖家。擅长抛砖引玉,挖坑不填。

    Rank: 12Rank: 12Rank: 12

    积分
    61056

    翰林院专用章灌水大神章笑傲江湖章小蜜蜂章管理组专用章

    11
     楼主| 发表于 2017-12-26 23:35:26 | 只看该作者
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    12
    发表于 2018-1-4 23:07:39 | 只看该作者
    本帖最后由 喬治兄 于 2018-11-13 10:41 编辑

    文字版 PDF 转 HTML https://github.com/coolwanglu/pdf2htmlEX- m5
    The code seems not working.....

  • TA的每日心情
    开心
    2023-1-18 23:24
  • 签到天数: 211 天

    [LV.7]常住居民III

    427

    主题

    4539

    回帖

    9万

    积分

    超级版主

    Rank: 12Rank: 12Rank: 12

    积分
    92011

    灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章城管大队长

    13
    发表于 2018-11-6 09:12:56 | 只看该作者
    本帖最后由 kyletruman 于 2018-11-6 09:14 编辑
    喬治兄 发表于 2018-1-4 23:07
    "文字版 PDF 转 HTML https://github.com/coolwanglu/pdf2htmlEX- m5 "
    The code seems not working.....

    你提供的网址打不开,请重新编辑帖子,勾选右上角的“纯文本”,然后再保存帖子,超链接才能正常显示
  • TA的每日心情
    开心
    2018-8-8 03:13
  • 签到天数: 1 天

    [LV.1]初来乍到

    254

    主题

    4264

    回帖

    7万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    79050

    小蜜蜂章笑傲江湖章灌水大神章QQ 章

    QQ
    14
    发表于 2018-11-6 10:11:40 | 只看该作者
    kyletruman 发表于 2018-11-6 09:12
    你提供的网址打不开,请重新编辑帖子,勾选右上角的“纯文本”,然后再保存帖子,超链接才能正常显示{:4_9 ...

    kyletruman 兄:
    好像那個鍊也是掛了
  • TA的每日心情
    擦汗
    2019-11-13 23:25
  • 签到天数: 44 天

    [LV.5]常住居民I

    3

    主题

    56

    回帖

    863

    积分

    举人

    Rank: 4

    积分
    863
    15
    发表于 2018-11-12 13:27:44 | 只看该作者
    学习了,辛苦楼主
  • TA的每日心情
    开心
    2019-8-21 08:44
  • 签到天数: 163 天

    [LV.7]常住居民III

    17

    主题

    393

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    14980
    16
    发表于 2018-11-16 10:49:53 | 只看该作者
    分享一个简繁-繁简转换 python 包

    1. pip install opencc-python-reimplemented
    复制代码


    原 opencc-python 包在 python3 里装不了,有人说要整什么 distribute_setup.zip, 某*sdn上居然有人50 个点卖这个文件 ,买者跟帖还说没有用。

    想着说不定有网友也在折腾繁简转换,希望有人看到可以节省一点时间。

    该用户从未签到

    0

    主题

    52

    回帖

    133

    积分

    禁止发言

    积分
    133
    19
    发表于 2020-2-3 15:00:56 | 只看该作者
    Thanks for your great work.