查看: 520|回复: 4
打印 上一主题 下一主题

[求助] 如何抓取网页,自己制作词典?

[复制链接]

该用户从未签到

1

主题

50

回帖

228

积分

童生

Rank: 2

积分
228
跳转到指定楼层
1
发表于 2016-5-31 10:57:49 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
想自己做个词典,请问如何抓取网页并转换格式,没有找到详细的教程。

该用户从未签到

19

主题

593

回帖

25万

积分

状元

Rank: 9Rank: 9Rank: 9

积分
259792

灌水大神章小蜜蜂章笑傲江湖章

2
发表于 2016-5-31 11:16:44 | 只看该作者
[索引] 【史上最全】在线词典抓取、制作技术汇总
https://www.pdawiki.com/forum/fo ... hread&tid=13219

该用户从未签到

20

主题

251

回帖

898

积分

禁止发言

积分
898
3
发表于 2016-6-1 11:00:56 | 只看该作者
1. 找出网址规律
2. 爬虫下载网页
3. 正则表达式提取需要的内容

现在很多网站有反采集措施,需要用代理换IP等

该用户从未签到

24

主题

701

回帖

4442

积分

翰林院修撰

不傲嬌的傲嬌

Rank: 12Rank: 12Rank: 12

积分
4442

灌水大神章小蜜蜂章笑傲江湖章翰林院专用章管理组专用章

4
发表于 2016-6-3 10:24:25 | 只看该作者
想做飯,請問如何炒菜做飯。
想成功,請問如何成功。

建議 po 主提問更加有針對性一些,否則也就只能告訴你「找出規律、抓取數據、抽出內容」,實際不懂的還是不懂。

点评

现在不动脑筋就伸手的人太多了,总想着别人能喂到他嘴里。然而如果告诉他“自己动手动脑”时,又会有某委员不服,并上来批判一番。  发表于 2016-6-3 11:32