掌上百科 - PDAWIKI
»
首页
›
交流专区 - Discussion
›
词库制作交流区 - Dictionary-Making
›
如何抓取网页,自己制作词典?
查看:
520
|
回复:
4
[求助]
如何抓取网页,自己制作词典?
[复制链接]
ll080808
ll080808
当前离线
积分
228
该用户从未签到
1
主题
50
回帖
228
积分
童生
童生, 积分 228, 距离下一级还需 72 积分
童生, 积分 228, 距离下一级还需 72 积分
积分
228
发消息
电梯直达
1
楼
发表于 2016-5-31 10:57:49
|
只看该作者
|
倒序浏览
|
阅读模式
想自己做个词典,请问如何抓取网页并转换格式,没有找到详细的教程。
回复
举报
sky66
sky66
当前离线
积分
259792
该用户从未签到
19
主题
593
回帖
25万
积分
状元
积分
259792
发消息
2
楼
发表于 2016-5-31 11:16:44
|
只看该作者
[索引] 【史上最全】在线词典抓取、制作技术汇总
https://www.pdawiki.com/forum/fo ... hread&tid=13219
点评
回复
支持
反对
评分
举报
lwangls
lwangls
当前离线
积分
898
该用户从未签到
20
主题
251
回帖
898
积分
禁止发言
积分
898
发消息
3
楼
发表于 2016-6-1 11:00:56
|
只看该作者
1. 找出网址规律
2. 爬虫下载网页
3. 正则表达式提取需要的内容
现在很多网站有反采集措施,需要用代理换IP等
点评
回复
支持
反对
评分
举报
PurlingNayuki
PurlingNayuki
当前离线
积分
4442
该用户从未签到
24
主题
701
回帖
4442
积分
翰林院修撰
不傲嬌的傲嬌
积分
4442
发消息
4
楼
发表于 2016-6-3 10:24:25
|
只看该作者
想做飯,請問如何炒菜做飯。
想成功,請問如何成功。
建議 po 主提問更加有針對性一些,否則也就只能告訴你「找出規律、抓取數據、抽出內容」,實際不懂的還是不懂。
点评
meigen
现在不动脑筋就伸手的人太多了,总想着别人能喂到他嘴里。然而如果告诉他“自己动手动脑”时,又会有某委员不服,并上来批判一番。
发表于 2016-6-3 11:32
点评
回复
支持
反对
评分
举报