该用户从未签到
93
314
1642
解元
举报
签到天数: 7 天
[LV.3]偶尔看看II
1
197
1252
评分 举报
签到天数: 438 天
[LV.9]以坛为家II
0
1245
6167
会元
签到天数: 1 天
[LV.1]初来乍到
104
1687
1万
状元
签到天数: 4 天
[LV.2]偶尔看看I
185
705
举人
13
454
3027
贡士
蓝老大想制作豆瓣影评,全力支持 据我所知 还没有人弄过 按排序编号的网址是有上百万条 但是好像大多数都是空的 实际内容可能并不很多 你打算怎样下载呢 如果有无为兄那总打包下载的方法 可能很容易 否则这几 ... zywyy 发表于 2012-6-10 19:57
签到天数: 2 天
4
128
3186
不是打包下载,而是下载后打包。那是为了方便保存而做的。 wget -i可以下载url列表,我就是这么做的。 惟吾无为 发表于 2012-6-10 22:22
问一下老大,你是如何处理广告等页面中的无用信息的?是下载时直接设定了就不下载这些内容呢,还是下载之后合并文件再用正则表达式批处理? 谢谢! whyareyou 发表于 2012-6-10 23:33
3
23
被盗用户
2
童生