查看: 750|回复: 14
打印 上一主题 下一主题

[筹划] 制作 豆瓣影评 的打算!!

[复制链接]

该用户从未签到

93

主题

314

回帖

1642

积分

解元

Rank: 5Rank: 5

积分
1642

灌水大神章小蜜蜂章笑傲江湖章

跳转到指定楼层
1
发表于 2012-6-10 15:18:39 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
制作 豆瓣影评 的打算!!
自从 论坛里有人 说豆瓣的内容不错,看过后发现,豆瓣的评价很精准,值得一做.

按照 顺序 的排序 ,大概有 一百万条的数目。。


不知道,哪位仁兄 制作了。。真的不想 在重复去做的!!!
  • TA的每日心情
    慵懒
    6 天前
  • 签到天数: 7 天

    [LV.3]偶尔看看II

    1

    主题

    197

    回帖

    1252

    积分

    解元

    Rank: 5Rank: 5

    积分
    1252

    灌水大神章QQ 章

    2
    发表于 2012-6-10 18:54:25 | 只看该作者
    我觉得豆瓣读书和豆瓣影评都很好。索性一起做了吧
    没技术,纯伸手党。。。
    双手过头支持网友制作!
  • TA的每日心情
    开心
    2022-9-14 10:18
  • 签到天数: 438 天

    [LV.9]以坛为家II

    0

    主题

    1245

    回帖

    6167

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    6167
    3
    发表于 2012-6-10 19:57:56 | 只看该作者
    蓝老大想制作豆瓣影评,全力支持  据我所知 还没有人弄过
    按排序编号的网址是有上百万条  但是好像大多数都是空的 实际内容可能并不很多
    你打算怎样下载呢  如果有无为兄那总打包下载的方法  可能很容易
    否则这几十万上百万条光下载就是大问题
  • TA的每日心情
    开心
    2020-3-8 09:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    104

    主题

    1687

    回帖

    1万

    积分

    状元

    Rank: 9Rank: 9Rank: 9

    积分
    16432

    小蜜蜂章笑傲江湖章灌水大神章

    4
    发表于 2012-6-10 20:23:54 | 只看该作者
    豆瓣评论很专业,特别值得制作。支持!
  • TA的每日心情
    开心
    2020-12-11 14:18
  • 签到天数: 4 天

    [LV.2]偶尔看看I

    1

    主题

    185

    回帖

    705

    积分

    举人

    Rank: 4

    积分
    705
    5
    发表于 2012-6-10 22:17:23 | 只看该作者
    强烈支持啊。豆瓣实在是不错。能制作出来肯定会大受欢迎的。。

    该用户从未签到

    13

    主题

    454

    回帖

    3027

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3027

    灌水大神章

    6
    发表于 2012-6-10 22:22:39 | 只看该作者
    蓝老大想制作豆瓣影评,全力支持  据我所知 还没有人弄过
    按排序编号的网址是有上百万条  但是好像大多数都是空的 实际内容可能并不很多
    你打算怎样下载呢  如果有无为兄那总打包下载的方法  可能很容易
    否则这几 ...
    zywyy 发表于 2012-6-10 19:57


    不是打包下载,而是下载后打包。那是为了方便保存而做的。
    wget -i可以下载url列表,我就是这么做的。
  • TA的每日心情
    开心
    2020-12-11 14:18
  • 签到天数: 4 天

    [LV.2]偶尔看看I

    1

    主题

    185

    回帖

    705

    积分

    举人

    Rank: 4

    积分
    705
    7
    发表于 2012-6-10 22:30:02 | 只看该作者
    豆瓣很不错的。值得做。支持了。
  • TA的每日心情
    开心
    2020-5-27 13:28
  • 签到天数: 2 天

    [LV.1]初来乍到

    4

    主题

    128

    回帖

    3186

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3186
    8
    发表于 2012-6-10 23:33:58 | 只看该作者
    不是打包下载,而是下载后打包。那是为了方便保存而做的。
    wget -i可以下载url列表,我就是这么做的。
    惟吾无为 发表于 2012-6-10 22:22

    问一下老大,你是如何处理广告等页面中的无用信息的?是下载时直接设定了就不下载这些内容呢,还是下载之后合并文件再用正则表达式批处理?
    谢谢!

    该用户从未签到

    13

    主题

    454

    回帖

    3027

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3027

    灌水大神章

    9
    发表于 2012-6-11 07:43:12 | 只看该作者
    问一下老大,你是如何处理广告等页面中的无用信息的?是下载时直接设定了就不下载这些内容呢,还是下载之后合并文件再用正则表达式批处理?
    谢谢!
    whyareyou 发表于 2012-6-10 23:33

    已在发布帖回复,点我签名跳过去看。
  • TA的每日心情
    开心
    2022-9-14 10:18
  • 签到天数: 438 天

    [LV.9]以坛为家II

    0

    主题

    1245

    回帖

    6167

    积分

    会元

    Rank: 7Rank: 7Rank: 7

    积分
    6167
    10
    发表于 2012-6-11 11:01:13 | 只看该作者
    听无为兄说 wget -i可是个宝贝啊 蓝老大会玩吗?

    该用户从未签到

    13

    主题

    454

    回帖

    3027

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3027

    灌水大神章

    11
    发表于 2012-6-11 11:26:09 | 只看该作者
    wget是个宝贝。 -i是他的一个参数。
    我预先处理出url列表交给wget下载。

    该用户从未签到

    93

    主题

    314

    回帖

    1642

    积分

    解元

    Rank: 5Rank: 5

    积分
    1642

    灌水大神章小蜜蜂章笑傲江湖章

    12
     楼主| 发表于 2012-6-15 20:56:48 | 只看该作者
    有空 还是跟无为 兄 学习一下wget。。

    该用户从未签到

    13

    主题

    454

    回帖

    3027

    积分

    贡士

    Rank: 6Rank: 6

    积分
    3027

    灌水大神章

    13
    发表于 2012-6-16 20:17:36 | 只看该作者
    光学wget其实不实用,就像学linux不学bash一样。

    这次下载是由wget进行的,但没有bash负责全局调度,也不可能有序的分段下载。

    没有linux系统提供的proc文件系统,检测进程号的存在又会慢上不少。

    这些都是影响效率的细节。

    该用户从未签到

    0

    主题

    3

    回帖

    23

    积分

    被盗用户

    积分
    23
    14
    发表于 2013-1-27 06:32:01 | 只看该作者
    支持做豆瓣,书和音乐也不错。

    该用户从未签到

    0

    主题

    2

    回帖

    2

    积分

    童生

    Rank: 2

    积分
    2
    15
    发表于 2013-5-9 15:50:20 | 只看该作者
    如果楼主做出来并做的好的话,我愿意花钱买下载地址(价格合理,30元之内吧),我这个非技术党只能靠钱来支持大神了。。。。