lynfr8 发表于 2012-4-30 06:56:31

回复 27# sanmoking

研究了一个通宵,铩羽而归,恐怕研究结果要让你失望了...
基本可以得出以下结论:那个拉取百度文库的网站[千度文库]估计不是绕过百度的积分下载机制免积分拉取文档,而是真正消费了积分下载文档到它的服务器!

有两点可以佐证:
A.百度检验机制:登录后返回cookie的BDUSS认证用户身份+下载文档通过服务器验证积分额,譬如某用户登录后下载某付费或免费链接为:
http://wapwenku.baidu.com/download/d4c86321bcd126fff7050b4f? ssid=cc097abce40f0c3699409712f89ef03d.3.1335732945.1.mKjEzMzzMxXy&from=0&bd_page_type=1&uid=wpass_1335733777_647&pu=sl@1,pw@1000,sz@224_220,pd@1,fz @2,lp@35,tpl@color,&st=1&wk=dl&dt=2(这里以wap模式举例是因为可以直接点击下载,无需像www百度文库弹出积分提示要用户二次确认是否要下载)
未登录用户根 本无法获取到ssid,因为非登陆状态下这个ssid是无法在网页源代码或返回数据得到的,而这个下载链接的参数应该是由服务器验证用户已登录并根据用户的 BDUSS自动计算生成的。能否模拟这种链接?答案是非常有挑战!譬如: BDUSS=XRmbU9kUndMQnRsV2lmbk11NEVFb0t3QmNWLU5uYlR5Vlpua1ZqNGEtSjVTa1pIQXdBQUFBJCQAAAAAAAAAAAEAAACjJ1ICYWZjbjAwNwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAHm9Hkd5vR5Hx
有192位之长,里面包括大小写英文,数字,所以BDUSS总数就是(26+26+10)的192次方,172次方就是无尽大了 ,那192次方更是无穷大了;再且除非是解密专家,否则也无法计算出BDUSS与下载链接的方法。

B.[千度文库]目前收录文章数大概四万八千四百多份,从这个链接即可看到:http://www.xxuoo.com/info/view.asp?id=48429,自己改改后面的id数和看它的网页内容 就知道了;
如果按照平均每份文档2个积分计算拉取的代价无非才是10W左右积分,这个通过巨量百度马甲帐号互刷完全是可以轻松拥有如此额度的积分;
既然积分不成问题,那么它建立这个拉取网站提供给网页使用目的何在?都说无利不早起,看它的网页低劣广告和点击生成的拉取链接弹窗就很容易理解了。其实就相当于用无太大 现实利益价值的积分去换取广告商的真金白银,而且用户主动拉取需积分下载的文档一般都是质量不错的文档,这种模式就相当于利用了大量的用户的人工判断帮这个 网站建立了一个优质文库,同时也节省服务器空间资源和流量资源。这就是为什么它的网站说明如下:
友情说明: 1、本站可以免费下载百度文库原版文档,神马财富值、积分、登陆统统不要,方便快捷哦。
2、本站已收录的百度文档,可以直接下载;未收录的百度文档,可以在线为您拉取,供您下载。
3、亲,可不要下载百度文库垃圾文档哦,耗费服务器资源的,本站限制每ip每天只能实时拉取5个百度文档(本站已收录文档除外)。
4、百度文库下载器:点击下载(如果被杀毒误杀,当然确实是误杀哦,亲,放心啦。)
第一有噱头,可以下载原始文档,逐渐累计网站人气;
第二收录的优质文档日后可开N个其他累类似百度文库、豆丁等文档分享网站再度利用;
第三通过限制IP每天拉取 文档数控制积分的使用,因为它自己用工具刷积分也要时间的,控制时间成本和相关服务器费用不超广告利润;
第四那个下载器我测试过根本就是广告软件,程序内没 有任何有效的百度文库文档转换,比那些生成pdf的类似软件更不如,纯粹就是利用使用者需要下载原始文档的心理执行程序后引到它的网站。

总结:
1.百度自从出现了“爆吧”事件后检验机制早已得到极大的提升,即使有漏洞在网络传开了也是见光死,那些高薪百度工程师不是吃素的;所以想真正绕过验证机制直 接下载原始文档,至少目前网络上未泄漏出这种破解技术,非常有挑战性!
2.像千度文库这种小网站通过服务器写个脚本自动登录用积分下载百度文库文档再提供网友下载是不难做到的,但做大了也是很容易惹上百度,如果广告收益小于成本也是可能随时倒闭关门的,所以别过于依赖!不过,sanmoking此贴的“百度文库自由下载工具”目前还是非常有意义的,积分能省则省 嘛!
3.长远之计,还是按百度的游戏规则,努力刷积分,sanmoking的“百度自动评分工具”就是一个非常实用的代替人工评分获取积分工具,这个积分累积机制百度应该不会取消的,积分在自己的百度账户就像钱都自己打工的钱存在自己的账户,够用就好,而且安全!

sanmoking 发表于 2012-4-30 08:35:22

回复 31# lynfr8


    的确是这样的,按一个文档平均大小1m算,4w个也才39g,照他这样下去,一块1t的硬盘岂不是搞定。。

zldfsz 发表于 2012-4-30 09:48:15

回复 31# lynfr8


写得有条有理,头头是道,前辈辛苦了

lujd0429 发表于 2012-4-30 10:04:15

本帖最后由 lujd0429 于 2012-4-30 10:18 编辑

前辈你的压缩包好像有问题啊!我都用了三个解压缩软件(winrar、2345好压、360压缩)都是这样!{:face (229):}



用压缩文件修复软件修复后,又出现以下问题,好纠结~~

sanmoking 发表于 2012-4-30 10:20:00

回复 34# lujd0429


    重新下。。。或者pm我,给你发外链。

leisurely 发表于 2012-4-30 10:42:24

虽然币不多也一样支持了,谢谢分享~~~

小小盘 发表于 2012-4-30 10:46:35

强烈支持楼主!

小小盘 发表于 2012-4-30 10:46:47

没钱了,支持一下吧!

sanmoking 发表于 2012-4-30 10:55:59

回复 38# 小小盘


    我今天的赠送金币已经用完了,明天补上。

zldfsz 发表于 2012-4-30 11:03:47

本帖最后由 zldfsz 于 2012-4-30 03:04 编辑

..吐槽一下,为什么论坛附件的下载次数和购买记录的人数相差那么大 ...
sanmoking 发表于 2012-4-29 09:01 http://www.autoitx.com/images/common/back.gif

这个我也曾经提问过,得到的答复是

有的用户组下载东西是不用购买能直接下载的!比如说管理员等!
hzxymkb 发表于 2011-12-24 10:52 http://www.autoitx.com/images/common/back.gif

auhj887 发表于 2012-4-30 11:24:51

我这里也提示下载失败,但其它能下载

guland 发表于 2012-4-30 12:37:44

这个工具好啊,正好适合我用 哈哈现在有现成的了 我就不用研究了辛苦了哈

lujd0429 发表于 2012-4-30 12:58:05

本帖最后由 lujd0429 于 2012-4-30 13:03 编辑

不明白前辈的这幅图,是指中继服务器没有此文档还是咋的?{:face (382):}

卫和谐 发表于 2012-4-30 16:32:56

才下了1.2,没钱下1.3了。。。。。。

sanmoking 发表于 2012-4-30 17:46:38

本帖最后由 sanmoking 于 2012-4-30 17:47 编辑

回复 43# lujd0429


    中继服务器没有存档,而且中继服务器觉得这个太贵,下的人太少不划算,所以不准备替你下载。自己另谋高就吧。
页: 1 2 [3] 4 5 6 7 8 9 10 11 12
查看完整版本: 此贴已废,麻烦看见的版主帮忙删掉,谢谢。