荔园在线

荔园之美,在春之萌芽,在夏之绽放,在秋之收获,在冬之沉淀

[回到开始] [上一篇][下一篇]


发信人: mmkiller (更年期,生人勿近), 信区: Program
标  题: Re: 请问一下,网际快车和讯雷的原理有什么不同? (转载)
发信站: 荔园晨风BBS站 (Tue Apr 11 13:16:14 2006), 站内


 觉得spider的开销太大,而且搜索到的url不能证明两个文件相同,不太现实
 除非下载来比较,但是这样做的话几乎是mission impossible —— 网络那么多文件
 最有效的方法还是靠用户下载完以后运算hash再递交给服务器记录
 这样分布式工作的话,就像google的投票方法差不多,多引用的自然是热门
 所以这也就是为什么迅雷下载热门的资源的时候来源会特别多
 偏门资源的话,几乎是没有多点的来源。

 另外我想过一个问题
 某些下载站用的是密码方式的ftp,那些密码都是半公开或者全公开的
 而假如我自己拥有一个ftp,上面有某些资源与网络上相同
 但是我下载的时候直接用迅雷从这个ftp上下载
 当其他用户从其他途径获取了相同文件的时候
 那么这两个来源会认为是同一个文件
 然后第三个人去下载的时候很可能会连接到我的私人ftp
 这个过程很可能会截取到我下载时使用的密码
 如果这个下载帐号的权限很高,那么我的服务器就会有风险了
 那就是说如果迅雷是连ftp账号都记录的话,那就要小心在公网私人Ftp使用
 高权限的账号下载了。。。

【 在 bakey (猪朋狗友) 的大作中提到: 】
: 【 以下文字转载自 Student 讨论区 】
: 发信人: franky (斌), 信区: Student
: 标  题: Re: 请问一下,网际快车和讯雷的原理有什么不同?
: 发信站: 荔园晨风BBS站 (Thu Apr  6 09:58:21 2006), 站内
: 迅雷用的是网格技术。
: 迅雷客户端只是这个系统的很小一部分,后面还有大量的软件硬件服务器在支持客
: 户端,为客户端服务。
: 比如服务器上有一个 spider 即蜘蛛,这个程序很大很复杂,它每天不停的在扫描
: 整个互联网,把扫描到的资源的url和数据全部存入公司的超级数据库,所以当你下
: 载一个资源的时候客户端首先向服务器申请,服务器从数据库中取出所有的与你要
: ...................

--

 ┌┬┬╮┌┬┬╮╭╮  ╮╭┬┬╮╭╮    ╭╮    ╭┬─╮╭┬─╮
 │┤│││┤│││┤  │  │┤  │┤    │┤    │┤    │┤  │
 │┤│││┤││├┴┬╯  │┤  │┤    │┤    │┼─╯├┴┬╯
 ╰╯╯╯╰╯╯╯╰╯╰╯╰┴┴╯╰┴─╯╰┴─╯╰┴─╯╰╯╰╯


※ 来源:·荔园晨风BBS站 bbs.szu.edu.cn·[FROM: 210.39.2.110]


[回到开始] [上一篇][下一篇]

荔园在线首页 友情链接:深圳大学 深大招生 荔园晨风BBS S-Term软件 网络书店