文章概要:
国内网盘动辄上 T 的容量,大部分人究其一生可能都用不完。那么问题来了,每个人都上 T 的云空间,成本会不会很高?iPhone 的 16G 容量起步让不少用户诟病已久,于是就由很多所谓「乞丐版」iPhone 的生存手册,其中就包括买买买、删删删、扩扩扩等各种手段。
但其实对于国人来说网盘无疑是一套更为经济有效的手段,随手拍张照片立刻同步到云盘上去,再也不用迟疑当空间不够的时候要不要删了。因为以国内网盘动辄上 T 的容量来说,大部分人究其一生可能都用不完。那么问题来了,每个人都上 T 的云空间,成本会不会很高?
答案当然是不会。首先我们试想下,只有一台 1000G 空间的服务器,按照道理说只能分配给一位用户使用,但其实平均下来每个人只用到 1G 的空间剩下的 999G 都被浪费掉了。于是就可以把服务器分配给 1000 个用户,这样利用率就有了显著的提升。
但很多人并非一次性使用 1G 的空间,而是动态上传以及删减,因而可以试着将服务器的 1000G 分配给 2000 名用户每位用户 512M,当然为了保险起见可以先分配给 1900 位用户,剩下的 50G 剩余可以留着以防某时候用户上传数据激增。所以 1000G 的服务器分配给了 1900 名用户,但这些用户前端显示的依然是 1T 的空间。
实际上当用户数量越来越多,所需的服务器也越来越多,假如有 1000 台服务器,那么 1000x50G 的容量就要被浪费掉了,因而可以将其继续采用上面的方法然后将用户的数据存到不同的服务器上去进一步增大利用率。当空间不够的时候再加几块硬盘或者几台服务器即可。
但这还不够,在云盘上原创性的内容数量虽多但是其实不怎么占用空间,最占用空间的是分享的软件、视频等。因而假设有 100 个人上传了一段容量为 3G 名为《七个葫芦娃和三个小矮人的故事》的视频,那么在服务器端其实只需要保存一段即可,例如很多云盘都有的「转存」功能就是这个道理。
还有一些是文件名不一样,但是文件内容是相同的,因而可以通过检测文件的 MD5 值来判断是不是同一个文件。怎么检测呢,这就需要用到 PC 端上的所谓「上传控件」,提前帮你计算文件的 MD5 值,再在云端进行匹配,如果有相同的文件的话,就可以做到所谓的「秒传」。
有了这些技术,那些看似动辄上 T 的云盘,均摊到每个用户身上实际上只利用了服务器上的数十兆到数百兆空间而已。
当然以上这些只是最基本的,其他还有更多的细枝末节值得挖掘。但不管怎样,那些奋斗在前线的程序员们要做的就是尽可能提高服务器的利用率,让不知所云的你感觉赚了便宜——这就是科技的魅力。
另外需要科普一点,前段时间国家的「禁网行动」致使大量存放在网盘上的某些你懂的视频资源被封。最主要的还是前面讲到的利用 MD5 识别封杀,所以只改片名是不管用的,需要更改文件的 MD5 值才行。
当然现代科技这么发达,机器自动识别技术也是日臻完善,所以只改 MD5 值的也洗洗睡吧,你得从头到尾打马赛克才行。
啊,又是万恶的马赛克!
发表于2015年11月5日 / iPhone 同步推资讯,iPad 同步推资讯,万事屋,一周专栏,周四 / 来源:空一格
赞
56人赞过
分享到转载请注明 《【周四·科普】网盘那么大,你用得完吗》转自同步推资讯 | news.tongbu.com