中国TBクラスの無料ストレージサービスの実態とは・・・!?
北京は4月末に入っていきなり、夏のような気候になり暑い日々が続いています。
そして、中国でちょっと熱い、流行っているクラウドストレージについて少しお話ししたいと思います。
中国のクラウドストレージ
プライベートクラウドストレージとは、ネット上でファイルを保存できる個人のスペースです。
日本でもDropboxやGoogleDrive等様々なサービスがありますよね。
中国でもたくさんの会社がこのサービスを提供しています。
しかも、無料で!
ここでいろんな疑問がわきあがります。
なぜ無料で提供できるのか…?
当初は100M程度の提供だったが、どうして今は無制限まで進化したのか…?
サービスプロバイダはただのボランティアなのか…?
その分のコストはどうなっているのか…?
今回はその仕組を説明させていただきたいと思います。
まず、中国市場で流行ってる個人クラウドストレージ商品(無料)を挙げます。
微盘(新浪-SINA提供)では新規ユーザーに100Gの無料スペースを提供してます。
百度云(百度-Baidu提供)では新規ユーザーに2Tの無料スペースを提供してます。
微云(腾讯-Tencent提供)ではユーザーに10Tの無料スペースを提供してます。
360云盘(奇虎360提供)ではユーザーに無料スペースを提供してます。(制限なし!)
中国クラウドストレージのサービスの中身
中国市場にはもっと数多くのプライベートクラウドストレージサービスがあるのですが、一番有名な4つをご紹介しました。
それでは、この仕組みを今から説明します。
例えば、プライベートストレージサービスを提供したいと考えるA社がいるとします。
A社が1000GBのストレージサービスを持ち、ユーザーに1Gのスペースを提供しようとしています。
簡単に計算すると、1000G/1G=1000ユーザーにサービスを提供できます。
しかし、運用状況を調査したところ、ユーザーは皆まるまる1Gを利用しているわけではありませんでした。
平均使用率は50M。
1000人×50M=50G、つまり、1000GBのうち950GBは利用されていない状態です。勿体無いですね。
でも、1000G/50M=20000ユーザーにサービスを提供したら、突然大きいファイルを
アップロードされた時が大変です。ですので、50Gの容量を万が一の場合のために残しておきます。
残り950Gで計算しなおすと950GB/50M=19000ユーザーにサービスを提供できます。
考え方を変えただけで、ユーザー数は19倍となります。
では、1000GBのサーバーが1000台ある場合はどうなるのか?
先の計算方法で、一台ずつ50Gの予備スペースを残すと1000台×50G=50,000GBとなります。勿体無いですね。。
でも、よく考えれば、ユーザーデータの保存の連続性は重要ではないので、そのぐらいなスペースがあればいいです。だから、仮想デイスク・共有ストレージ環境を利用して、ストレージの利用率はまた上がります。
利用効率を高めるアーキテクチャ
まだ進化できますか?
勿論です。
各ユーザーの平均アップロードデータは50Mと先述しましたが、この50Mは一気にアップロードしたものではありません。
新ユーザはアップロードするファイルがない、あるいは少しずつアップロードしている。ですので、偉大な分散アーキテクチャと统合アーキテクチャ技術を利用して、まず新ユーザに0Mを分け与え、その後は使う分だけ分配します。
当然ながら、ユーザーのGUIには利用可能容量 1Gと表示されます。
これで終わりでしょうか?
メールサーバーならば、これで十分利用率を高められます。しかし、クラウドストレージはまだまだです。
メールサーバーすべて独自のメールなので、それぞれのデータはみな違います。
しかし、クラウドストレージならば、アップロードされたもので重複しているものも多く存在します。(無料クラウドストレージユーザーはあまりプライベートな情報をアップロードしない傾向にあります。アップロードされるファイルは映画、アニメ、ドラマ、小説、ゲームのデータが多いようです。)
例えば、Jさんはある人気な映画を自分のクラウドストレージにアップロードしました。
そして、その後、SさんもGさんも同じ映画を自分のクラウドストレージにアップロードしました。
ユーザーが増えるにつれ同じ映画をアップするユーザーが増え、現在は約1000人のユーザーが同じ映画をストレージ上にアップしています。
冷静に考えると、すべて同じコンテンツなので、ファイルが一つ保存されればいいですよね。
全ユーザーのGUIにこのファイルが存在していると表示されれば十分ですよね。
ユーザーがこのファイルを削除する場合も本当にファイルを削除するのではなくて、そのユーザーのGUIに表示されるファイル名だけを削除し、このファイル自体の削除はこのファイルをアップした全ユーザーがファイルを削除したときにすればいいですね。
でも、これがすべて同じファイルだと、どうやって判断すればいいでしょうか?中身が同じでもファイル名が違う可能性やファイル名が同じでも中身が違う可能性は往々にしてあるでしょう。
ファイル唯一性の確保はMD5算法、hash算法に任しましょう!
このやり方で、重複しないファイルは一人平均50Mから1Mになります。
この手を利用して、平均1台の1,000Gサーバーは約1,000,000人にサービスを提供できます!!
トラフィックを制限する仕組み
ここで終わりですか?
いいえ!
ユーザーの激増に伴うMD5計算のせいでCPUの負荷も激増。
サーバーのCPUリソースは全部消費されてしまう。
増設はコストがかかるので、この負担をエンドユーザーへ分散。
MD5計算はユーザー側で行いますため、MD5-プラグインをユーザー側にダウンロードさせ、ファイルをアップロードと同時にファイル唯一性チェックもユーザー側で行います。
そして、カッコイイ名前を付けました。
→「秒传」 、一瞬でファイルをアップロードできます!
「秒传」と表示されるのはどういう時かと言うと、既に誰かがストレージ上に存在しているファイルを自分もアップしようとした時です。まだ誰もアップしていないものの場合は“亀速”でアップロードすることが必要です。
こういう仕組みであれば、ユーザーに提供する容量は1Gであろうが1Tであろうがあまり変わりません。
課金されるタイミング
では、どのタイミングで利益は出るのでしょうか?
再び360を例として説明します。
無料スペースを利用したいなら、当然、登録が必要です。
360の場合は、携帯番号のみで申し込みできますが、登録してすぐに無制限で利用できるわけではありません。
例えば、PCにアプリをインストールしたら使える容量が10T増え、スマホにアプリをインストールしたらまた26T増えるという感じです。
ユーザーアカウントにも当然レベルがあり、レベルアップしたら使える容量は増えます。無限にレベルアップし続け、容量も無限に増え続ける。当然、レベルアップするための代償は必要です。例えば、Blogで情報共有、友人へのファイル共有、BBSへの投稿・コメントなど。ユーザー情報も集まるし、プロモーションにお金をかける必要もないなんて、サービサーとしては願ったりかなったり。ユーザー保有数の増加にはとても価値があるのです。
また面白い話があれば共有しようと思います。
※文章中の情報の一部はwww.baidu.comで調べた情報です!