Core Concepts
エッジコンピューティング環境では、計算の再利用とロードバランシングが重要な機能であるが、相反する性質を持つ。Deduplicatorは、これらの機能を同時に実現するためのミドルボックスである。
Abstract
エッジコンピューティング環境では、ユーザーデバイスからオフロードされる計算タスクが類似したデータを処理することが多い。そのため、以前に実行された計算結果を再利用することで、冗長な計算を削減できる。一方で、ロードバランシングは、利用可能なエッジサーバーの間でタスクを均等に分散することを目的としている。
Deduplicatorは、ロードバランシングと計算の再利用を両立させるためのミドルボックスである。Deduplicatorは、ロケーション感度ハッシュ(LSH)を使ってタスクの入力データの類似性を識別し、類似したタスクを同じエッジサーバーに割り当てることで、計算の再利用を実現する。同時に、エッジサーバーのリソース使用状況を収集し、ハッシュ値の割り当て範囲を動的に調整することで、ロードバランシングを実現する。
Deduplicatorの評価結果は以下の通り:
タスク分散のオーバーヘッドは1%から3%程度で、他のロードバランシング手法と同等
計算の再利用率は最大で20%向上
タスクの分散はサーバー間で5%以内の偏りに抑えられ、ロードバランシングが効果的に機能
Deduplicatorは、計算の再利用とロードバランシングの両立を実現する有効な手法である。
Stats
エッジサーバーのCPU使用率が60%を超えた場合、ハッシュ値の割り当て範囲を調整して負荷を分散する。
エッジサーバーの平均CPU使用率は80%前後に維持される。
Quotes
「エッジコンピューティング環境では、ユーザーデバイスからオフロードされる計算タスクが類似したデータを処理することが多い」
「ロードバランシングと計算の再利用は、相反する性質を持つ」