レビュー NSAのxkeyscoreの背後にある技術

NSAのxkeyscoreの背後にある技術

Anonim

政治ではなくXKeyscoreの背後にあるテクノロジー(NSAがテロリストを阻止するために使用する政府のプログラム)に焦点を当てると、実際には非常に気が遠くなります。 一部のレポートでは、XKeyscoreプログラムが最大410億件のレコードを処理できると推定しています。

XKeyscoreの中心には、ビッグデータとデータ分析という2つの主要な技術トレンドがあります。 そして、この種の技術を熱心に受け入れているのは政府だけではありません。 情報は最もホットな商品です。 同じ大規模なデータセットを収集および分析している企業が使用しているものと、これらの企業がそのデータを移動するのに役立つベンダーからのコメントに基づいて、XKeyscoreなどのプログラムの技術仕様に関する裏側の可能性を見てみましょう。

驚異的なテクノロジー

ビッグデータとは、膨大な量のデータを収集することを指し、その情報を選別、分析、報告するには専用の技術が必要です。 簡単に言えば、データ分析とは、その情報をきちんとしたコンパートメントに分解して、さらに詳しく調べるプロセスです。

この膨大なデータの収集と分析の主な用途はどこですか? 民間産業で。 エンタープライズが大量のデータにアクセスして移動するのを支援するソリューション企業AttunityのマーケティングコミュニケーションディレクターであるMelissa Kolodziej氏は、小売業界では、企業が顧客の習慣を分析するために「大量のデータをまとめて」 「この人がシャンプーを買ったばかりで、顧客がまだ店にいる間にその顧客に携帯電話で関連するクーポンを提供できる場合」を見るのと同じくらい詳細。 Kolodziej氏は、これらの大規模なデータセットを分析し、できるだけ早く情報を収集することを望む場合、企業は「ほぼリアルタイムの機能」を望み、持つことができると述べました。

推測される技術仕様

XKeyscoreで使用できる特定のテクノロジーについては、世界中に700のLinuxサーバーが含まれているという事実を除いて、実際の詳細はありません。 しかし、これらの大きなデータセットを集約して管理するために必要なハードウェアのタイプを推測することは可能です。 驚異的な処理能力を処理できるマシンのタイプを製造しているベンダーはごくわずかです。Oracle、HP、IBM、EMCが最も頭に浮かぶものです。

もちろん、大量のデータの収集と分析を可能にするのは、データセンターのブランドだけではありません。

「ハードウェア(メモリ容量と速度、マルチコア、マルチCPU)、およびソフトウェア(円柱状データベース、クラスター化ファイルシステムなど)の技術革新により、ほぼ無制限の量のデータを「保存」することが可能になりました」 SAPのデータベースおよびテクノロジーの社長。

並列処理、未処理のコンピューティング能力の進歩、および比較的低コストでの膨大なストレージ容量により、このタイプのデータマイニングは政府、企業、さらには中規模企業にとっても容易になりました。 Attunityのマーケティング担当副社長であるLawrence Schwartz氏は、今日のデータウェアハウスは「一般にテラバイトのデータをサポートするために構築されている」と述べました。

非常に多くのデータソースがあり、それらすべてが絡み合っているという事実は、大きなデータセットの分析と収集が産業にとって非常に魅力的であることにも役立ちました。 「人々は常にデータで何をすべきかを理解したかったと思います。過去10年間に非常に多くの情報源が存在し、相互接続された情報源は非常に多くなりました。今はチャンスがある」とシュワルツは言った。

長引く課題と明白な論争

テクノロジーはビッグデータのサポートとそのようなデータの分析において急速な進歩を続けていますが、課題は残っています。

シュワルツによると、多くの場合、エンティティは処理可能なデータよりも多くのデータを収集しています。 この収集されたデータを理解するために利用できる「データ科学者の膨大な不足」もあります。

「多くの既存のソリューションと技術の課題は、0と1のこれらの大規模なプール内に存在する有用な情報を理解および識別できず、タイムリーかつ費用対効果の高い方法で分析および利用することができないことです。 ITランドスケープから複雑さを取り除き、「データ」を有用な「情報」に変えてエンドユーザーまたはアプリケーションに配信する速度と柔軟性を向上させるイノベーションに焦点を当てています」とSAPの銀行は述べています。

次に、セキュリティ上の懸念があります。 CipherCloudの上級副社長であるPaige Leidig氏は、次のように述べています。「データ企業と消費者が大量にクラウドにプッシュし、保管しているため、クラウドが個人情報を保持している企業の情報セキュリティ慣行を懸念する必要があります」 「PRISMは特定のクラウド全体に流れる情報を監視および監視しますが、XKeyscoreは訪問したWebサイトからソーシャルメディアの投稿に交換された電子メールまで、インターネット上の特定の人物を積極的に追跡します。動機が国民の福祉の国家安全保障であっても、それはプライバシーの問題です。」

それでも、Leidigによれば、これらのインターネット監視プログラムは、「企業レベルおよび消費者レベルでのクラウドへの依存度を強調する」と言われています。 データを安全に保つか、ハッカーやITスタッフ内でのデータ盗難を防止する限り、「より良いアプローチは、スクランブルに暗号化不可能な暗号化を使用してクラウド(および企業が必要とするキラーアプリ)を有効にすることです」この方法では、権限のないユーザー(agency報機関またはサイバー泥棒)がデータを利用できません制御の追加手段として、クラウドプロバイダーではなく企業に暗号化/復号化キーを保持させます。

情報のリクエスト(私たちがこれまで耳にしたNSAの手紙)が発生した場合、企業は通知を受け、顧客データが同意なしにアクセスされることを回避し、暗闇でアクセスするのではなく、政府と直接連携できます。 これは、クラウドプロバイダーがキーを保持し、データを引き渡し、法律によって企業に情報要求を公開することを防ぐモデルです。」

明らかに、現在一般に公開されている大きな議論は、テクノロジーが膨大なデータを収集して分析するためだけにあるということです。これは、政府や企業が市民や顧客にそのようなテクノロジーを使用する許可を与えるのでしょうか? それはかなり長い間続くことは間違いない議論です。

詳細については、Xkeyscore Is Not Watching Youをご覧ください。NSAの傍受データ向けGoogleです。

NSAのxkeyscoreの背後にある技術