レビュー ビジネスがビッグデータ市場を理解する方法

ビジネスがビッグデータ市場を理解する方法

ビデオ: Amito cosita ã ã ã (10月 2024)

ビデオ: Amito cosita ã ã ã (10月 2024)
Anonim

企業は、インフラストラクチャの実行効率や、収集したすべてのビッグデータをどれだけ高いレベルでスタックできるかについて、ポイントを獲得できません。 重要なのは、データが生成する分析とインテリジェンスの品質です。

過去数年にわたって、Hadoopはデータの取り込み、処理、変換と最も同義語になりました。 分散データストレージと処理のためのこのオープンソースフレームワークは、独自のエンタープライズスペースを生み出し、すべての主要なクラウドプラットフォームにその方法を統合しました。 Hadoopは、語る価値のある唯一のビッグデータテクノロジーとはほど遠いですが、他の多くのテクノロジーが構築されるものになりました。

企業にとっての問題は、Hadoopスペースがディストリビューションとツールオプションでいっぱいであり、GartnerのリサーチディレクターNick Heudeckerが説明したように、それらの多くは同じように見えることです。 Heudeckerは、Big DataやNoSQLのスペースを含む情報管理を調査対象としており、一般的なデータ処理オプションを検討している場合、多くのベンダーが非常に類似した機能を提供していると述べています。

市場を壊す

主に純粋なHadoopの3つのスタートアップ、Cloudera、Hortonworks、MapRがあり、それらはすべて2015年に着実に成長しています。Gartnerによると、それぞれが約700の顧客を持ち、10%を譲り受け、世界市場を世界中の2, 100-2, 400 Hadoopの顧客。 3つすべてが、Hadoopディストリビューションの無料ティアとエンタープライズティアの両方を提供し、それぞれがApache Software Foundation(ASF)バナーの下でプロジェクトに重要なオープンソースの貢献をしています。

「当社のデータは、Hadoopの使用の44%が現在未払いであることを示しています」とHeudecker氏は述べています。 「明確なリーダーはいますか?私はそうは思いません。彼らはすべて非常に新しいスペースであるため、市場シェアを獲得しています。」

過去数か月で、3つの間の競争の多くは、データ分析機能と、リアルタイムデータストリームから機械学習までのユースケースを持つオープンソースのビッグデータ処理エンジンであるApache Sparkを統合する創造的な方法をめぐる競争に帰着しました。 。 MapRは最近、Hadoop、Sparkベースのストリーム処理、および分析を統合する「統合データプラットフォーム」の一部としてMapR Streamsを発表しました。 HortonworksはインメモリSparkアナリティクスを備えたHortonworks Data Platform(HDP)のアップデートを展開しました。Clouderaは、Sparkトレーニングクラスを提供するとともに、One Platform Initiativeを通じてさまざまなオープンソースSpark統合を提供します。

「情報管理および情報インフラストラクチャの分野では多くのことが起きていますが、すべてがHadoopではありません」とHeudecker氏は説明しました。 「Sparkの開発はまだ初期段階ですが、Sparkの速度とメモリ中心のデータ処理モデルの背後には大きな勢いがあります。Sparkは、今日のSQLのように、データ処理におけるもう1つの共通語となり、確かに足を持っている兆候を示していますますます多くの企業がそれに投資しています。」

Heudeckerは、ビッグデータにおけるクラウドプレーヤーの重要性も強調しました。 Hadoopおよびその他のビッグデータテクノロジーを既存のIaaS(Infrastructure-as-a-Service)サービスに統合した技術の巨人。

Amazon Web Services(AWS)は、クラウドベースのHadoopオーケストレーションにAmazon Elastic MapReduce(EMR)サービスを使用します。 Microsoftは、Azureクラウドプラットフォーム内で多数のビッグデータサービスを提供し、Apache Hadoop、Spark、HBase、およびStormを管理するHDInsightサービスでHortonworksと提携し、SQLベースのAzure Data LakeおよびAzure Data Analyticsを提供しています。 IBMは、Hadoop用のオンプレミスIBM Open Platformオファリングと、その上で実行する分析パッケージであるIBM BigInsights、およびBluemixクラウド内のマネージドHadoopおよびApache Spark-as-a-serviceの両方を備えています。 リストは続き、企業はクラウドでより適切なユースケースを見つけます。

「AWSだけで約5, 000の顧客がいると推定されるため、純粋なプレイを合わせた顧客ベースの2倍以上になります」とHeudecker氏は述べています。 「クラウドに移行する利点の1つは、エコシステムを取得できることです。IaaSオファリングで純粋なHadoopディストリビューションを取得できます。MapRは、IBM以外の考えられるすべてのクラウドで利用できます。 ClouderaとHortonworksに対応しています。クラウド可用性が、ベンダーとベンダーを選択する際にあまり大きな要因になることはありませんでした。」

エンタープライズデータ戦略の選択

Heudecker氏は、中小規模ビジネス(SMB)と成長中のエンタープライズビジネスの両方で、データ処理および分析ソリューションに投資する際に、どのプラットフォームが最高レベルのサービスを提供できるかが決定要因であると述べました。 Gartnerによると、企業にとって最大の課題はスキルのギャップであり、プラットフォームをインストールして展開した後に誰がプラットフォームを管理するかを決定することです。

「企業がデータプラットフォームパートナーを探している場合、誰がデータの取り込みを支援するのか、誰が分析アプリケーションの構築を支援するのか、3つの純粋なHadoop-erに関しては、評価基準は管理ツールとコンソールの成熟度、データガバナンスツール、パフォーマンス。」

Hadoopプラットフォームを選択する他の興味深い側面は、忠誠心の欠如です。 企業は6〜12か月ごとにHadoopプラットフォームを再評価し、スペースが急速に変化し、大企業が差別化されていないため、データ処理コンポーネントが適切かどうかを確認します。 Heudecker氏は、話した企業の20%が複数のHadoopディストリビューションをデータセンターまたはクラウドで実行し、異なるチームが選択するプラットフォームを選択できるようにするか、1つのHadoopディストリビューションのみで行き詰まることを避けるために意図的に多様化したと述べました。

この種の多様なプラットフォームポートフォリオは、デジタル戦略に焦点を当てたガートナーのリサーチバイスプレジデント兼Distinguished AnalystであるFrank Buytendijkが「情報としての情報」と呼ぶものに取り入れています。 資本、労働力、材料、および物理的または仮想的な施設なしではビジネスを運営できないように、Buytendijkは情報なしではビジネスを運営できないと述べました。

「以前はビジネスを3つのフローの観点から見てきました。プライマリーフローは商品、セカンダリーフローはお金、そしてターシャリーフローは商品とお金が一致することを確認するための情報でした。今ではほとんどのビジネスで主要なフローは、識別と構成からコンテンツマーケティングなどまでの情報です。そのビッグデータを呼び出すかどうかは、実際には重要ではありません。」

「ビッグデータ」は時代遅れです

Buytendjik氏は、ビッグデータはビジネス向けの独立したテクノロジーではなく、デジタル戦略全体のテーマまたは考え方の1つであると考えています。

「ビッグデータ戦略があるとは思わない」とBuytendjikは述べた。 「デジタルコンポーネントなしではビジネス戦略はもうほとんどないので、あらゆる種類のテクノロジーが重要な機能を提供するデジタル戦略を持つことを信じています。これには、モバイル、ソーシャル、クラウド、IoT、スマートマシン、ビッグデータが含まれます」

ヒューデッカーは、「ビッグデータ」についてはどんどん話を始めるようになると信じています。なぜなら、今は単なるデータだからです。 それがビジネスのやり方です。 大量のデータと高速のデータは、もはやそれほど困難ではありません。

「ビッグデータは、情報と分析によって再び包み込まれています」と、Heudecker氏は述べています。 「ビッグデータのカテゴリははっきりと差別化されていません。ビッグデータ市場の規模は常に問われますが、それはどういう意味でしょうか。ビッグデータは実際には市場ではなく、概念です。以前にやったこととは根本的に異なるユニークで特別なことは間違いです。この時点では、データは正常です。」

ビジネスがビッグデータ市場を理解する方法