ビジネス GoogleがSQLで機械学習を簡素化

GoogleがSQLで機械学習を簡素化

目次:

ビデオ: ’, Â, � etc... How to fix strange encoding characters in WP or other SQL database (十一月 2024)

ビデオ: ’, Â, � etc... How to fix strange encoding characters in WP or other SQL database (十一月 2024)
Anonim

Googleは現在、同社のペタバイト(PB)規模のクラウドデータベースサービスであるGoogle BigQueryに機械学習(ML)機能を追加しました。 BigQuery MLと呼ばれる新しいバージョンでは、単純な構造化照会言語(SQL)ステートメントを使用して、予測分析用のMLモデルを構築および展開できます。

これは、Googleを使用するデータサイエンティストにとって朗報ではありません。 また、クラウドを介してこのレベルの高度な機能を提供できる比較的小規模なベンダーのリストに、より効果的な競合他社を追加するため、データ分析機能の向上に関心のあるビジネスオペレーターにも適しています。 他の2つの最も有名な名前は、AmazonのリレーショナルデータベースサービスとMicrosoftのAzure SQLです。詳細については、最近のクラウドデータベースサービスのまとめをご覧ください。

すべてのデータ製品ベンダーとバイヤーの悩みは、常にスキルのギャップでした。 これらの分野は、多くの場合、新しいテクノロジーとクエリ言語の知識を必要とするため、MLと予測分析に関心のある人には特に当てはまります。

「データサイエンティスト1人につき、数百人のアナリストがデータを操作しており、ほとんどがSQLを使用しています」と、Google CloudのプロダクトマネジメントディレクターであるSudhir Hasbe氏はPCMagに語りました。 データ分析者の軍隊の力が、少なすぎて働きすぎるデータ科学者によって生み出されたボトルネックから解放されるためには、何かを与えなければなりませんでした。

このジレンマに対するGoogleの答えは、驚くべきことです。 MLはホットトレンドであり、あらゆる場所であらゆる種類の製品に登場していますが、それでもデータサイエンティストの領域です。 多くのベンダーがテクノロジーの簡素化に取り組んできましたが、い真実は、それを大幅に単純化できることであり、99%以上の人が使用するのはまだ難しいことです。 しかし、MLはより多くのことを実行できるため、それを使用できるようにする必要があります。また、超スマートな人間のグループよりも速く実行できます。

GoogleはMLをGoogle BigQuery内に配置して、データの近くに配置します。 アプリケーションは、データ分析をソースで実行できるため、従来のMLモデルよりも高速にML機能をもたらします。 現在、ベータ版のBigQuery MLを使用すると、アナリスト(およびデータサイエンティスト)は、販売予測や顧客セグメントの作成などの予測分析を、格納されているデータの上で実行できます。 それだけでも立派で注目に値するアップグレードです。

ただし、Googleはデータアナリストが簡単なSQLステートメントを使用してMLモデルを構築および展開できるようにする機能を追加することで、それよりもさらに進んでいます。 現在、これらのオプションは最も一般的に使用される2つのモデルであるため、予測分析用の線形回帰モデルとロジスティック回帰モデルです。

データアナリストがこの機能をどのように使用するかを示すために、Googleが提供した図を次に示します。

Hasbeによれば、Googleは今後この機能にMLオプションを追加する予定です。 「最も有用なモデルを最初に提供するために、どのモデルを追加したいかを顧客から聞く必要があります」と彼は言いました。

追加のGoogle BigQueryのアップグレード

MLの後のアップグレードの実質的なリストは、クラスタリング機能、BigQuery地理情報システム(BigQuery GIS)、新しいGoogle Sheetsデータコネクタ、および新しいGoogle Sheetsデータコネクタです。

クラスタリングもベータ版であり、同様のクラスターキーを持つ行をまとめてまとめるデータ最適化の動きでクラスター化されたテーブルを作成できます。 これにより、パフォーマンスが向上し、Google BigQueryがテーブルまたはパーティション全体ではなく、スキャンされたデータに対してのみユーザーに課金できるため、コストが削減されます。

BigQuery GISは現在アルファ版であり、地理空間データ分析に使用されています。 Google CloudチームはBigQuery GISを構築するためにGoogle Earth Engineと提携していますが、独自の地理空間データをテーブルに取り込む必要があります。 それは、コネクテッドカーシステム、モノのインターネット(IoT)、製造、小売、スマートシティ、テレマティクスなど、いくつかの業界における問題ではありません。 言うまでもなく、環境保護庁(EPA)や国家地理空間情報局、国立海洋大気庁(NOAA)、そしてすべての軍事支部に及ぶ政府機関は言うまでもありません。

BigQuery GISはS2ライブラリを使用しています。S2ライブラリには、Google Earth EngineやGoogle Mapsなどのさまざまな製品を通じて10億人を超えるユーザーがいます。 さらに地理空間データが必要な場合、連邦政府は膨大な量のデータをGeoPlatformで共有します。

新しいGoogleスプレッドシートデータコネクタは、毎日の使用に非常に実用的であるという理由だけで、多くのデータアナリストを喜ばせる可能性があります。 Googleスプレッドシート(​​スプレッドシートプログラム)からGoogle BigQueryにアクセスし、コラボレーション、データ視覚化、自然言語クエリツールを組み合わせたExploreなどのGoogleスプレッドシートツールを使用できます。

Google BigQueryのベータ版にも新しいユーザーインターフェース(UI)が追加されました。 より興味深い要素の1つは、Google Data Studioがサポートするワンクリック視覚化機能です。 すべてのことを言いますが、それはすでにエレガントなサービスのアップグレードの素晴らしいラウンドです。 これらのアップグレードは、バグが解決され、製品がそれぞれのアルファおよびベータステータスを超えた後、PCMagのサービスとしてのデータベース(DBaaS)ソリューションレビューの次のラウンドでテストされます。

PCMag EICダンコスタは、データの将来について議論しています。
GoogleがSQLで機械学習を簡素化