前向きの考え方 Apple、Google、そしてすべてを知っているアシスタントへの道

Apple、Google、そしてすべてを知っているアシスタントへの道

Anonim

今週のAppleのWorldwide Developer Conferenceと2週間前のGoogleのI / Oカンファレンスの基調講演を見て、私にとって最も際立ったのは、Microsoftと同様に両社が知っているインテリジェントシステムを作成するための努力でした。あなたについて可能な限り。

このようなシステムは、一般的にあなたのニーズを予測する「パーソナルアシスタント」として機能することを目的として、あなたが誰で、どこにいて、画面上のすべての情報を知っています。 これは非常に野心的な目標であり、これらの企業の1つがコンピューティングの次の大きなステップであることを理解しているようです。

AppleとGoogleの場合、基調講演で発表された他の製品がより注目を集めるか、より目に見える短期的な影響を与える可能性があります。 Googleフォトは大きな注目を集めました。 Apple PayとAndroid Payはどちらもより一般的になりつつあり、Android WearとWatchOSの改善はウェアラブル向けのアプリケーションの流出を予感させるかもしれません。 しかし、よりインテリジェントで包括的なシステムへの移行は、長期的な影響を最大化する可能性があります。

アップル、グーグル、およびマイクロソフトはすべて、さまざまな角度からこれに取り組んでいます。 しかし、彼らは入力や音声で制御できるモバイルフロントエンドを備えたシステムに収束しているようで、インターネットベースのサービスとあなたに関する膨大な量のデータを含むプロセスに支えられており、そのデータとあなたがしていることについて。

この収束への道は、過去数年間の多くの紹介によって舗装されてきました。 多くは長年パーソナルアシスタントに取り組んできましたが、Siriは元々、SRI Internationalからのスピンオフによってスタンドアロンアプリケーションとして開発されました。 2011年、AppleはSiriをiPhone 4の「仮想アシスタント」として導入し、主にWeb検索、現地の天気、レストラン検索などのフロントエンドとして機能します。 2012年、GoogleはAndroid 4.1 Jelly Beanの一部としてGoogle Nowを導入し、質問に答えた一連の「カード」に関する情報を提供しました。 時間が経つにつれて、これはより多くの情報を提供し、より多くのドメインをカバーするようになりました。

最初は、両方ともおもしろいと思いましたが、音声制御は便利なアプリケーションというよりも「パーラートリック」のように思えました。

しかし、過去数年間で、両方とも急速なペースで改善されました。 一部には、より多くのユーザーがいることで、両方の企業がより多くのデータを処理できるようになりました。 これに、よりインテリジェントなアルゴリズムとサーバー処理に関する多くの作業が組み合わされた結果、システムは起動時よりもはるかに正確になります。 どちらも、より多くのドメインで質問に回答できるようになりました。 また、Google Nowは、自宅やオフィスが通常の場所に基づいている場所などの情報を推測できます。

マイクロソフトは昨年、Windows Phone 8.1リリースの一部としてCortanaを導入しました。これは、Web検索に加えて他のアプリケーションで何をしたかをより深く理解したため、最初の真に個人的な「デジタルアシスタント」であると説明しています。 設定したリマインダーなどを実行して、誰があなたにとって重要で誰が重要ではないかを理解できます。また、ユーザーはそれほど多くありませんでしたが、過去数年で改善されたようです。 Cortanaは、デスクトップとラップトップのWindows 10の一部にもなります。

これにより、3つすべてのベンダーが他のベンダーから機能を借用しているように見える最新の発表に至ります。

Google Now On Tap

数週間前のGoogle I / Oで、Googleの上級副社長Sundar Pichaiは、同社がどのように検索に注力し続けているかについて話しました。 しかし、Androidの最新バージョンの機能に至ったとき、私が注目したのは、「Now on Tap」と呼ばれるGoogle Nowパーソナルアシスタントの一連の新機能でした。

ピチャイは、ディープラーニングと機械学習へのGoogleの投資について語り、Googleが過去1年間で音声認識の単語誤り率を23%から8%に削減したと述べました。

Google Nowには既にいくつかのコンテキスト機能があります。たとえば、現在地を把握しているため、家に帰るまでの時間を推定でき、情報の表示や通知内で使用するさまざまな「カード」に表示できます。 。

しかし、Google NowのディレクターであるAparna Chennapragada氏は、「コンテキストを離れることなく、簡単な質問にすばやく答えられるようにするにはどうすればよいかを尋ねました。 彼女によると、その結果は、電話で何をしていても「今」あなたを支援する新しいサービスだという。 これはNow On Tapであり、10億を超えるエンティティ(野球チームやガソリンスタンドなど)の理解というGoogleのナレッジグラフと、他のアプリケーションとのコンテキストおよび接続を組み合わせて、積極的に情報を提供するという。

彼女が示したデモンストレーションでは、アプリ内で夕食のレストランを提案し、ドライクリーニングを拾うように要求するメッセージを受け取りました。 ホームキーを押したままにすると、Google Nowカードが表示され、Now on Tap機能により、ナビゲーションマップ、Yelp、OpenTableへのリンクなど、レストランに関する基本情報が表示されます。 また、ドライクリーニングについても注意を促します。 OpenTableリンクをタップするとアプリが開きましたが、より印象的にはそのレストランのページに直接開きました。

これは、OSが現在の状況と、デバイスの残りの部分で何をしていたかを理解するようになるという考え方です。 別の例として、音楽を聴いている場合は、ホームキーを押したまま、曲について質問することができます。 Google Nowはどの曲が再生されているかを把握し、その曲に関する質問に答えることができます。

「すぐに情報を入手できます」とChennapragadaは言いました。 「あなたが読んでいる記事、聞いている音楽、返信しているメッセージなど、これらすべての例で重要なのは、その瞬間の文脈を理解することです。今、その理解があれば、すぐに答えを出すことができます。簡単な質問に答えれば、どこにいても電話をかけることができます。」

アップルはインテリジェンスを強調

Appleは月曜日のWWDC基調講演で、iOS 9で発生する多くの変更について議論しましたが、「インテリジェンス」の概念を主導しました。

Appleのソフトウェアエンジニアリング担当シニアバイスプレジデントであるCraig Federighiは、Siriを特定の時間または特定の場所に移動したときに特定のタスクまたはブラウザー内の特定のリンクについて思い出させるなどのことができる「プロアクティブアシスタント」にすることについて話しました。 たとえば、今後のイベントに関するテキストメッセージを受信した場合、Siriに「これについてリマインドしてください」と伝えることができ、イベントを参照していることとリマインダーを設定していることがわかります。 テキストメッセージの招待状をカレンダーに自動的に追加するなどのことができます。

特定の時刻に使用する傾向のあるアプリを覚えて、シンプルなアイコンで表示し、検索の結果に関する詳細情報を提供する「説明カード」を追加しますGoogle Nowのカードに)。

そして、それは一般的に改善されたようです。 Federighi氏によると、Appleは昨年の単語エラー率を5パーセントに40パーセント削減しました。 また、システム自体での処理の方が賢く、「昨年8月にユタの写真を見せて」などの自然言語のクエリに応答できるようになりました。

最も興味深いことに、アプリ内のコンテンツを検索できるように、検索用のAPIを提供します。 たとえば、彼はAirbnbアプリに深くリンクして、特定の地域で利用可能なレンタルを見つけることができることについて話しました。 または、別のアプリケーションでレシピに関する情報を検索します。

デモでは、ホーム画面から右にスワイプすることでアクセスできる新しい検索画面を表示し、最も頻繁な連絡先や今後のイベントに基づいて、システム自体が連絡先の候補を提案する方法を示しました。 その後、特定のアプリケーションに「深くリンク」して、より多くの情報をもたらす方法を示しました。 Siriでも同様の機能が利用できました。

Appleが強調したことの1つはプライバシーであり、Federighiは「iOS 9のエクスペリエンス全体でインテリジェンスをもたらすことができましたが、プライバシーを侵害しない方法でそれを実現しました」と述べています。 確かにGoogleの広告ベースのモデルを掘り下げたように聞こえたが、彼はAppleがあなたの写真、メール、写真、クラウド情報をマイニングしないと言った。 彼は、すべての情報はデバイス上で行われ、あなたの管理下にあるデバイス上にとどまり、システムが検索やトラフィックの検索のためにクラウドに情報を送信する必要がある場合、第三者と情報を共有せずに匿名で行います。 「あなたがコントロールしている」と彼は言った。

Cortana Going Crossプラットフォーム

マイクロソフトは、Windows Phone向けのCortanaアシスタントを使用して、パーソナルアシスタント機能の多くを提供する上で有利なスタートを切ったと言えます。 これは、リマインダーのスケジュールを設定し、一部の電話アプリケーションとより深く統合するという点で、実際のアシスタントのように振る舞うことを試みた3つの大きな電話アシスタントの最初のものでした。

Cortanaは、デスクトップおよびノー​​トブックのWindows 10の一部でもあります。 ごく最近、Microsoftは、CortanaのバージョンがiOSとAndroidの携帯電話に登場し、PCをCortanaに接続する「電話コンパニオン」アプリを発表しました。これにより、あるデバイスでタスクを開始し、別のデバイスでタスクを完了できます。

マイクロソフトのジョー・ベルフィオーレは次のように述べています。「食料品店で次に牛乳を飲むようCortanaに思い出させることができます。そうすれば、電話が起きてリマインダーが鳴ります。スマートフォンとPCの両方でCortanaを使用して飛行し、お使いのデバイスで更新プログラムを取得して、見逃さないようにします。」

結論

多くの点で、特に「積極的な」取り組みにおいて、3社すべてが一緒に動くと聞いています。 グーグルとアップルは、彼らのツールはもっと「積極的」だと言い、自分のアシスタントを少なくともあなたが探しているものを予想できるかのように見せたいという言葉を使っている。

これら3つはすべて、システム上の他のアプリケーションとのより良い接続に焦点を当てており、AppleとGoogleは「ディープリンク」に焦点を合わせることを発表しています。 具体的には、OpenTableの正しい画面に移動してテーブルを予約するなど、アプリ内の項目にリンクする必要があります。 I / Oで、Android Dave Burkeのエンジニアリング担当副社長は、現在の「曖昧さ回避」画面なしに、Android Mが電子メールまたはWebサイトのリンクからアプリケーションの適切な場所に移動するリンクのより良い方法を示しました。

このすべての結果、オペレーティングシステムとその上で実行されるアプリとの間の境界線があいまいになり、よりシームレスなエクスペリエンスと、より多くのことを本当に知っているシステムが提供されます。

これらはすべて非常に役立つはずです。 しかし、さまざまな理由で、これもすべて怖いことがあります。 過度に熱心なマーケティングのためであれ、プライバシーの実際の侵略のためであれ、データの悪用の可能性を想像するのは非常に簡単です。 各企業がこれにどのように対処するかについて私は興味があります。 Googleがサービスを「パーソナルアシスタント」と呼んでいない理由の1つは、主なビジネスモデルが人々に関するデータを収集し、それをより適切なターゲットに使用することを重視している会社から少し気まずいように聞こえるからでしょうか?

また、これらのシステムの機能を誇張するのは簡単です。 すべてを知っている、すべてを見るマシンのコンセプトは恐ろしいかもしれませんが、 The Terminator のSkynetまたは 2001:A Space Odyssey のHALの意味で「強力なAI」を開発するこれらのシステムについては心配していません近い将来いつでも。 私が参加した最近のパネルである参加者が言ったように、「HALではなくジャービスを考えてください」-2001年の殺人マシンとは対照的に、アイアンマンの映画で身に着けている便利なインテリジェンスについて話しています。問題は、これらのシステムがあまりにもスマートかどうかではなく、本当に便利になるほどスマートか、それとも単にWeb検索のフロントエンドとして使用しているのかということです。

もちろん、悪魔は詳細に含まれており、新しいバージョンが出荷されるまで、どのシステムがどれほどうまく機能するかはわかりません。 音声認識は改善されていますが、これを新しいドメインに拡張すると、より多くの課題が生じます。 また、AppleやGoogleの独自のサービスにデフォルト設定するのとは反対に、使用したいサービスを選択できるようにするために、システムがどれだけ良い仕事をしているかについては明確ではありません。

しかし、全体的な概念は明確であり、ユーティリティは素晴らしい可能性があります。 正しく展開された場合、そのようなサービスは、デバイスをより使いやすく、よりインテリジェントに、よりパーソナライズされたものにする必要があります。 彼らには課題があり、いくつかの懸念が生じますが、タッチスクリーン以来、デバイスとの対話方法を変えるために、彼らはもっと多くのことをするでしょう。

Apple、Google、そしてすべてを知っているアシスタントへの道