目次:
ビデオ: Faith Evans feat. Stevie J – "A Minute" [Official Music Video] (十一月 2024)
会話型人工知能(AI)は、テクノロジーとの対話方法を根本的に変えています。 2011年にSiriから始まり、過去半年にわたって進化しました-最初はスマートフォンのオペレーティングシステム(OS)で、現在はさまざまなフォームファクターでネイティブに利用可能です-デジタルアシスタントまたは仮想アシスタントは、私たちの日常のユーザーエクスペリエンスのより深い要素になっています( UX)。 仮想アシスタントが私たちのためにもっと多くのことをしていて、どこにいても既存のものに慣れるにつれて、次の質問は次のとおりです。
AmazonのAlexa、AppleのSiri、MicrosoftのCortana、およびGoogle Assistantは、情報を検索し、スケジュールを整理し、あらゆる種類の日常的なタスクをより直感的な方法で完了するときに、音声起動ヘルパーになりました。 これは、ハンズフリーテキストを送信したり、Amazon Echoで音楽を再生したり、Google HomeでUberライドやピザを注文したりすることを意味します。 これらの単純なタイプのアクションはほんの始まりにすぎません。 また、この種のAIの価値が、より複雑なシナリオやビジネス設定で見られるようになっています。
CortanaとGoogle Assistantは、コンピュータービジョンやその他の機械学習(ML)アルゴリズムを取り入れた魅力的なイノベーションに加えて、生産性の最適化に向けた状況に応じたリマインダーと推奨事項により、よりスマートになっています。 Alexaはサードパーティスキルの多様なエコシステムを構築しており、GoogleとMicrosoftはこれに追随しています。
GoogleのAlexa Skills Kit、Cortana Skills、およびActionsは、企業や開発者に、電子メールマーケティングやeコマースから経費追跡や車両管理まで、音声技術をすべてに適用するツールを提供します。 これらのビジネスアプリケーションとユースケースは、これまで見てきたものだけです。 PCMagはAmazon、Google、Microsoftの幹部に話を聞いて、彼らの仮想アシスタントビジョン、技術の進化、およびこれらの企業が音声対応AIヘルパーでビジネスができると信じていることを理解しました。
仮想アシスタントとは何ですか?
それをデジタルアシスタント、仮想アシスタント、または音声アシスタントと呼んでも、ユーザーがNLを使用して質問したりコマンドを実行したりできるエージェントまたはアプリのことを言っています。 仮想アシスタントは、スマートフォンやデスクトップ、接続されたスピーカー内、または必要なときに特定のアプリやサービスで呼び出されるなど、さまざまな形で存在できます。 たとえば、Google Assistantは、Google PixelやGoogle AlloチャットアプリなどのAndroidデバイスで利用できるようになり、iPhoneとTVの両方で利用できるようになりました。
GoogleアシスタントのプロダクトマネジメントディレクターであるGummi Hafsteinsson氏は、次のように語っています。「人々がテクノロジーと対話するための自然な方法を探していました。 「会話はあなたが考えることができる最も自然なインターフェイスであり、それは私たち全員が非常に自然に行う方法を知っているものです。」
PCMagは、今年初めにバルセロナで開催されたMobile World CongressでHafsteinssonと話をしました。 HafsteinssonはGoogleでキャリアをスタートし、GoogleマップとGoogle音声検索の立ち上げを支援しました。 その後、Appleで数年間過ごし、Siriで働き、2014年にGoogleに買収されたスマートメッセージングスタートアップEmuを設立しました。Hafsteinssonは、Googleに戻って以来、Google Assistantに取り組んでいます。
「Google Assistantは現在、Allo、車、Android TV、Android Wearの新しいバージョンに搭載されています。…アシスタントを搭載できるデバイスの種類を拡大しています」とHafsteinsson氏は述べています。 「Alloグループチャットでは、アシスタントに旅行情報を求めて会話で共有できます。アシスタントはUberなどのサードパーティサービスともやり取りします。」
Hafsteinsson氏によると、仮想アシスタントが解決しようとする課題の1つは、対話する必要のある各サービスを理解しなくても機能するインターフェイスを作成する方法です。 Googleは製品スタック全体にインテリジェンスを組み込み、Google Assistantを使用して、ますます複雑化するデータセット、統合、および自動化されたロジックを導入しながら、UXをシンプルに保ちます。
「機能する唯一のインターフェイスは、習得する必要のないインターフェイスです」とハフシュタインソン氏は述べています。 「アシスタントは、サービスであろうとデバイスであろうと、自然界のあらゆるものへの自然なインターフェースです。そして、私たちはあなたのために機能する方法でそれらすべてを一緒に調整します。」
重要な違いの1つは、仮想アシスタントをチャットボットから分離することです。 チャットボットは、非常によく似たタイプのエクスペリエンスを提供します。ユーザーが仮想エージェントと対話するための会話型インターフェイスです。 しかし、その範囲は仮想アシスタントよりも狭く、デジタルエクスペリエンス全体で広く利用されており、幅広い用途に対応しています。
NLコミュニケーションの手段を省いて(チャットボットは通常、音声起動の会話ではなくテキストベースのチャットを使用します)、チャットボットは仮想アシスタントができることのターゲットアプリと考えることができます。 Microsoft CEOのSatya NadellaとFacebookのメッセージング製品責任者のDavid Marcusは、チャットボットをアプリの新しいバージョンと位置付ける同様の感情を表明しています。 Facebook MessengerとMicrosoftのボットディレクトリを見ると、その論理は当てはまります。
チャットボットはよりスマートになり始めていますが、企業にとっての主な機能は、特定のアプリ、ブランド、またはサービスの仮想エージェントとしての機能です。 チャットボットは、顧客が旅行の予約、買い物、eコマーストランザクションの完了、顧客サポート情報の取得、会話型インターフェースを介したヘルプデスクチケットの送信などを支援します。 チャットボットが特定のアプリ内でタスクに設定された仮想エージェントである場合、仮想アシスタントは、OS全体でAIを自由に統治するときに発生します。
Context-as-a-Service
バーチャルアシスタントの価値は、どこにいてもそこにあることです。必要に応じて、必要に応じてカスタマイズされた情報を提供します。 Cortanaの場合、AIの起源は肉と血のパーソナルアシスタントと、ビジネスでの機能に由来します。
CortanaのシニアマーケティングマネージャーであるLaura Jones氏は、同社の前回のレドモンドキャンパスでの会議中に次のように述べています。月。 「彼らは何をするかについて、パーソナルアシスタントとのこれらすべてのインタビューを行いました。それが、単なる音声インターフェイスではなく真のデジタルアシスタントを作成するための出発点でした。」
マイクロソフトは、この技術を構築している他の技術の巨人よりも、ビジネスソフトウェアと生産性に深く根ざしています。 Cortanaは、Microsoft Power BIからSkype for Businessに至るまで、多くのMicrosoftのアプリとサービスで有効になっており、現在のアプリを離れることなくビジネスクエリへのコンテキスト応答を即座に提供します。Cortana(AlexaおよびGoogle Assistant)もプラットフォーム。 Cortanaは、AndroidおよびiOSのアプリとして、またCortana Device SDKを通じて利用できます。 ジョーンズは、仮想アシスタントはあなたと一緒にいるときだけ良いと言いました。
「初期の学習の1つは、すべてのパーソナルアシスタントが誰かについて知っていることを保持することです。そうすれば、彼らは彼らをよりよく助けることができます」とジョーンズは言いました。 「したがって、私たちがやりたいことの1つは、実際に体験を誰かにパーソナライズすることでした。そのため、Cortanaから得た支援はあなただけであり、重要なことを積極的に追跡できました。」
Cortanaがこれを行う最も簡単な方法は、リマインダーを使用することです。 スケジューリング、リマインダー、およびリストは、仮想アシスタントの最重要ビジネスユースケースです。 ジョーンズは、Microsoft Surface ProなどのタッチスクリーンデバイスでCortanaを使用することについて話しました。 Windows 10 Anniversary UpdateのSmart Sticky Notesでは、入力するか、Windows Inkの一部としてスタイラスを使用してメモを書くことにより、「午後3時に私のボスに電話してください」などのことを書くことができます。 Cortanaはそのリマインダーを追加して、タスクを追跡します。
また、MicrosoftはWunderlist(間もなくMicrosoft To-Doとなる)と協力して、Cortanaを統合し、デバイス間でリストを同期しています。 これはすべて、より積極的な戦略の一部であり、コンテキストデータと場所ベースのリマインダーの両方を使用して、ユーザーが電子メール、スケジュール、および日々のコミットメントを管理できるようにします。
「私たちは、リマインダーを他のレベルに持ち込んで、メールで行ったコミットメントについて積極的にリマインドしている」とジョーンズ氏は語った。 「したがって、レポートのこのセクションを更新するというメールを送信した場合、Cortanaはそれを選択して思い出させます。これは本当に魅力的なエンタープライズシナリオであると思います。 Cortanaは1日に何度もこのミーティングを設定するか、またはフォローアップする必要があることを通知し、その後すぐにフォローアップできるようにメールにディープリンクしますまたはリマインダーを設定します。」
マイクロソフトは、これをさらに拡張して、Office 365全体のデータに基づいてCortanaのTo Doリストと表面情報を動的に作成することを検討しています。Cortanaは、Microsoft Edgeブラウザーに既に完全に統合されています(Edge to Askで強調表示された単語を右クリックできます) Cortana)、およびOneDrive for BusinessやSharePointなどのアプリ全体でドキュメントまたはユーザーを検索できます。また、Windows 10 Creators UpdateはCortanaをMicrosoft Azure Active Directory(AAD)と統合して、以前はアクセスできなかったエンタープライズユーザーにAI機能を提供しました。 これらの種類の統合はPower BIにも拡張され、Cortanaデータをビジネスインテリジェンス(BI)クエリおよびレポートに取り込むことができます。 これは、機械学習(ML)と予測分析をビジネスアプリに組み込む別個のエンタープライズ製品であるCortana Intelligence Suiteと混同しないでください。
さらにジョーンズ氏によると、CortanaチームはCalendar.help(まだプレビュー中)などのプロジェクトを通じてMicrosoft Researchと協力して、組織外の連絡先との会議のスケジュール設定などのプロセスを自動化しています。 チームはMicrosoft IT部門(MSIT)開発チームとも協力して、さまざまなアプリやコンテキストデータを取り込むCortana固有のエクスペリエンスを作成しています。
「仕事でCortanaの存在感を高め始めたら、朝起きてスピーカーデバイスでCortanaにスケジュールを尋ねることを考えてください」とジョーンズは言いました。 「私たちはそれを広めたいと思っています。仕事に着いたときにCortanaに何かを思い出させてくれるなら、PCを開いてそれを手に入れたいです。」
Jonesは先月、Microsoft Buildでこれらのラインに沿ってデモを行い、新しいHarman Kardon Invokeスピーカーを通じてCortanaに今後の予定と予定項目について尋ねました。
仮想アシスタントがよりスマートになる方法
AIをより多くのタスクを実行して実行するようにプログラムするほど、より多くのタスクを実行できます。 この点で、仮想アシスタントは、MLアルゴリズムとニューラルネットワークが大規模なデータセットでトレーニングされるディープラーニングプロセスと共通点があります。 特定のビジネスタスクを実行するための仮想アシスタントのトレーニングは簡単です。 必要なのは、エコシステムをサードパーティのスキル開発に開放することだけです。
この点で、Amazonは標準の担い手です。 Alexa Skills Kitは2015年から提供されており、企業や開発者が望むビジネス環境やプロセスにAlexaを適用できます。 その結果、企業が簡単に有効化して使用を開始できる幅広いビジネススキルの選択肢が既にあり、そのエコシステムが成長しています。
「Alexaのスキルを使用して会議室を自動化するスキルを構築し、メールやカレンダーに接続する人々を見てきました。企業は、Alexaを多くの企業シナリオに再利用しています」と、デバイス担当シニアバイスプレジデントAmazonでは、AmazonのすべてのデバイスでAlexaの開発を監督しています。
GoogleとMicrosoftは、それぞれ、GoogleのActionsとCortana Skillsを使用して、この分野でAmazonのリードに続いています。 これらのツールキットを使用すると特定のスキルを構築できますが、自然言語処理(NLP)と、適切なコンテキストでユーザーにスキルを推奨するためのプロアクティブな提案などの機能を組み込むように進化しています(たとえば、通常のランチの食べ物を注文することを思い出させるなど)会議)。
PCMagは最近、ニューヨーク市で開催されたWired Business ConferenceでLimpに追いつきました。 Limpは、Amazonはエンタープライズビジネス向けのAlexa機能を積極的に構築していないと述べた。 最も強力なエコシステムを持つことの利点は、企業がプラットフォームを利用して必要なものを構築し、場合によっては、その経験を大規模なAmazonのハードウェアと組み合わせることです。
「エンタープライズ分野では、すでに多くの魅力的な用途があります」とリンプは付け加えました。 「ウィンホテルズはすべてのホテルの部屋にエコーを設置しているので、その部屋を自動化するすべてのユースケースを想像してください。もう1つのエンターテイメントはシアトルのスタジアムの1つで、スタジアムはスカイボックスに入れてスコアを取得し、食べ物を注文していますまたは、カスタムスキルを作成することもできます。」
Limp氏によると、次のステップでは、これらのすべてのスキル(現在13, 000以上)を簡単に見つけて管理できるようにします。 アプリストアは、ロングテールアプリの発見可能性をまったく解決していません。 その後、彼は仮想アシスタントプラットフォーム全体の統合と標準化を行い、この「100万のスキルの世界」を結びつけることだと言いました。
「私たちの見解は均質ではありません。私たちの希望と最初の努力は、Alexaを強化するスキルに環境を開放することでしたが、時間が経つにつれてCortanaまたは別のアシスタントを呼び出すことを想像できます」とLimp氏は言います。 「「アレクサ、シリXに聞いて」と言うことができるはずです。 Alexa、Siri、Cortana、およびGoogle Assistantの違いは他の何よりも水平的です。これらのAIの相互運用方法に関するオープンな標準は、非常に重要です。オープンで公開されています。世界はそのように見えます。」
相互運用性はさておき、このスペースはまだ数年前のものです。 アマゾンは昨年、スペースのイノベーションを促進するためにアレクサ基金を立ち上げ、ベンチャーキャピタル(VC)への最大1億ドルの投資をベンチャーキャピタル(音声および仮想アシスタント技術ができることの境界を押し上げる確立されたブランドの両方に投資することを約束します)。 GoogleとMicrosoftは、継続的な研究にも多大な投資をしています。
MicrosoftのJonesとGoogleのHafsteinssonはどちらも、仮想アシスタントが消費者に広く採用されるだけでなく、日常の業務に本当に浸透する前に、NL処理と会話の理解を改善する必要性について話しました。
「全体として、業界はまだ非常に早い」とマイクロソフトのジョーンズ氏は語った。 「養子縁組は早い。家庭に対する関心が高まり、生産性と仕事に大きなチャンスがあると見ているが、それは私が言っていることを理解することだけではない。特に、この技術をより会話型のプラットフォーム。」
GoogleのHafsteinssonは、この技術のさまざまなコンテキストと新しいユースケースのほんの一部をかじっているだけだと攻撃しています。 採用数を見るよりも重要なことは、仮想アシスタントの存在とコンテキストの利便性が徐々に私たちの行動を変えると感じていることです。
「過去2年で、この技術の爆発的な増加を見てきました。しかし、その将来は数字に基づいていないことを理解する必要があります」とHafsteinsson氏は述べています。 「それは人間にもたらす利点に基づいています。あなた自身の責任で無視してください。」