ご意見 ai、mlが音声からテキスト、言語翻訳に変換する方法| ティム・バジャリン

ai、mlが音声からテキスト、言語翻訳に変換する方法| ティム・バジャリン

Anonim

Google I / Oで最も印象的なデモの1つはDuplexでした。これは、ビジネスの場所(この場合はヘアサロンとレストラン)に予約を依頼する人工知能です。 ラインの反対側の人間は一見賢明ではなかったようであり、Duplexは、レストランが小さなパーティーの予約を受け入れないと言ったときのように、簡単に課題に対処しました。

この特定のAIの発表は、Google I / Oで多く取り上げられましたが、AIと機械学習は、開発者会議で示されたすべての製品とサービスで一般的でした。 I / Oが開く前日にGoogleがAIに焦点を当てたアナリストイベントで表示したこのグラフをご覧ください。

そのイベントで示された他の2つのことがあり、私は潜在的なゲームチェンジャーを検討しています。

1つ目は、AIを音声からテキストへの変換に適用する方法です。 目標は、今後数年間でAIとMLを使用してこれを99%の精度にすることです。 とは言っても、さまざまなG-Suiteアプリケーションへのコメントを口述したデモは、すでにかなり正確でした。 また、Smart Composeのより詳細なデモを見ました。このデモでは、人がGmailで文章を作成し、Smart Composeが最初の文章のコンテキストに基づいて次の文章を作成します。

Dragon Dictateなど、さまざまな音声認識製品が何年も市場に出回っています。 しかし、これらのプログラムはローカライズされたソフトウェアに依存しており、各リリースの時点で利用可能な現在の処理能力を利用していました。 これらのプログラムは長年にわたって改善されましたが、AIとMLを広告する場合、精度率は改善されるはずです。

Googleは、日常会話に関連する音声読み上げの重要性を理解しています。 運転中にメッセージに応答する場合、正確な音声テキスト変換インターフェースが重要です。 ウェアラブルやスマートフォンでメールやテキストメッセージに返信する意味のある方法です。 ナビゲーションプロセスの一部として音声を使用し、さまざまな種類のARアプリケーションで音声からテキストを使用する必要がある複合現実眼鏡を使用する場合、最終的には貴重な入力になります。

2つ目は、Google翻訳でAIとMLがどのように使用されるかです。これは、翻訳がリアルタイムで行われるときに、真に変革をもたらします。 英語のみを話す国際的な旅行者として、このタイプの翻訳は天の恵みになります。 あなたの言うことをローカル言語に翻訳しようとするいくつかのハンドヘルドデバイスがありますが、現在多くの制限があります。

Googleはこのタイプの翻訳に注目しているため、まもなくAndroid携帯電話でのより正確な言語翻訳に真のブレークスルーが見られると言っても過言ではありません。 Appleは、音声およびテキストの翻訳のさまざまな側面に関するAIおよびMLの研究も行っているため、潜在的なパートナーとともに、いつかiOSでモバイル言語翻訳ソリューションを提供できる可能性があります。

AIとMLは、音声からテキストへの翻訳に劇的な影響を与えます。その最も顕著な効果は、ARおよびVRまたは複合現実眼鏡のUIの一部としてのものです。 個人的に、言語の翻訳は私の世界を旅しやすくするので、私を最も興奮させます。

ai、mlが音声からテキスト、言語翻訳に変換する方法| ティム・バジャリン