ご意見 スカイプで今、音声翻訳の聖杯| ジョン・C ドヴォルザーク

スカイプで今、音声翻訳の聖杯| ジョン・C ドヴォルザーク

ビデオ: ゴールデンボンバー「女々しくて K POPバージョン 」【OFFICIAL MUSIC VIDEO Full v (十一月 2024)

ビデオ: ゴールデンボンバー「女々しくて K POPバージョン 」【OFFICIAL MUSIC VIDEO Full v (十一月 2024)
Anonim

マイクロプロセッサの誕生からコンピューター革命に続いた場合、まだ実現されていない多くの初期の約束があることがわかるでしょう。

これらの1つはオンザフライの翻訳されたスピーチです。英語で何かを言い、スペイン語のような別の言語でほぼリアルタイムで繰り返されます。 まだ進行中の作業ですが、Microsoftは現在、Skype Translatorとの一歩を踏み出しました。

これが機能に近づき、冗談ではない場合、それは10年の産物です。 現在、Skype Translatorはスペイン語から英語および英語からスペイン語への翻訳をサポートしていますが、より多くの言語がフォローするように設定されています。

この種の問題の典型的な問題は、とんでもない難易度です。 うまく機能するテキストからテキストへの翻訳を行うまともな翻訳パッケージはまだ見ていません。 特にリアルタイムでは、音声翻訳の難易度はまったく異なります。

マイクロソフトには、スペイン語と英語で話している2人の子供を映した映画があります。 しかし、ほぼ20年前にIBMによって実証された同様のシステムが、日の目を見ることはありませんでした。 IBMのバージョンは、1990年代に開発されました。2001年に詐欺スキャンダルを破る前に、破産を企てたLernout&Hauspieが率いる音声認識マニアがありました。 Dragon Systems、Berkeley Speech Technologies、Fonix、Dictaphoneなどを含む会社。 マイクロソフトはL&Hの8%の株式を保有しており、最終的に破産別れの贈り物としていくつかのテクノロジーになりました。

これで、Skype Translatorが突然表示されます。 一致? いずれにせよ、この技術全体がこの点に到達するには時間がかかりすぎています。

Googleや他の人が行った悲惨なテキストからテキストへのコンピューター翻訳を見てください。 テキストは最も明白な間違いを回避せず、回避することはできません。 これはどれも、音声変換の複雑さには近づかないため、重い信号処理が必要になります。

私はワインコレクターであり、フランスのワイナリーのウェブサイトを頻繁に訪れます。 私のフランス語は大丈夫ですので、サイトを読みやすくするために翻訳をオンにすることがよくあります。 ここは2014年です。シャトーマルゴーの翻訳がキャッスルマルゴーではなくシャトーマルゴーであることを理解できる翻訳者はいません。 シャトーなど、通常特定のワイナリーを指す固有名詞で使用される一般的に使用される単語を、単語の城に差し控えて翻訳しないのはどれほど難しいですか? どうやらそれは不可能です。 彼らは皆それをします。

翻訳者にボルドーワインに関するウェブサイトにあることを伝えるコードに例外を書くのはどれくらい難しいですか? そのサイトでは、シャトーという言葉は城という意味ではありません。 多くの場合、翻訳者はシャトー名の残りの部分も同様に解読しようとするため、ばかげた結果が得られます。 一般的にテキスト翻訳でできる最善のことは、サイトが何を言っているかを知ることです。

自問してください:テキストが非常に難しい場合、マイクロソフトは音声をどのように管理しますか?

同じ言語でも不可能です。 Google Voice電話サービスを利用してください。 スピーチからテキストへのメッセージ取得機能があります。 その人が実際に言ったことに近い音声からテキストへのメッセージを受け取ったことはありません。 一度も。

静かな部屋ではっきりとはっきりと話すと、音声認識がうまくいくことを認めます。 私はAndroid携帯電話のテキストメッセージに使用します。 しかし、実際の会話では、誰もそのように話しません。 これを展開してくれたマイクロソフトを賞賛します。 しかし、宣伝どおりには機能しません。

とは言っても、それは少なくとも遊ぶものです。 それは研究の新世代を引き起こす可能性さえあります。 だから私はあまり文句を言わないでしょう。

誰もがこれを望んでいます。 作業に戻りましょう。

スカイプで今、音声翻訳の聖杯| ジョン・C ドヴォルザーク