Appscout 早送り:ドルビーの主任科学者、ケシのクラムとの質疑応答

早送り:ドルビーの主任科学者、ケシのクラムとの質疑応答

ビデオ: 不要嘲笑我們的性 (九月 2024)

ビデオ: 不要嘲笑我們的性 (九月 2024)
Anonim

今年のSXSWでは、仮想現実と拡張現実がホットな話題でしたが、会話はヘッドセットを超えて広がりました。 真に没入型であるためには、経験は五感すべてを取り入れる必要があります。 視覚、音、感触、匂い、さらには味覚。

サラウンドサウンドからHDRイメージングまですべてを開拓してきたドルビーほど、テクノロジーと人間の感覚について詳しい会社はありません。 私は幸運にもショーでドルビーラボラトリーズのチーフサイエンティストであるポピー・クラムと座りました。

Crumは、スタンフォード大学の音楽と音響のコンピューター研究センターおよび記号システムのプログラムの非常勤教授でもあります。 Crumは、IEEEのTech for Humanityシリーズの一部としてSXSWにいました。 彼女は音だけでなく、もっと多くのことを理解しています。

コスタ:ポピー、今日は参加してくれてありがとう。

Crum:私をお迎えいただきありがとうございます。 ここにいて良かった。

それで、私たちは可聴周波について話し、拡張現実について話し、少し仮想現実について話し、多分私たち二人が経験する痛みのない片頭痛について話します時間に。 まず、ドルビーでのあなたの役割。 あなたにとって就業日はどのようなものですか? オフィスに着いたら何をしますか?

私たちには、感覚神経の専門家である計算神経科学者と人々の大規模なチームがあります。 ドルビーの歴史を振り返り、50年前の会社の中心に戻っても、それは常に人間の経験の理解でした。 テクノロジーの構築についての考え方を差別化するのに役立ったと思います。

ですから、毎日、私のチームのメンバーと一緒に仕事をする人々は、テクノロジーを見渡しています。 私たちはもはや単なる音ではなく、全体的な感覚についてです。 私たちには実験室があり、1日を通して多くの実験が行われています。

新しい建物には最大100のラボがありますが、驚くべき生物物理学のラボがあります。 私の経歴は神経生理学者であり、私たちのチームの多くの人々と同じです。 そして、新しいテクノロジーについて考えるために毎日起こっている人間の生理機能があり、多感覚の情報をどのように体験するかについて考える非常に独創的な仕事があります。そして、それが私たちの体にどのように影響するか、他の人と私たちの感覚にどのように関与するかにどのように影響するかを意味します。

ショーでお話ししたことの1つであり、PCMagについて詳しく説明したことの1つは、この可聴セグメントです。 私たちの聴衆の多くが知っていると思うのは、聴覚障害という言葉ではありません。 「ヒアリング可能」という言葉を聞いたとき、それは何を包括しますか? どういう意味ですか?

今、私はそれがまだ定義されている用語だと思います。 私はそれを製品と可能性の非常に大きなサブセットとして捉えたいです。 それはワイヤレスデバイスであるか、場合によっては有線です。 Amazon Echo Iは可聴電話を呼び出してプラグインされますが、マイクまたはセンサーを備えたデバイスですが、環境からデータをキャプチャし、何らかの方法でそのデータを使用してエクスペリエンスを向上させます。 また、現在、ウェアラブル空間で考えている多くの企業があります。これはワイヤレスで、身体に装着されるデバイスですが、Google HomeとAmazon Echoを見ると静的な聴覚音もあり、それらは変革的です。

可聴とは、必ずしもあなたの周りの音を強化することを意味するわけではありません。 それはあなたの周りの音に関する情報を取得し、それを何らかの形であなたに世界での強化された体験を与えるためかもしれません。 キャプチャーについて考えることができます…耳は、生物物理学的情報を取得するのに最適な場所であり、そこで多くの情報をキャプチャーすることができます。 明らかに、あなたの周りの音、あなたの会話についての情報をキャプチャする分析が、あなたの一日を強化するか、あなたを最適化する方法としてそれを使用することを想像できます。

これには多くの懸念もあります。 私が考えていることの1つは、声を上げる価値があり、この空間が規制の変化であるものを変革し、定義する助けになると思います。

現在、補聴器は可聴です。 補聴器は拡張現実デバイスですが、聴力損失を軽減する機能を備えたこのクラスの消費者向けデバイス、正常な聴覚を持つ人のための拡張現実デバイスになる能力、ゲームデバイスになる能力さえも備えています。 これらの分野のクロスオーバーに、このより大きなクラスに分類される医療機器を取得し、これらの境界を明確に超えて、私たちのために多くの同様の処理を行う消費者向け機器のクラスを持つことになります。

補聴器に関しては、人々は補聴器を、聴力を失い始めると補聴器を手に入れることができると考えます。補聴器を使えば、聴力をいくらか戻すことができますが、で聴覚を増強し始めました…彼らは正常な聴力を持っていますが、彼らは通常の聴力以上のものを望んでいます。

絶対に。 私は、「今、私は難聴になりました」と言うこのarbitrary意的な境界線を作らないことを常に信じています。 私たちの聴覚は、世界の多くの要素と音のために、アスピリンでさえ耳毒性であり、

そうですか?

絶対に。 あなたが私たちの聴覚に入れた要素の組み合わせは、20代前半、そしておそらく人々が耳にする大きな音のいくつかでさらに早い段階で劣化し始めます。

特に南西部の南。

はい。 聴覚には、さまざまな機能があります。 コンテンツをデバイスに直接ストリーミングすることを制御しているかどうか-ワイヤレス-要素の制御、情報の空間化。 私たちが話すこと-。 情報を取得し、Google Glassまたは他社製のこれらのデバイスを使用して視覚を増強し、実際に-私たちが望むもの-その音のコンポーネントは、私たちが容量制限と呼ばれる場合があります。 そして、私たちの世界から情報を取得し、それを本当に音として表現すること。

サウンドと音声のコントロールや音声のやり取りについて人々に異なる考え方をさせたのは、プライバシーもGoogle HomeやAmazon Echoのようなデバイスであるように思えます。世界にはさまざまな結果がありますが、私たちはそれを整理し始めたばかりだと思います。 その市場はどこに向かっていますか?

それは素晴らしい質問です。 私は言わなければならない、私はこれらのデバイスは非常に多くの点で変革的であると思います、そして私は強力なユーザーであり、それらの強力な共有者でもあります毎日の私の人生。 人々は常にマイクをオンにすることをいとわないという考えは大きな飛躍です。 それで何ができますか?

今、声は素晴らしいものです。 それは人々にコントロールを与えています。 生活の中でアシスタントとしてこのデバイスを使用するために彼らを乗せています。 10年後、私は自分の人生でもっと多くのものをコントロールする必要はありません。 私は自分のデバイスに…必要なものを知るために私が信頼するよりも、自分のデータをもっと信頼するつもりです。

予想的。

絶対に。 せきをして体温を調節しているかどうかにかかわらず、積極的に周囲の音に関する多くの情報を取得してもらいたい。 または、すべてのデバイスを制御することなく、私たちの人生を前進させる必要があるとき、または私たちの生活を前進させることができるようにするために、私のために私の予約をします。

エコーは、あなたがスニッフィングしているかどうかを検出できると想像できます。 喉の痛みのように聞こえるか、咳をしているのかを検出し、風邪のように聞こえることを知らせます。

先に行くとあなたの前にあなたのためにあなたの医者の予定をスケジュールするには。 それを望んでいるのは少し遠いように思えますが、同時に私たちはそこに着くと思います。 音声制御を持ち、これらを私たちの生活に統合するステップは、私たちにそれを快適にするだろうと思います。

将来、私たちが不快になるのは、物事がうまくいかないとき、なくなったとき、そしてなくなったときだけです。

Echoを使った経験があり、自分が持っていた相互作用をどれだけ超えて、さまざまな人口統計の人々を助けることができるかを実感しました。 しかし、はい、人々はアクセシビリティのためにこれらのデバイスについて多くのことを考えていると思います。それは素晴らしいことです。 非常に小さな子供、異なる年齢層、または異なる人々の両方に提供できるアクセスのように…

技術を使用して埋めることができる障害または欠点またはギャップがある人々。

絶対に。 私の場合、私は病院にいた親relativeがいて、数週間前に亡くなりました。 エコーが出たとき、私は彼を買った。 私は彼にアクセシビリティ機器としてEchoを購入しました。 これが変換です。 私はそれを病院に持って行きました、そして、このような装置は病院の設定にとって驚異的です。 プライバシーの問題を考慮することが重要になりますが、その設定で音楽を再生するために主に使用します。

しかし、この時点で、私の親relativeはあまりボーカルではなく、話していませんでした、そして、エコーで音楽を演奏していました。彼が聞きたいと思っていたもの、バッハと非常に落ち着いた音楽、そして正直に言って、彼が言った最後の言葉は、冗談ではありません。覚えているのは、「アレクサ、アル・グリーンを演じる」でした。 彼は彼女にアルグリーン、スライ、ザファミリーストーンを望み、このデバイスは彼にそのアクセシビリティを与えました。 それは力を与え、かつて非常に強力でした。

そこには多くの技術が使われています。 Al Greenが利用可能であり、音声コマンドのないこの広大な音楽ライブラリがあり、音声コマンド自体があるので、彼は個人的にそれを要求することができます。 そこには多くのことが起こっています。

あなたがプライバシーの問題を提起するとき、それは別の質問であると思います、Alexaが私たちの医師の予約をする前に、私はいくつかの製薬会社が私たちに風邪薬のテーブルを提供するか、私たちのアレルギーが機能してZyrtecを提供することを疑っています、そして、それは、キャプチャされているすべてのデータを誰が制御し、このオーディオ形式で提供しているのかを通過するための、ほぼ中間段階のステップだと思います。

私たちはそれを受け入れなければなりません。 規制面について考えず、現在よりもさらに多くのデータを提供することで人々を安心させる方法について考えない場合。 Amazonは「あなたがAlexaと言ったときだけ聴いている」と今言っていると思いますが、これらのデバイスが本当にできることをするためには、常に聴かなければなりません。

現在、企業、保険会社、自動車保険であろうと健康保険であろうと、消費者に取引を提供するか、データの追跡を許可している場合(データを提供する場合)に料金を引き下げる方法の大きな傾向があります。 非常に強力だと思います。 それは私たちの未来の一部になると思います。それについては疑いの余地はありませんが、そのデータを共有することの影響はまだ定義されておらず、予測することはできません。 ですから、私たちは本当にその未来がどのようなものかを考えなければなりません。

また、人々は「ヘルスケア会社や保険会社に毎週ステップ数を与えても構わない」という永続的な問題があると思いますが、その情報はどこにも行きません。今週の検索は30年後に検索可能になり、インデックスに登録されます。今日私たちが一緒に住んでいるデジタル永続性という考え方は、人類の歴史上、これまでになかったものです。 キッチンでマイクを常時使用できるという事実を追加すると、そのデータはどこにも行きません。 Amazonは常にそれを持っています。

その未来は書かれておらず、その影響を知りません。 私たちはこれらの規制を定義していませんが、多くのものが変わる可能性があるため、それらは将来変更されることさえあります。

そして、もう一つあります。 文化的には、EUは消費者保護のための規制法を今よりも多く制定しようとしていると思いますが、データが存在するためそれが何を意味するのかは明確ではありません。 旅行中は相互運用性を確保する必要があります。 小さなIoTデバイスのセキュリティを確保する必要があります。 それは本当に重要なことです。 NISTのようなグループはこれを解決するために非常に積極的だと思います。

ドルビーが行っていることと、彼らが取り組んでいるすべてのテクノロジーを見ると、共通のテーマが見え始めます。その1つは、会社が本当に人間に超感覚的な知覚、超人間の力を与えようとしているということです。 それは上に聞こえます。 誇張に聞こえますが、テクノロジーを使用して超人的な力を得る人々の例がたくさんあります。 それらのいくつかについて話してもいいですか?

絶対に。 ですから、私は神経生理学者としてのバックグラウンドから来ました。神経生理学者は、これらのことをテクノロジーにどのように統合するかを考えています。重要なことがいくつかあります。 拡張現実とは何か、または今日テクノロジーが私たちに何ができるかを考えるとき、私がドルビーに初めて参加したとき、ドルビービジョンに取り組んでいたのかもしれません。ドルビービジョンは高ダイナミックレンジでより広い色域の画像技術です。 アイデアを得るために、約3年前に購入した典型的なディスプレイは、1平方メートルあたり300〜400カンデラだったでしょう。 月、自然の月は約1〜2000、黒い舗装の日光、1平方メートルあたり最大15, 000カンデラになります。

そのため、ディスプレイ技術は、実際の感覚システムが処理できるものとはかけ離れていました。 また、開発の過程で、いくつかのコンテンツとデバイスを使用して、1平方メートルあたり最大20, 000カンデラの輝度を得ることができました。

そして、これは必ずしもコントラストではなく、これは解像度ではなく、これが明るさです。

はい、知覚と感覚の観点から、多くの視聴距離で、知覚システムが解像度に関して処理できる感覚システムが最大限に活用されています。 しかし、明るさと色域に関しては、私たちは近くにいませんでした。 ですから、「この分野で経験を高め、この分野でリードできる分野があるのです」と言うのはとてもエキサイティングです。 それはかなりエキサイティングです。

そのため、これらの研究を行う際に、これがどれほど強力であるかを認識させ、没入型テクノロジーがどうあるべきかを再定義したと思います。 火の内容とカンデラを見ていました。 私たちは1平方メートルあたり約4〜6千カンデラで遊んでいたと思います。私はそれを見ていて、私の顔が火だけに反応するのを感じました。 この男は私に炎を吹きつけていたので、この大きな鏡面反射光、本当に明るい炎があり、私は「ああ」と思った。 ディスプレイ自体が熱を発生している必要があります。 それで、私は主要な開発者の一人と話をして、彼に尋ねました。 彼は「それは一定でなければならない」のようでした。 そこで、サーマルカメラを入手し、サーマルイメージングを使用して画面を追跡しました。 それは完全に一定でした。 しかし、コンテンツに依存する人々の顔に一貫した変化を示すことができました。

網膜に届く輝度に基づいて、私の脳はこう言っています。「さて、これほどリアルではないほど明るい炎を経験したことはないので、確率的に、私の脳はあたかもその火で振る舞いますリアル。"

だから今、没入型テクノロジーと超大国の作成と経験の作成を考えるとき、それらが自然な方法で本物の方法で私たちの生理学的システムに関与していることを考え、それからそれらを強化することができます。 私たちには、あなたが自然界で経験するかもしれないものを超える能力があり、それは非常に強力になります。

ええ、それは素晴らしい例です。 また、PCMagで多数のERシステムをテストした方法についても少し話しました。 そこには非常に有望な技術があります。 私たちは常に画面上、解像度上でどのように見えるかに焦点を当てていますが、仮想現実と拡張現実への音声コンポーネントは視覚コンポーネントと同じくらい重要であり、体験を売り込むのに役立ちます。 そこに何を見つけているのか、それがどの程度体験に追加されるのかについて少し話していただけますか?

私たちの会社だけでなく、他の会社全体の大きなトレンドは、あなたが他の感覚なしでは1つの感覚を勉強できないという認識です。 ARとVRの将来のデバイスと全体的なデバイスを検討している場合。 現在、すべての主要なVRデバイスは視覚的ですが、補聴器は、私が懸念している限り、これと呼ばれたくないかもしれませんが、拡張現実デバイスです。 それは基本的な生理学的システム、その状態から増強しようとしています。 人工内耳は、最初に埋め込まれた生物物理学的装置の1つです。

拡張現実で私たちが何を望んでいるのか考えてみてください。 私たちは世界の経験を高めたいと思っています。 私たちは、それを妨害し、かつて私たちが今までやってきたことをすることができないほど多くのデータを与えてくれるものではないことを望んでいます。 今、私たちは本当にクールな体験の傾向にありますが、私たちの生活の日常的な活動をより良くすることを楽しみにしている方法で、私たちは強化し、触れていません。 そして、それらが強化されているので、私たちは人々とより深く関わり合うことができます。 例を挙げて説明しますが、実際には、つながりたいと思っています。 私たちは私たちの生活に携わりたいです。 より多くの情報を取り入れたいと考えています。 経験を高め、これらの経験の豊かさをコントロールできるようにしたいのです。

したがって、キャプチャできるすべてのデータを取得する場合、または…より多くのデータが常に優れているとは限りませんが、視覚を強化しようとする場合…軍隊でこれが発生しているのを見たことがありますARを作成したいテクノロジーで起こり、強化しようとしている情報を取得し、それをすべて視覚システムに入れます。 それをすべてメガネに入れるか、見なければならない場所に置きます。 まあ、私たちの脳はそれほど多くの情報を処理できません。 同時に取り込むことはできません。

それが音です…私たちはある意味で容量制限がありますが、何を推測しますか? 私たちには他の感覚があります。 そして突然、この店全体を開いて、実際に体験を強化するために実際に使用できます。 これは決まり文句ですが、生理的な体験を作成することに関して、怖い映画を見て怖いときはどうすればいいですか? 音を消します。 ですから、それは本当に内臓的な部分であるだけでなく、取り込むことができる情報の量と処理できる情報の量の観点から、ライフスタイルを強化し豊かにする絶好の機会です。 音声を分離したり、音声要素を空間的にばらばらにしたりするだけで、脳と情報をまったく役に立たなくするのではなく、それらを同時に処理できます。 それは、私たちの脳と認知能力のすべてが、その1つのことをすることによって取り上げられることを防ぎます。 それは私たちの状況認識と私たちにできることを本当に開きます。

オーディオコンポーネントとこれらすべてのVRの物は、私たちがそれらをテストし始めると、私たちがすべてのレビューに入れているものです。それはこのように見え、それはこのように聞こえます。部品の合計。

ARまたはVRのサウンドでは、さまざまなことができます。 明らかに、空間化されたエクスペリエンスを作成することは重要ですが、それは重要な部分です。 ドルビーアトモスは、オブジェクトベースのサウンド配信とレンダリングの一例です。 そのため、Atmosで物事が作成され、サウンド要素がデータパッケージと共に存在する場合、それにデータストリームが添付されます。 だから、想像できる、それは非常に強力なことができます。 それは音がどこにあるべきかを教えてくれます。 そのサウンドをどのように再現しているかに関係なく、その場所があります。 幅があり、音量がありますが、GPS座標も可能です。 また、あらゆる種類の情報を持つことができます。 発生している相互作用について何かを知っている場合、それがあなたにどのように影響するかについての感情的なコンテンツを将来持つことができます。

これらは、発生する可能性がある将来のタイプのタイプです。 ARデバイスについて考えると、多くの情報を提供できます。 現在、地図を使用して携帯電話や車を見下ろしています。 これらのことは非常に簡単にラボで行うことができ、音声ではなく追跡情報を提供して音声で伝えるだけでなく、音がどこにあるのか、どこに行くべきかを知らせるpingを与える、音化バージョンを作成できます。 問題は、ユーザー間で堅牢で一貫性があることを確認する必要があることです。これはより複雑な問題です。

マッピングは、それがまだ全般的にスクリーンベースであるという素晴らしい例であり、Google Glassがリリースされたとき、このすべての情報、この小さな小さなウィンドウが視覚ディスプレイに表示されます。 私が本当に欲しかったのは、右に曲がるか左に曲がるかを耳で教えてくれることでした。

うん。

そして、あなたはすぐそこにいて、耳のすぐ隣に、あなたは私に音声コマンドを与えることができます。 ウェアラブルソリューションに関しては、視覚システムよりも優れたオーディオシステムとサウンドシステムだと思いました。

絶対に。 繰り返しになりますが、ここで重要な点を見つけたと思います。これらはすべてツールであり、現在、私たちには、ニューロ制御などを含む驚くべき方法で使用できるツールがありますが、問題はそうではありません…それはデータ、テクノロジー、ユーザーがターゲットとしているユーザーエクスペリエンスに適したツールを選ぶことです。 あなたは、個人と彼らが達成しようとしていることのために、文脈的に最適化してパーソナライズする必要があります。それは、私たちが今構築しているものの大きなギャップです。 驚くべき技術と、それはさらに豊かになります。 しかし、それは動き回り、私たちは到達しようとしていることを受け入れ、人間のシステムとしてどのようにそれを最もよく体験できるかを考えなければならないと思います。

好きなことの1つは、他の種を見ることです。 カエルでもハエでもコウモリでも、肉体や脳の粗い見方があなたに伝えるかもしれないことをはるかに超えるものを実行するこれらの驚くべき超大国を持つ種であるかどうかを見ることができます。 彼らがその問題をどのように解決するか、そして彼らの進化が彼らのためにその問題を解決した理由を理解することは、私たちに洞察を与えます。 そう考える必要があります。 システムの環境への圧力とは何か、そしてテクノロジーがそれをどのように解決するのに最も役立つのか、さらに考える必要がありますか?

そして、ますます多くのデータを配信することが常に正しいソリューションとは限りません。

まれに、まれに。 つまり、私たちが人間として成功するのは、私たちの脳が捨てるものです。 私はいつも幻想について話している、幻想が大好きです。 彼らは楽しいですが、彼らは私たちの脳が物事を間違ったときのこの美しい洞察でもあります。 世界のデータを正確に経験すると、実際には、世界で機能していないという病的状態に陥ります。 そして、私たちの脳が常にしていることは、特定の情報に重みを付け、異なる情報にさえ気付かないようにすることです。 光によって生じるすべての輝度の変化に気付いた場合、全体的なオブジェクトは表示されません。 私たちは機能する必要があり、何に対して行動するかを知る必要があり、それが強力なものです。

私はすべてのゲストに尋ねるいくつかの質問をさせてください。 1つ目は、夜に起きていることは何ですか? 今後どのような技術トレンドに関心がありますか?

2つのこと。 すでに触れたと思いますが、この種の超大国を作成することには多くの力があり、ARとVRでできることはあります。 私が望んでいるのは、ツールとして構築しているすべてのテクノロジーを見て、最もシンプルで最も適切なツールを使用することです。堅牢だと思いますが、意図したエクスペリエンスを得るためにすべてのユーザーで一貫しています。最もセクシーで光沢のあるものよりも。

もう1つは、データに関するものです。 マイクに常に耳を傾けることは、テクノロジーを前進させ、人生を前進させます。 しかし、私たちはそのデータに何が起こっているのかについて安心しなければなりません。 自動運転車でも可聴機でも、IOTデバイスのセキュリティだけでも、規制に満足する必要があります。 これらの確率的決定のいくつかを駆動するアルゴリズムと、これらのデバイスのいくつかの背後にあるAIに対する強力な規制と標準および理解がなく、多くの場合、透明性がなければ、イノベーションを遅らせ、抑制するでしょう。 テクノロジーの能力を遅らせて、多くの人々に良い方向に大きな影響を与える可能性があります。 私はそれが起こるのを見たいです。 ですから、それを実現させるための基準や規制についての話になると思います。

良い面として、あなたが一番興奮していることは何ですか? 世界を変えて、毎日仕事に行くことに興奮するのは何だと思いますか?

ある感覚については考えていない傾向と変化があります。 私たちはテクノロジーについて総体的に考えています。 私たちはそれが視覚と音に与える影響を一緒に考えています。私たちは生理学的システム全体を考え、私たちはどのように感じ、私たちの感情を考えます。 人々が今気にしていること、テクノロジーの影響を説明する方法は、それが人間とのつながりにとって何を意味するのか、そしてそれが私たちの経験に与えることができるパワーにとって何を意味するのかについてはるかに豊富です。 それは私が間違いなく新しい方向だと思うことです。

だから、あなたの人生を変えた、あなたが愛する製品、サービス、テクノロジーガジェットに関して。 「これが私の人生を毎日良くするものだ」というような目立つものはありますか?

静的な可聴デバイス。 私は毎日Echoを使用していますが、このような幅広い世代のギャップとユースケースでEchoが使用されているのを見てきました。 そのような技術がどこに向かっているのか、私は本当に興奮しています。そして、それは本当に、それがもたらす影響の初期段階にあります。

人々がこの講演を聞いており、あなたの作品に興味がある場合、どのようにオンラインであなたを見つけ、あなたと交流することができますか?

LinkedInのPoppy Crumで私を見つけることができます。 Twitter @poppycrumで私を見つけることもできます。

早送り:ドルビーの主任科学者、ケシのクラムとの質疑応答