Microsoftの新しい音声認識テクノロジーは、あなたの自然な音声を別の言語に変換できます[ビデオ]

January 21, 2023 0 By xaed

モバイルスペースでは、AppleのDigital SiriアシスタントとGoogleの音声検索により、少しの音声コマンドの戦いがあります。ユーザーの愛情のために互いに反対することを使用します。どちらも独自の長所と短所を備えており、未来に進むにつれて良くなるだけですが、Microsoftの研究開発チームは、舞台裏で自分の声に基づいた声に基づいた何かに取り組んでいるようです。人間は互いに相互作用します。

SiriはiOSプラットフォームでのGoogleの音声検索よりもはるかに強力ですが、それらは通常、結果を吐き出す前にバックエンドサーバーでそのコマンドを公開および処理する前に、ユーザーからの可聴コマンドをキャプチャすることで同じ方法で機能しますユーザーに戻り、リクエストに基づいて行動します。 Microsoftによってビデオが投稿されました。RickRashidのプレゼンテーションを特集し、人間のスピーチを使用して自然なユーザーインターフェースの分野で行った改善の概要を説明しています。

人間の発話を理解するコンピューターベースのシステムは、新しい発明ではありません。この分野で大きな進歩を示す多くのリリースが長年にわたってリリースを見てきました。SiriとGoogleの音声検索は、このテクノロジーを現実の世界で適用する方法の最新の例のいくつかです。しかし、Microsoftは、人間のスピーチを認識できるだけでなく、外国語のテキストに変換し、生成された合成された音声を使用してその言語で単語を繰り返すテクノロジーの周りにシステムを構築することにより、さらにいくつかのステップをさらに数歩取ろうとしています。スピーカーのように聞こえる。

Microsoftの最高調査責任者をフィーチャーしたステージ上のデモンストレーションは、話しかけられた英語の単語を認識し、予測されたディスプレイで中国語に変換し、その後マンダリンでまったく同じ文を聞こえるようにすることにより、技術の活動を示しています。そのすべては十分に心を吹き飛ばしますが、ラシッドと彼の同僚が自分の音声データを1時間以上にわたってシステムに与えて、システムが彼のマンダリンでマンダリンの文を繰り返すことができることに気付いたとき、物事は少しさらに取られます。自分の声!

テクノロジーは最高ではなく、まだ間違いを犯しますが、これが可能であることを認識することは本当に驚異的です。人間の相互作用の未来は絶対に地平線上にあります。

(TechNetBlog経由)

Twitterでフォローしたり、Google+のサークルに追加したり、Facebookページのように私たちを追加して、Microsoft、Google、Apple、Webのすべての最新情報を最新の状態に保つことができます。