常にオン:Google AIはオンまたはオフラインで動作するAndroid音声認識を提供します

Googleの研究者は、Nexus 5でローカルに動作する軽量で正確な埋め込み音声認識システムを作成しました。

Googleは、インターネット接続なしでNexus 5で「リアルタイムよりも速く」実行できるほど小さい音声認識システムを開発しました。

リモートデータセンターでの計算を必要としない新しいシステムは、スマートフォン、スマートウォッチ、または他のメモリに制約のあるガジェットで音声認識を使用するために、信頼性の高いネットワーク接続を必要とするという障害を回避することができます。

Googleの研究者チームが新しい論文で概説した目的は、ローカルで実行される軽量で正確な組み込み音声認識システムを作成することでした。

軽量であるということは、2.26GHzのCPUと2GBのRAMを搭載したNexus 5でテストしたときに、オープンエンドのディクテーションタスクで13.5%のエラー率を達成した20.3MBのフットプリントシステムを意味します。

もちろん、最近のGoogleの多くの研究のように、システムは機械学習技術によって支えられています。このテクニックは、「長い短期記憶(LSTM)リカレントニューラルネットワーク(RNN)」であり、 CTC)および州レベルの最小ベイズ・リスク(sMBR)手法」を参照してください。

研究者らは、システム要件を満たすために、ディクテーションとボイスコマンドの2つの全く異なる領域の単一のモデルを開発しました。さまざまなテクニックを使用して、彼らは音響モデルを元のサイズの10分の1に圧縮しました。

研究者が指摘しているように、オフライン埋め込み型音声認識システムでは、「Darnica Cumberlandに電子メールを送る:再スケジュールすることはできますか?即座に転記して後で実行することで、ユーザーが気付かないようにすることができます。正確な転記には、連絡先の名前などの個人情報を統合する必要があります。

Android N:開発者がGoogleの最新のプレビューについて知っておく必要があるもの、GoogleはAndroid Nの開発者リリースに続いてPixel Cのタブレットを$ 500から$ 349に落としている。 Googleはオープンコンピューティングプロジェクトに参加し、48Vラックに貢献する; Googleの機械学習がロボットを人間をつかむように変える方法; Google検索の最新機能:Now Destinationsはモバイルでホテルとフライトデータをバンドルする

この問題に対する研究者の答えは、デバイスのコンタクトリストをモデルに統合することでした。

研究者は、その音響モデルを訓練するために、Googleの音声検索ト​​ラフィックから300万件の発話を抽出し、2,000時間を抽出しました。モデルをより頑丈にするために、YouTubeのビデオからノイズサンプルも導入しました。彼らが開発したオリジナルの音響モデルは約80MBの大きさでした。

スマート・アプライアンス、自律的な運転のためにAIに投資するLG

IBMがAIを使って第2アフリカの研究室で大きなデータを暴動させる

イノベーション;•スマート・アプライアンス、自律的な運転のためのAIへのLGの投資、ビッグ・データ分析、IBMは第2アフリカの研究機関でAIを使用してAIを使用して人工知能、IBMワトソン:AIルックCXO;?#CXOTALK AI、機械学習、拡張現実感で法律業界を改革する

IBM Watson:AIによって作成された映画の予告編は次のようになります

?#CXOTALK AI、機械学習、拡張現実感で法律業界を再活性化する

Googleの詳細