映像から会話を読み取った「HAL9000」が現実に!? グーグルの“読唇術AI”が登場!

 口の動きを見て発言内容を把握する“読唇術”を習得できれば、確かに便利かもしれない。しかし今から読唇術の訓練をしても、人工知能には敵いそうにないようだ。

1612Google’s-AI-.jpg「The Verge」の記事より。

■人間には太刀打ちできない“読唇術家AI”が誕生

 グーグル傘下のDeepMindとオックスフォード大学の合同研究チームが、人間の能力をはるかに凌駕する性能を持った“読唇術家AI”を開発したと報告している。このAIは、現時点で最も高い読唇術の能力を身に着けていると研究チームは主張している。ではいったい、どうやってその“読唇術家AI”を開発したのだろうか? なんと、この人工知能を“テレビ漬け”にしたというのだ。

 人工知能との完全なフリートークを実現するDeepMindの一大プロジェクト“Watch, Listen, Attend, and Spell”(見て聞いて参加して話す)の皮切りとして、開発チームは神経ネットワーク型の人工知能にテレビのニュース番組を5,000時間以上も見せて、ニュースキャスターの口の動きと実際の発言を学ばせた。そして人工知能はその膨大なデータからハイレベルな“読心術”をマスターしたのである。視聴した番組には、計11万8,000例に及ぶ文言と、1万7,500語もの専門用語が含まれていたということだ。

“Watch, Listen, Attend, and Spell”紹介動画。「Singularity Lectures」より

 映像には、生中継時などにキャスターの声が騒音等でかき消されている箇所があるのだが、この時のキャスターの発言を人工知能に推測させたところ、46.8%の確率で正しい言葉を選ぶことができたということだ。一方で人間の読唇術の専門家に同じシーンを解読してもらったのだが、その正答率は12.4%だったという。どうやら早くも“読唇術”において人間は人工知能に太刀打ちできない事態を招いていることになる。そして、今もなおこのAIは大量のニュース番組を見続け、成長しているのだ。

映像から会話を読み取った「HAL9000」が現実に!? グーグルの“読唇術AI”が登場!のページです。おたぽるは、その他ホビーの最新ニュースをファンにいち早くお届けします。オタクに“なるほど”面白いおたぽる!

- -

人気記事ランキング

PICK UP ギャラリー
写真new
写真
写真
写真
写真
写真

ギャラリー一覧

XLサイズ……
XLサイズって想像できないだけど!!