話者特定という技術

第11回 自動認識総合展 AUTO ID EXPO 2009(Vocollectジャパン共催)
2009年9月16日~9月18日 東京ビッグサイトで開催されました「自動認識総合展」の出展ブースで行なわれたデモンストレーション映像です。
物流現場では、多くの作業員や機械が行き交い、ヒトの声のみならず機械などの騒音が飛び交う環境であることが一般的です。音声システムにおいて、この問題は最も高い障壁となっています。システムが誤動作してしまう危険をどうやって回避するのか。近くで作業する別の作業員の声に反応しては困ります。騒音環境下で作業員の音声が正しく認識されないのも困ります。

Talkman®には、「話者特定」という技術が備わっています。Talkman®が話している作業者は、誰なのかを正しく認識する技術です。デモンストレーションでは、日本人作業員と中国人作業員がとても至近距離で、それぞれのピッキング作業を行なっています。途中から日本人作業員は、自らがピッキングした商品の検品作業に移行します。

Talkman®は、まったく二人の作業員を間違えることなく作業を進めていきます。それぞれの言語、声質、イントネーションといった作業員の個性を知っているからこそ、区別できているのです。

更に、実際の物流現場ほどではないかも知れませんが、展示会場は、とても賑やかな環境です。そんな中でもTalkman®は、作業員の声だけを聞き取っています。これは優れた 「ノイズキャンセリング機能」 が働いています。最近ではオーディオヘッドフォンにも採用されている技術のひつとです。ヴォコレクト音声システムは、ここにも特許技術を持っており、圧倒的な先進技術を結集して音声システムという市場を開拓してきました。

デモンストレーション映像は、家庭用ビデオカメラで撮影されていますので、ちょっと聞き取りにくいかも知れませんが、以上のことに注意しながらご覧いただけますと、その技術のすばらしさを体感していただけるかも知れません。

この技術は、ヴォコレクトにしかない、音声システムにはなくてはならないものなのです。