国立大学法人名古屋工業大学

文字サイズ
検索

産学官連携・研究・教育

国際音声言語技術研究所

参画機関

  • 国立研究開発法人情報通信研究機構
  • エジンバラ大学
  • 国立情報学研究所
  • 名古屋大学
  • 首都大学東京
  • 株式会社テクノスピーチ

設置期間

平成29年4月1日~
平成33年3月31日

代表研究者

徳田 恵一 教授

研究者一覧

  • (所長)徳田 恵一 教授
  • 李 晃伸 教授
  • 南角 吉彦 准教授
  • 山本 大介 准教授
  • 酒向 慎司 准教授
  • 大浦 圭一郎 特任准教授
  • 橋本 佳 特任准教授
  • 北村 正 (名誉教授)
  • 高橋 直久(名誉教授)
  • 河井 恒 国立研究開発法人 情報通信研究機構(プロジェクト教授)
  • 戸田 智基 名古屋大学(プロジェクト教授)
  • Steve Renals エジンバラ大学CSTR(プロジェクト教授)
  • Simon King エジンバラ大学CSTR(プロジェクト教授)
  • 山岸 順一 国立情報学研究所(プロジェクト准教授)
  • 全 炳河(プロジェクト准教授)
  • 塩田 さやか 首都大学東京(プロジェクト助教)
  • 高木 信二 国立情報学研究所(プロジェクト助教)
  • 玉森 聡 名古屋大学(プロジェクト助教)
  • 中村 和寛 株式会社テクノスピーチ(プロジェクト助教)

研究テーマの概要

近年、スマートフォン等のモバイルデバイスやIoT (Internet of Things) と呼ばれるインターネットに接続されたスモールデバイス等を用いてGPS情報や生体情報等を常に取得し、得られた情報を用いてサービスを提供する枠組みが広く浸透しつつある。また、各ユーザから得られた情報を蓄積し、データ全体としての統計情報等を解析することで、データ単体からは得られない新たな情報を獲得することができるため、サービスの改善、新サービスの創出が日々行われている。

ところが、人間にとって最も基本的な情報伝達手段である音声に関しては、常時収録・集積し、活用しようという試みがほとんど行われていないのが現状のようである。これはプライバシーの問題に起因するユーザの拒否感が大きな理由のひとつと考えられる。しかし、Google社の音声検索サービスGoogle Voice Search等では、既に、ユーザが音声検索を利用する度に音声が記録され、システムの性能向上のために利用されている。今後、音声が収録・集積されることによってより良いサービスが期待できるという認知がユーザの間に浸透し、実際にその利便性が拒否感を上回った時点で、あらゆる音声が常に収録・集積されることが許容される社会状況が予想される。そのような状況において、収録され続ける音声データをどのように活用し、またプライバシー等の問題をどのように解決していくかを考えることは、人類共通の資産として集積され続ける超巨大音声データを価値あるものとするための喫緊の課題であると考えた。

実際に人間と機械が常に音環境を共有することで、音声からテキスト情報だけでなく様々な情報を抽出し、それらを分析することによって個人や社会の様々な活動や現象を捉えることが可能となり、それに基づいて、「ボイスレタッチ」、「音声望遠鏡」など(別紙 p.8, 「研究計画とその進め方」【ショーケース】参照)、これまでに無い新しい多種多様な音声サービスの提供が実現可能となる。本研究課題では、「アンビエント音環境」において、常に大量に収録・集積される多種多様な音声データを適切に利用できる技術の総称を、人間の音声情報処理能力を超えた音声情報処理技術「Super Auditory Human」と名付け、「Super Auditory Human」の実現によって人間と人間、もしくは人間と機械の音声コミュニケーションを強力にサポートし、人間の知的活動における音声コミュニケーション能力を飛躍的に高めることを目標とする。

お問い合わせ先

お問い合わせ先 名古屋工業大学大学院 情報工学専攻
徳田 恵一

ページトップへ