日本語講義音声コンテンツコーパス

Last Updated at $Date: 2015-04-19 10:00:00 $.

日本語講義音声コンテンツコーパスとは

日本語講義音声コンテンツコーパス(Corpus of spoken Japanese Lecture Contents)は,大学における講義音声の音声認識や講義内容の自動要約などを研究するための基礎データを提供することを目的として,設計・編纂したコーパスである.

日本語講義音声コンテンツコーパス・モニター版は,日本語講義音声コンテンツコーパス・正式版の整備に先立ち,コーパスの設計仕様などについて,研究者のコメントを募るために公開するものである.

日本語講義音声コンテンツコーパスの構成

日本語講義音声コンテンツコーパスは,複数の講義コンテンツの集合である.1つの講義コンテンツは,1回の講義に対応し,以下の情報からなる.

この内,[*] が付与されている情報は,全ての講義コンテンツに必ず含まれている.それ以外の情報(スライドデータ,重要発話抽出情報,スライドの切り替え時間情報)については,講義によって含まれていない場合がある.

日本語講義音声コンテンツコーパスの配布方法

日本語講義音声コンテンツコーパスの連絡先

コーパスの内容について疑問点,不具合の報告などは, cjlc@slp.cs.tut.ac.jp までメールにてお願いします.