注意:このサイトは2000年末に作成したものです.Emacspeakの優れたAUI (Auditory User Interface)を知ってもらうために有効だと思い,そのまま再掲しました.ですから,所属も当時のままですし,すでに存在しないリンクなどもあります.(2013年5月6日,渡辺隆行)

Bilingual Emacspeakのデモ

製作者;
Bilingual Emacspeak Project;渡辺隆行(湘南工科大学情報工学科)、井上浩一、本多博彦(湘南工科大学)、
+佐々木太良
製作日;
2000年12月10日 (12月12日改訂)
製作場所;
湘南工科大学電算機センター マルチメディアスタジオ「創造」
ノート;
Linux版Bilingual Emacspeakの詳細はLinux Conference 2000 Fall発表した論文を見てください。Windows版を含む発表論文は渡辺研究室のWebサイトをご覧ください。

Bilingual Emacspeakのいろいろな機能を、オリジナルのEmacspeak、Linux版のBilingual Emacspeak、Windows版のBilingual Emacspeak (別名 Voice Meadow)を使って紹介します。Bilingual Emacspeakはまだ開発中ですが、アルファ版を一般公開する予定です。詳細はARGVのBEPのWebサイトをご覧ください。

MP3(音声のみ)とMPEG1(音声付動画)によるデモの説明

全盲の視覚障害者が操作しているところをMP3の音声だけのファイルとMPEG1の動画でお見せします。以下にある説明の見出しに各ファイルへのリンクがあります。MP3ファイルは全部で9つあり、合計20MB、22分です。(Linuxならmpg123などでMP3を再生できます。) MPEG1は合計281MBです。MPEG2やMPEG4(Real)も準備中です。

A. オリジナルの英語版Emacspeakのデモ

Bilingual EmacspeakはRaman博士が作ったUNIX用の英語音声化システムEmacspeakを元にしています。まず、ハードウェア音声合成装置DECTalkを使ってEmacspeakの機能を紹介します。

オリジナルEmacspeakの紹介; [BEP_intro.mp3] (1MB)、[BEP_intro.mpeg] (14MB)
ハードウェア音声合成装置DECTalkの説明と、LinuxでのEmacspeakの立ち上げのデモです。DECTalkがEmacspeak立ち上げ時のメッセージを英語で話しているのと、Emacspeak立ち上げ時のテーマ音楽が鳴っているのがわかると思います。
カレンダーモード; [BEP_calendar.mp3] (1.4MB)、[BEP_calnedar.mpeg] (20MB)
Emacspeakの優れた特徴のひとつに、GUI (Graphical User Interface)に対するAUI (Auditory User Interface)という概念を持っていることがあります。情報を視覚に表示するインターフェースがGUIで、聴覚に表示するのがAUIです。AUIの例として、カレンダーの表示をさせてみます。カレンダーは2次元の表です。目で見るときは、縦の列で何曜日かわかります。カレンダーを単純に読み上げると、カレンダーの左上から右下に順番に「月、火、水、...、1、2、3、」となってしまい全く意味をなしません。そこでEmacspeakはカレンダー読み上げ専用のインターフェースを持っていて、日を指定すると、その日が何月の何曜日かという情報も読み上げてくれます。
diredモード; [BEP_dired.mp3] (1.8MB)、[BEP_dired.mpeg] (26MB)
AUIの別例としてファイル操作をするdiredモード(ディレクトリエディターモード)を聞いてみましょう。ファイルの様々な属性のうち、ユーザが知りたい情報だけを読み上げてくれます。またファイルの種類によって読み上げる声が変わっているのもわかると思います。時々鳴っている短い音がAuditory Iconです。このアイコン音はファイルの先頭とか行頭とか操作の完了などを音で示してくれます。
W3モード; [BEP_w3.mp3] (4.2MB)、[BEP_w3.mpeg] (59MB)
Emacs用のWWWブラウザであるW3はCSS2 (Cascading Style Sheets, Level 2)に対応しています。すなわち、ヘッディング要素の深さやリンク要素や表などの要素に応じて、事細かに声を変えることができます。どの声でどの要素を読み上げるかを、ユーザーが指定することもできます。表の中では様々な形で要素の情報を示すことができます。どうです、声だけでもこんなに豊かな表現ができるのに驚きませんか?

B. Linux版Bilingual Emacspeakのデモ

次に、アルファ版のLinux用スピーチサーバを用いたLinux版のBilingual Emacspeakのデモをお聞かせします。Linuxには日本語音声合成エンジンがなく、音声合成の統一的なインターフェースがないため、今のバージョンはまだ日本語しか喋れません。

日本語を音声表示する工夫; [BEP_kana.mp3] (2.5MB)、[BEP_kana.mpeg] (35MB)
まず、Linux版のBilingual Emacspeakで日本語とカタカナ英語を喋らせて見ます。次に日本語を音声表示する際に必要な機能を説明します: 漢字は表意文字で複数の同音異義語があるので、仮名漢字変換時などは説明をつけて読み上げないと、どの漢字を指しているのかわかりません。またカタカナには「カタカナの」という説明をつけないと文字種を区別できません。カーソルを移動してバッファの内容を探るときにこのような説明を付加しているとまどろっこしいので、カーソル移動時には簡単な読み方で読み上げます。このような日本語の読み上げ方は、DOS時代の日本のスクリーンリーダが築きあげてきたものです。我々の説明読みの辞書やカタカナ英語の辞書も、静岡県立大学の石川准教授がグラスルーツというスクリーンリーダ用に作った辞書を元にしています。
Mewで電子メールの読み書き; [BEP_mew.mp3] (2.9MB)、[BEP_mew.mpeg] (41MB)
ではBilingual Emacspeakの実用例として、Mewを使って電子メールの読み書きをしてみましょう。宛て先を入力するときにMewの入力補完機能を使いますが、補完するときの音声化も工夫しています。Bilingual Emacspeakを使えば、LinuxでもWindowsでもMewを音声利用できるようになるのです。
Cでプログラム開発; [BEP_c.mp3] (2.6MB)、[BEP_c.mpeg] (37MB)
もうひとつの実用例として、Cのデバックと実行をしてみます。Cモードでは、キーワードやコメント行やクオート文字列などの要素ごとに異なった声で読み上げますので、耳で聞いてもプログラムの構造がわかりやすくなっています。このデモではCのソースをコンパイルし、エラーメッセージを参考にしてエラーを修正し、再コンパイルしてから、Emacsのシェルモードで実行しています。ここでもオーディトリアイコンが活躍しています。
スピーチサーバの単独使用; [BEP_ss1.mp3] (1.9MB)、[BEP_ss1.mpeg] (28MB)
最後にLinux版スピーチサーバ (ss1)をコマンドラインから単独使用する例をお見せします。Bilingual Emacspeakは、Emacsが取り扱う情報を処理してから、スピーチサーバに対する命令と読み上げるべき文字列を、スピーチサーバの標準入力に送っています。ここでは代表的なコマンドであるq(文字列のキューイング)とd(キューの再生)とs(即時停止)の使用例をお見せします。

C. Windows版のBilingual Emacspeakのデモ

Windows版Bilingual Emacspeak (別名 Voice Meadow)は、文字の言語に応じて自動的に音声合成エンジンを切り替えて喋ります。我々がバイリンガルにこだわっているのは、日本人の知的活動には英語も日本語も必要だからです。

長い英語をカタカナ英語で喋るとわかりにくい例; [BEP_Bilingual.mp3] (1.5MB)、[BEP_Bilingual.mpeg] (21MB)
ここでは、日本語の発音では長文の英文を聞くに耐えない例をお見せします。

Bilingual Emacspeak Projectでは、開発や評価に参加してくださるメンバーを募集しています。ご興味を持たれた方はARGVにあるBEP MLの参加の仕方のページをご覧ください。

Written by T. Watanabe <watanabe@argv.org>
Last Updated; December 12, 2000