画像電子学会
The Institute of Image Electronics Engineers of Japan
  年次大会予稿
Proceedings of the Meida Computing Conference

携帯電話内蔵カメラの撮影表示
Taking-a-picture indication for a camera in mobile phone

− 撮影音と撮影メッセージの検討
− Study on auditory alarm and verbal alarm signals

若松 梓               小町 祐史
Azusa WAKAMATSU    and     Yushi KOMACHI

大阪工業大学情報科学研究科    Graduate School of Information Science and Technology, Osaka Institute of Technology

E-mail: †m1m10a37@st.oit.ac.jp, ‡komachi@y-adagio.com

1. はじめに

撮影機材の技術的な発達によって,誰もがいつでもどこでも簡便に高画質の撮影を行える環境が提供されるようになり,盗撮に対する技術的歯止めがなくなった.その結果,盗撮事件が増加し,その手口は巧妙になっている.盗撮事件件数の増加が社会的に問題となり,法的には条例等によって厳しく規制されることになったが,それでも盗撮事件の報道は後を絶たない.それだけでなく,二次的な事件なども報告されている.

その結果,カメラ機能付き携帯電話(ケータイ)は購入しない・携帯しない,などの傾向が利用者に現れて,ケータイ市場への影響も出はじめている.こうなると,盗撮は単なる変質的傾向のある人の問題として片付けることはできず,業界として,または技術者として何らかの対応策が必要である[1].

ここでは,撮影を積極的に知らせる撮影表示をとりあげて,聴覚的表示信号(撮影音)と言葉による表示信号(撮影メッセージ)とについて,検討を行う.2010年の報告[2]においては,撮影メッセージに関する評価が不十分であった.そこで本稿では,撮影メッセージの中の単語に着目し,その単語認知の容易さを示す音声単語親密度[3]に基づくメッセージの親密度を評価基準として,数多くの撮影メッセージサンプルの中から,認知し易い撮影メッセージを抽出し,さらにその撮影メッセージに関して,撮影音に対して行った雑音環境での聞き取り易さの評価試験と同様の評価試験を行って,撮影メッセージの雑音環境での聞き取り易さを調査した.

2. 内蔵カメラの撮影表示の自主規制

ケータイに内蔵されるカメラ機能については,カメラ機能付きケータイが市場に出た当初から撮影時に音を出す機能が装備されていた[4].その後,撮影表示機能は盗撮等に対処するための業界の自主規制としてキャリアからケータイ端末メーカに仕様が提示され,それに基づいた製品が提供されている.

この仕様は公開されてなく,しかもシャッター音(以降,一般化して撮影音)の大きさや端末内に保存されているメロディの内容(波形など)についての具体的な規定はなく[5],既に多様な撮影音がケータイに実装されている.そのため,撮影音が鳴動してもそれを撮影音として識別できないことが問題となっている[6].この問題はテレビでも報道[7][8]された.

3. 撮影表示仕様として規定する項目

撮影表示仕様として規定する項目を検討するに当たり,アラームに関する国際規格IEC 60601-1-8[9]を参考にする. 静止画および動画の撮影については,少なくとも次のような撮影表示項目についての規定が望まれる.

3.1 Visual alarm signals (視覚的表示信号)

(1) General
フラッシュとは別に撮影表示としての視覚的信号による表示が望まれる.特に動画の撮影にはオーディオ記録が伴うことがほとんどであるため,視覚的信号による撮影中表示が望まれる.(ただし本稿での検討の対象とはしない.)
(2) Characteristics of alarm indicator lights
幾つかの表示特性を用いて,撮影の各ステップおよびその他の撮影関連表示を区別して示すことが望ましい.

3.2 Auditory alarm signals (聴覚的表示信号,撮影音)

(1) General
静止画と動画の撮影に対しては,従来から何らかの聴覚的信号表示が行われてきた.誰もが撮影を容易に認識できる音でなければならない.特に動画撮影時には,その開始・終了を示す音であることを容易に認識できる音でなければならず,静止画撮影時の撮影音とは異なる音であることが望ましい.
(2) Characteristics of auditory alarm signals
幾つかのAuditory表示特性を用いて,撮影の各ステップおよびその他の撮影関連表示を区別して示すことが望ましい.

3.3 Verbal alarm signals (言葉による表示信号, 撮影メッセージ)

(1) General
補助的な扱いではあるが,言葉による通知があると,撮影表示の意味をさらに明確にすることができる.
(2) Characteristics of verbal alarm signals
幾つかのVerbal表示特性を用いて,認知し易いメッセージを用いる必要がある.

4. 撮影音
4.1 撮影音の要件

撮影音の内容・種類(wave form)の要件である,"誰もが撮影を示す音であることを容易に認識できる音"は,次の条件を満たすことが望ましい.

4.2 撮影音の生成と評価方法

4.1の要件を満たす撮影音の調査検討に際して,シンセサイザ("Baseline"[10])を用いて撮影音を生成し,それらを雑音環境の中で聞き取る実験を行い,撮影音の評価を行うとともに,評価の高い撮影音の周波数分析行った.極めて自由度の高い撮影音生成の作業を効率的に行うため,まず多くのケータイ内蔵カメラの撮影音の実装例を調査し[11][12],それに類似した数多くの撮影音サンプルをシンセサイザによって作成した.

次に作成した数多くの撮影音サンプルから,サンプル単独での聞き取りによって4.1の要件に適合し易いと判断された静止画撮影音4サンプルと動画撮影音4サンプルを選び,それらを人の声を含む市街・交通機関の雑音環境の中で再生して,聞き取り易さを調べた.静止画撮影音は,撮影の瞬間を含む1継続時間から成り,動画撮影音は,動画撮影の開始および終了を示す2継続時間から成る.

人の声を含む市街・交通機関の雑音環境としては,実際の市街・交通機関の複数箇所であらかじめ収録された雑音を研究室内で再生し,各撮影音の再生音と音場で合成した.そのような環境に,複数人の被験者(10歳代女性2名,20歳代女性2名,20歳代男性2名,60歳代男性1名)を配置して,各撮影音サンプルの聞き取り易さの回答票への記入によって,撮影音の聞き取り易さの5段階相対評価(最も聞き取り易い場合を"5",最も聞き取り難い場合を"1"とする)を求めた.各撮影音サンプルについては,スペクトル分析も行っている.

4.3 雑音環境での聞き取り易さの評価結果

静止画撮影音および動画撮影音に関する雑音環境での聞き取り易さの評価結果を,図1のそれぞれ(a)および(b)に示す.

撮影音はいずれも低音と高音との組合せで構成される.静止画撮影音に関しては,サンプル9が最も高い音を含み,サンプル8は低い音の成分を多く含む.サンプル3, 4に比べてサンプル8, 9の継続時間が短く設定されているが,サンプル8と9の評価値の差が大きく,聞き取り易さの評価結果には継続時間よりも,1kHz以上の高い周波数成分が大きく影響している.動画撮影音についも,高い周波数成分の多いサンプル5の評価値が高い.

雑音環境に着目すると,バスの中での評価値が特に低い.デパートにおいては,レジの音,BGM,人の声によって撮影音がマスクされ易く,駅では電車の到着,構内アナウンスによって,交差点では車の接近によって,バス・電車の中では車内アナウンス,人の話し声,扉の開閉音などによって,撮影音がマスクされる.

(a) 静止画撮影音 (b) 動画撮影音

図1 雑音環境での聞き取り易さの評価結果

5. 撮影メッセージ
5.1 撮影メッセージの要件

撮影メッセージに求められる要件を次に示す.

5.2 理解し易い撮影メッセージ

意味・内容を理解し易い撮影メッセージの調査検討に際して際して,メッセージの中の単語に着目し,その単語認知の容易さを示す音声単語親密度[3]を評価基準として採用した.即ち,メッセージを構成する各単語の音声単語親密度の平均値をそのメッセージの親密度とし,既存のケータイ内蔵カメラでの実装例[11][12]を含む数多くの撮影メッセージサンプルの中から,メッセージの親密度の高い撮影メッセージを表1に示すとおり抽出した.

表1 理解し易い撮影メッセージ(括弧内の数値はメッセージの親密度)
静止画撮影メッセージ動画撮影開始メッセージ動画撮影終了メッセージ
ハイチーズ(6.125)スタート(6.406)ストップ(6.250)
写真撮るよ(6.141)撮影スタート(6.031)終わり(6.219)
アクション(6.000)

5.3 雑音環境での聞き取り易さの評価結果

5.2で抽出した撮影メッセージに関して,撮影音に対して行った雑音環境での聞き取り易さの評価試験と同様の評価試験を行って撮影メッセージの雑音環境での聞き取り易さを調査した.撮影メッセージを男性と女性の声で記録し,それを4.2, 4.3に示したバスの中の雑音環境(雑音"大"72.8〜65.4dB,"中"70.2〜64.7dB,"小"65.7〜60.3dB)で再生して,7名の被験者にメッセージ内容を"聞き取れる","聞き取りにくい","聞き取れない"の3段階相対評価(それぞれ,"3","2","1")を求めた.

男性および女性の発声による撮影メッセージの雑音環境での聞き取り易さの評価結果を,図2のそれぞれ(a)および(b)に示す.雑音が大きい環境では,女声による撮影メッセージの聞き取り易さが顕著に示されている.

(a) 男性による発声 (b) 女性による発声

図2 雑音環境での聞き取り易さの評価結果

6. むすび

自主規制に委ねられている撮影表示を見直して,多くの人がケータイに内蔵されたカメラの撮影表示であることを識別できる撮影音と撮影メッセージとを検討した.撮影音については,既存の実装例に近い撮影音をシンセサイザで生成し,要件を充分に満たすと判断される撮影音サンプルについて市街・交通機関の雑音環境での聞き取り易さを調査した.撮影メッセージについては,実装例を含む多くのメッセージサンプルから,メッセージの中の単語の音声単語親密度に基づくメッセージの親密度の高いものを抽出し,撮影音と同様の聞き取り易さの調査を行った.

ここでの成果は撮影音と撮影メッセージの生成モデルを示した撮影表示の設計法提案にはなっていないが,この調査研究によって示された望ましい撮影音と撮影メッセージの特徴は,ケータイ内蔵カメラの撮影表示に関する設計指針を与えることがてきよう.

ケータイ内蔵カメラの撮影表示であることを識別できる撮影表示として機器が備えるべき表示仕様を周知させ,広く公開するためには,標準化の手続きが望まれる.海外でも使用できるケータイの増加を考慮すると,内蔵カメラの撮影表示については国際標準化をも視野に入れた検討が必要である.IEC/TC100(Audio, video and multimedia equipment and systems)においては,今後の標準化課題の議論[13]の中でその検討が開始されている.

文献