エンコードに必要な用語集

音響(音声)関係

用語集トップページ
iView Mobile Video トップページ


音の基本知識
音響は、一つの波形で表します

このような音の波の形が音そのものです。
例えば上の波型が一秒間の波形とします。
音はアナログですので、これをデジタル符号化しなくてはいけません。
そこで、この時間軸に沿って細かくぶつ切りにしてその「時点」の位置を符号化します。

ぶつ切りにした位置を赤い線で表します。青いまる印がそと時のデータ位置です。
ぶつ切りは、細かくすればするほど情報は増えますね。
例えば上の例でしたら


このようになります。
綺麗な波形だったのに点々のデータになってしまいましたね。
この場合、ぶつ切りの数を増やせばもっと元の波形に近づけます。

随分良くなりましたよね。

このぶつ切りの数、いわゆる一秒間に何回ぶつ切りにしてデータを取り出すかを、サンプリング周波数(サンプリングレート)と呼びます。
CDでは、44.1khz です。 これは 一秒間を44100回のぶつ切りにするということになります。
数を少なくするとメリハリの無い高音部分のこもった音になります。

さて人間の耳は、20hz〜20khzの音の高さを聞く事が出来るといわれています。
20khzの音は相当な高音で、実際には若い時ぐらいしか聞こえません。

この音の高さ20khzの音は、1秒間に2万回の波があるということです。
この20khzの音をデジタル化するためには最低でもサンプリング周波数は20khz必要ですよね。
また、音の波は常に上下しているわけですから、丁度ぶつ切りにしたときに最大の波になっているとは限りませんし中間点も取ろうとすればその倍の40khzのサンプリング周波数が必要になってくるでしょう。 これは多ければ多いほど正確に取得できることになります。
逆に低音部分や中音部分はそれほど沢山のぶつ切りにする必要はありません。 何故なら波形のカーブは大きくゆっくりしているからです。
現在のパソコンのアナログ->デジタル変換では48khzが標準的に使われるようになっていまして、高音質というと96khzなども使われます。
ただし、これは原音がアナログである場合が前提です。
なぜなら、一旦44.1khzで取得したデータは、それ以上のサンプリング周波数でぶつ切りにしても同じデータがあるだけでにしか過ぎないからです。

 


コーデック(CODEC)
デジタル符号化をするためのフォーマット(一定の仕組みでデジタル化する)
携帯電話で扱えるコーデックは、一般的には AAC と AMRです。
AMRは別名 AMRスピーチと呼ばれるように、人の声が主体です。 低音や高音をカットして人間の声あたりを集中的に符号化します。
このために非常に高い圧縮率があり小さなファイルサイズに長い記録が出来ます、ただし音楽にはまったく向きません。

AACはもっとも一般的に使われる携帯電話の記録方式です。 多くの派生もありますが、TVの地上デジタル放送やワンセグ放送など幅広く使われています。
iView では、このAACを更に高圧縮、高音質に出来る HE-AAC や HE-AAC v2(enhanced aac plus)も利用出来ます。
▲このページの先頭

HE-AAC (HE-AAC v1)
AACを発展して高圧縮を実現したコーデック
仕組みは、まず低音部を低いサンプリング周波数でエンコードします。(音の基本知識でも解るように低音部分や中音部分はサンプリング周波数は低くてもほとんど気になりません)、次に全体を補完するように中音部分や高音部分を高いサンプリング周波数でエンコードします。この時は通常のAACより更に高圧縮の出来る専用エンジンでエンコードします。
ファイルには二つの音声が入っていますが、従来のAACしか対応していない再生プレーヤーでははじめの中低音部分しか聞く事が出来ません。
対応プレーヤーでは二つの音声トラックをミックスして聞くことが出来ますので高音質で視聴できます。

HE-AACではVBR(固定品質)が選べます。 固定品質については、映像関係の固定品質を参考にしてください。
▲このページの先頭

HE-AAC v2(Enhanced AAC Plus)
HE-AACの技術を更に発展したコーデック (ステレオ専用)
ステレオ再生の場合、ベースの音や、ヴォーカルの音は中央に定位しています。これは左右のスピーカーから同じ音が出ているので中央に聞こえるわけです。
データとしては左右同じデータを持っているわけですか、圧縮という観念から見れば無駄です。
そこで、左右同じ成分のデータを一つにして圧縮した後、片方チャンネルに収めます。 次に左右に違いのある成分のデータを一つにしてもう片方のチャンネルに納めます。
再生時にこれを展開して従来の左右独立したチャンネルを作って再生します。
非常に高い圧縮率があり、限られた携帯電話の資源を無駄なく使うことが出来ます。
対応していないプレーヤーで再生するとモノラルとして聞こえてしまいます。

HE-AACではVBR(固定品質)が選べます。 固定品質については、映像関係の固定品質を参考にしてください。
▲このページの先頭

サンプリング周波数
音の基本知識を参照してください。
iViewで扱えるサンプリング周波数は沢山ありますが、元の動画の音声部分で使われているサンプリング周波数以上は設定出来ないようになっています。
これは、音の基本知識でも述べたように無駄が多くなってしまい、無意味にファイルサイズが増えるのを抑止するためです。
多くの動画共有サイトでは 22.05khz 程度です。
▲このページの先頭

ビットレート
一秒間にどれだけのデータ量を詰め込むかの値です。
符号化したデータをより多く入れるにはビットレートを多くします。 逆にファイルサイズを小さくしたい場合はビットレートを下げます。
一般にビットレートを下げる場合、最初に犠牲になるのは高音部分です。
高音部分はデータ量が多いのでビットレートを下げる場合、ここを削ると効果が出やすいからです。
人の耳は20khzまで視聴可能ではありますが、実際には16khzあたりまで聞こえればほとんどの楽器が不自然に聞こえることはありませんので、高い周波数から削っていき、それでも足りない場合は、中音域でもデータの間引きをします。
携帯電話では、1チャンネルあたり64kbps程度でも十分過ぎます。
1チャンネル 16kbpsでもちゃんと聞こえますのであまり上げすぎには注意してください。 無駄にファイルサイズが増えてしまい、多くの分割ファイルになってしまいます。
 

このページの先頭
用語集トップページ
iView Mobile Video トップページ


copyright© 2007 OniMedia.TV