ACELP のベースである CELP は線形 せんけい 予測 よそく 符号 ふごう (LPC) から派生 はせい した音声 おんせい 符号 ふごう 化 か アルゴリズムで、線形 せんけい 予測 よそく フィルター の入力 にゅうりょく として適応 てきおう 型 がた と固定 こてい 型 がた のコードブックに登録 とうろく された信号 しんごう を使 つか う。
ACELP は、代数 だいすう 的 てき に決 き められた位置 いち に配置 はいち した振幅 しんぷく が+1/-1のパルスの組 く み合 あ わせからなる固定 こてい 型 がた コードブックと、この CELP のアルゴリズムとを組 く み合 あ わせた方式 ほうしき である。以下 いか の特徴 とくちょう がある。
代数 だいすう 的 てき な性格 せいかく よりコード探索 たんさく の効率 こうりつ が良 よ い。
コードブック全体 ぜんたい をテーブルとして用意 ようい する必要 ひつよう が無 な いためメモリが削減 さくげん できる。
柔軟 じゅうなん 性 せい があり大 おお きなサイズのコードブックを容易 ようい に実現 じつげん できる。
ACELP の基本 きほん 的 てき なアイデアは1987年 ねん に発表 はっぴょう され
[ 1] 、その後 ご 、疎 うと な(スパース)代数 だいすう コードを使 つか うよう改良 かいりょう が加 くわ えられ
[ 2] 、計算 けいさん 量 りょう が低減 ていげん された。
1990年代 ねんだい 以降 いこう 、その効率 こうりつ 性 せい のため ACELP のコードブックの表現 ひょうげん 方式 ほうしき は最 もっと もよく使 つか われている
[ 3] 。
ACELP アルゴリズムのベースである CELP は、「合成 ごうせい による分析 ぶんせき 」の手法 しゅほう を用 もち い音声 おんせい 波形 はけい を再 さい 合成 ごうせい し聴 ちょう 感 かん 補正 ほせい を行 おこな った後 のち の信号 しんごう と元 もと の信号 しんごう とを比較 ひかく することで、コードブックから誤差 ごさ が最小 さいしょう になるものを探索 たんさく する。これを単純 たんじゅん に実行 じっこう すると探索 たんさく に大 おお きな計算 けいさん 量 りょう が必要 ひつよう で、計算 けいさん 量 りょう を減 へ らすための工夫 くふう が必要 ひつよう になる。またコードブックのサイズが大 おお きくなると多量 たりょう のメモリも必要 ひつよう である。ACELP はこれらを改善 かいぜん するために考案 こうあん された。
ACELP で使 つか われているコードブックの基本 きほん 的 てき なアイデアは、ハミング符号 ふごう など誤 あやま り訂正 ていせい 符号 ふごう の考 かんが え方 かた に近 ちか い[ 3] 。ハミング符号 ふごう などでは符号 ふごう 空間 くうかん 内 ない に特定 とくてい の規則 きそく を用 もち いて距離 きょり (たとえばハミング距離 きょり )が等 ひと しくなるよう符号 ふごう を割 わ り当 あて て、誤 あやま ったビットパターンに対 たい して最 もっと も距離 きょり が近 ちか い符号 ふごう を正 ただ しい符号 ふごう (訂正 ていせい 済 ず み符号 ふごう )と見 み なす。同様 どうよう に、ACELP で使 つか われているコードブックは振幅 しんぷく が+1/-1のパルスを一定 いってい の規則 きそく で割 わ り当 あ てたものを用 もち い、その中 なか で誤差 ごさ が最小 さいしょう になるものを符号 ふごう 化 か 結果 けっか とする。規則 きそく 的 てき に生成 せいせい したコードブックはメモリを消費 しょうひ せず、誤差 ごさ が最小 さいしょう になるものを探索 たんさく するのにも合理 ごうり 的 てき である。
ACELP では振幅 しんぷく が固定 こてい のパルスを使 つか うため、1つのパルスでの線形 せんけい 予測 よそく フィルター の出力 しゅつりょく を求 もと めておけば全 すべ てのパルスの和 わ による出力 しゅつりょく はそれらの合成 ごうせい により求 もと められ、計算 けいさん 量 りょう を削減 さくげん できる。
また、一般 いっぱん に誤差 ごさ を最小 さいしょう にするために必要 ひつよう な+1/-1パルスは少数 しょうすう でよいことが分 わ かっており、これを利用 りよう しさらにアルゴリズムを効率 こうりつ 化 か している[ 2] 。
以下 いか にITU G.722.2 コーデック (12.65kbps モード時 じ )の固定 こてい コードブックの例 れい を示 しめ す
[ 4] 。
64 サンプルからなる処理 しょり 単位 たんい (サブフレーム)を以下 いか の 4 トラックに分 わ け、それぞれに対 たい して 2 ビット(全体 ぜんたい で 8 ビット)の+1/-1パルスを割 わ り当 あ てる。
ACELP 固定 こてい コードブックの例 れい (ITU G.722.2 (12.65kbps モード時 じ ))
トラック
値 ね
パルス
パルス位置 いち
1
±1
i0 , i4
0, 4, 8, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 52, 56, 60
2
±1
i1 , i5
1, 5, 9, 13, 17, 21, 25, 29, 33, 37, 41, 45, 49, 53, 57, 61
3
±1
i2 , i6
2, 6, 10, 14, 18, 22, 26, 30, 34, 38, 42, 46, 50, 54, 58, 62
4
±1
i3 , i7
3, 7, 11, 15, 19, 23, 27, 31, 35, 39, 43, 47, 51, 55, 59, 63
ITU G.722.2 は複数 ふくすう のビットレート をサポートするが、高 こう ビットレートでは1トラックに割 わ り当 あ てるパルスの数 かず を増 ふ やし、低 てい ビットレートの場合 ばあい は1トラックに割 わ り当 あ てるパルスの数 かず を減 へ らしたりトラックの数 かず を減 へ らしたりする。固定 こてい コードブックをこのように柔軟 じゅうなん に再 さい 構成 こうせい できるのは ACELP の特徴 とくちょう の1つである。
以下 いか ではACELP を応用 おうよう したアルゴリズムについて述 の べる。
ACELP を応用 おうよう したアルゴリズムの代表 だいひょう 的 てき なものとして、ITU-T G.729 (8kbps)で使用 しよう されている CS-ACELP (conjugate structure - ACELP 、共役 きょうやく 構造 こうぞう ACELP)がある。
一般 いっぱん に、共役 きょうやく 構造 こうぞう とはコードブックを以下 いか のように2つのコードブックの線形 せんけい 結合 けつごう で表 あらわ すものでベクトル量子 りょうし 化 か のために使用 しよう され、最初 さいしょ は CELP の応用 おうよう である CS-CELP で使用 しよう された。ここで ci , cj はそれぞれコードブックを、α あるふぁ は係数 けいすう を表 あらわ す。
c
i
,
j
=
α あるふぁ
1
c
i
+
α あるふぁ
2
c
j
{\displaystyle c_{i,j}=\alpha _{1}c_{i}+\alpha _{2}c_{j}\ }
この方法 ほうほう は2ステージのベクトル量子 りょうし 化 か によく似 に た方法 ほうほう で、単純 たんじゅん なベクトル量子 りょうし 化 か と比 くら べビット誤 あやま りに強 つよ くなり、コードブックのために必要 ひつよう なメモリが減 へ り、計算 けいさん の複雑 ふくざつ さを減 へ らす効果 こうか がある[ 5] 。
CS-ACELP は ACELP に共役 きょうやく 構造 こうぞう のコードブックを組 く み合 あ わせたものである。ITU-T G.729 では2つのコードブックの単純 たんじゅん な和 わ の形 かたち で表 あらわ されている。
c
i
,
j
=
c
i
+
c
j
{\displaystyle c_{i,j}=c_{i}+c_{j}\ }
^ J.-P. Adoul, P. Mabilleau, M. Delprat, S. Morisette: Fast CELP coding based on algebraic codes , Proc. IEEE Int. Conf. Acoust. Speech Signal Process. pp.1957-1960, 1987.
^ a b C. Laflamme, J.-P. Adoul, H.Y. Su, S. Morisette: On reducing computational complexity of codebook search in CELP coder through the use of algebraic codes , Proc. IEEE Int. Conf. Acoust. Speech Signal Process, pp.177-180, 1990.
^ a b Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed). Springer Handbook of Speech Processing . pp.371-377, Springer, 2007. ISBN 978-3540491255 .
^ ITU -T. “G.722.2 : Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB) ”. ITU -T. 2010年 ねん 7月 がつ 5日 にち 閲覧 えつらん 。
^ Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed). Springer Handbook of Speech Processing . pp.377, Springer, 2007. ISBN 978-3540491255 .
Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed). Springer Handbook of Speech Processing . Springer, 2007. ISBN 978-3540491255 .
Mark Hasegawa-johnson, Abeer Alwan. Speech Coding: Fundamentals and Applications . 2003.