(Translated by https://www.hiragana.jp/)
Algebraic Code Excited Linear Prediction - Wikipedia

Algebraic Code Excited Linear Prediction

ACELPから転送てんそう

Algebraic Code Excited Linear Predictionalgebraic CELP代数だいすうCELP、代数だいすう符号ふごう励振れいしん線形せんけい予測よそく)あるいは ACELP とは、CELP応用おうようした音声おんせい符号ふごうアルゴリズムである。効率こうりついため、VoIP携帯けいたい電話でんわなどの音声おんせいコーデックひろもちいられている。

ACELP はITU-T G.723.1(5.3kbps)、G.729(8kbps)、G.722.2(6.6-23.85kbps)、およ携帯けいたい電話でんわようの GSM AMRGSM/W-CDMAよう)、AMR-WBW-CDMAもちいAMRのワイドバンドばん)、EVRCCDMA2000よう)、VMR-WBCDMA2000ようのワイドバンドばん)、SMVCDMA2000よう)、PDC-EFR(PDCよう)などで使用しようされている。

概要がいよう

編集へんしゅう

ACELP のベースである CELP線形せんけい予測よそく符号ふごう (LPC) から派生はせいした音声おんせい符号ふごうアルゴリズムで、線形せんけい予測よそくフィルター入力にゅうりょくとして適応てきおうがた固定こていがたのコードブックに登録とうろくされた信号しんごう使つかう。 ACELP は、代数だいすうてきめられた位置いち配置はいちした振幅しんぷくが+1/-1のパルスのわせからなる固定こていがたコードブックと、この CELP のアルゴリズムとをわせた方式ほうしきである。以下いか特徴とくちょうがある。

  • 代数だいすうてき性格せいかくよりコード探索たんさく効率こうりつい。
  • コードブック全体ぜんたいをテーブルとして用意よういする必要ひつよういためメモリが削減さくげんできる。
  • 柔軟じゅうなんせいがありおおきなサイズのコードブックを容易ようい実現じつげんできる。

ACELP の基本きほんてきなアイデアは1987ねん発表はっぴょうされ [1]、そのうとな(スパース)代数だいすうコードを使つかうよう改良かいりょうくわえられ [2]計算けいさんりょう低減ていげんされた。 1990年代ねんだい以降いこう、その効率こうりつせいのため ACELP のコードブックの表現ひょうげん方式ほうしきもっともよく使つかわれている [3]

技術ぎじゅつ

編集へんしゅう

ACELP アルゴリズムのベースである CELP は、「合成ごうせいによる分析ぶんせき」の手法しゅほうもち音声おんせい波形はけいさい合成ごうせいちょうかん補正ほせいおこなったのち信号しんごうもと信号しんごうとを比較ひかくすることで、コードブックから誤差ごさ最小さいしょうになるものを探索たんさくする。これを単純たんじゅん実行じっこうすると探索たんさくおおきな計算けいさんりょう必要ひつようで、計算けいさんりょうらすための工夫くふう必要ひつようになる。またコードブックのサイズがおおきくなると多量たりょうのメモリも必要ひつようである。ACELP はこれらを改善かいぜんするために考案こうあんされた。

ACELP で使つかわれているコードブックの基本きほんてきなアイデアは、ハミング符号ふごうなどあやま訂正ていせい符号ふごうかんがかたちか[3]ハミング符号ふごうなどでは符号ふごう空間くうかんない特定とくてい規則きそくもちいて距離きょり(たとえばハミング距離きょり)がひとしくなるよう符号ふごうあてて、あやまったビットパターンにたいしてもっと距離きょりちか符号ふごうただしい符号ふごう訂正ていせい符号ふごう)となす。同様どうように、ACELP で使つかわれているコードブックは振幅しんぷくが+1/-1のパルスを一定いってい規則きそくてたものをもちい、そのなか誤差ごさ最小さいしょうになるものを符号ふごう結果けっかとする。規則きそくてき生成せいせいしたコードブックはメモリを消費しょうひせず、誤差ごさ最小さいしょうになるものを探索たんさくするのにも合理ごうりてきである。

ACELP では振幅しんぷく固定こていのパルスを使つかうため、1つのパルスでの線形せんけい予測よそくフィルター出力しゅつりょくもとめておけばすべてのパルスのによる出力しゅつりょくはそれらの合成ごうせいによりもとめられ、計算けいさんりょう削減さくげんできる。 また、一般いっぱん誤差ごさ最小さいしょうにするために必要ひつような+1/-1パルスは少数しょうすうでよいことがかっており、これを利用りようしさらにアルゴリズムを効率こうりつしている[2]

以下いかITU G.722.2 コーデック(12.65kbpsモード)の固定こていコードブックのれいしめ[4]。 64 サンプルからなる処理しょり単位たんい(サブフレーム)を以下いかの 4 トラックにけ、それぞれにたいして 2 ビット(全体ぜんたいで 8 ビット)の+1/-1パルスをてる。

ACELP 固定こていコードブックのれい (ITU G.722.2(12.65kbpsモード))
トラック パルス パルス位置いち
1 ±1 i0, i4 0, 4, 8, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 52, 56, 60
2 ±1 i1, i5 1, 5, 9, 13, 17, 21, 25, 29, 33, 37, 41, 45, 49, 53, 57, 61
3 ±1 i2, i6 2, 6, 10, 14, 18, 22, 26, 30, 34, 38, 42, 46, 50, 54, 58, 62
4 ±1 i3, i7 3, 7, 11, 15, 19, 23, 27, 31, 35, 39, 43, 47, 51, 55, 59, 63

ITU G.722.2複数ふくすうビットレートをサポートするが、こうビットレートでは1トラックにてるパルスのかずやし、ていビットレートの場合ばあいは1トラックにてるパルスのかずらしたりトラックのかずらしたりする。固定こていコードブックをこのように柔軟じゅうなんさい構成こうせいできるのは ACELP の特徴とくちょうの1つである。

応用おうよう

編集へんしゅう

以下いかではACELP を応用おうようしたアルゴリズムについてべる。

ACELP を応用おうようしたアルゴリズムの代表だいひょうてきなものとして、ITU-T G.729(8kbps)で使用しようされている CS-ACELPconjugate structure - ACELP共役きょうやく構造こうぞうACELP)がある。

一般いっぱんに、共役きょうやく構造こうぞうとはコードブックを以下いかのように2つのコードブックの線形せんけい結合けつごうあらわすものでベクトル量子りょうしのために使用しようされ、最初さいしょCELP応用おうようである CS-CELP で使用しようされた。ここで ci , cj はそれぞれコードブックを、αあるふぁ係数けいすうあらわす。

 

この方法ほうほうは2ステージのベクトル量子りょうしによく方法ほうほうで、単純たんじゅんなベクトル量子りょうしくらべビットあやまりにつよくなり、コードブックのために必要ひつようなメモリがり、計算けいさん複雑ふくざつさをらす効果こうかがある[5]

CS-ACELP は ACELP に共役きょうやく構造こうぞうのコードブックをわせたものである。ITU-T G.729 では2つのコードブックの単純たんじゅんかたちあらわされている。

 

脚注きゃくちゅう

編集へんしゅう
  1. ^ J.-P. Adoul, P. Mabilleau, M. Delprat, S. Morisette: Fast CELP coding based on algebraic codes, Proc. IEEE Int. Conf. Acoust. Speech Signal Process. pp.1957-1960, 1987.
  2. ^ a b C. Laflamme, J.-P. Adoul, H.Y. Su, S. Morisette: On reducing computational complexity of codebook search in CELP coder through the use of algebraic codes, Proc. IEEE Int. Conf. Acoust. Speech Signal Process, pp.177-180, 1990.
  3. ^ a b Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed). Springer Handbook of Speech Processing. pp.371-377, Springer, 2007. ISBN 978-3540491255.
  4. ^ ITU-T. “G.722.2 : Wideband coding of speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)”. ITU-T. 2010ねん7がつ5にち閲覧えつらん
  5. ^ Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed). Springer Handbook of Speech Processing. pp.377, Springer, 2007. ISBN 978-3540491255.

参考さんこう文献ぶんけん

編集へんしゅう
  • Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed). Springer Handbook of Speech Processing. Springer, 2007. ISBN 978-3540491255.
  • Mark Hasegawa-johnson, Abeer Alwan. Speech Coding: Fundamentals and Applications. 2003.

関連かんれん項目こうもく

編集へんしゅう

外部がいぶリンク

編集へんしゅう
  • ITU-T G Series ITU-T G Seriesの各種かくしゅドキュメントとリファレンスソースコード