(Translated by https://www.hiragana.jp/)
SMV - Wikipedia コンテンツにスキップ

SMV

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

SMVselectable mode vocoder)は CDMA2000 ネットワークで利用りようされる可変かへんビットレート音声おんせい符号ふごう方式ほうしきである。それ以前いぜんから CDMA ネットワークで使つかわれている符号ふごう方式ほうしきEVRC のように通話つうわちゅう音声おんせい内容ないようによりビットレートえることができることにくわえ、モード指定していにより基地きちきょくがわから音質おんしつ平均へいきんビットレート制御せいぎょおこなうことができる特徴とくちょうがある。

この特徴とくちょうはその規格きかくされた CDMA2000 ネットワークよう音声おんせい符号ふごう方式ほうしきである VMR-WBEVRC-B 以降いこう仕様しようなどにもがれている。

概要がいよう

[編集へんしゅう]

SMV は CDMA ネットワークのために提案ていあんされた音声おんせい符号ふごう方式ほうしきで、1999ねんCDMA 方式ほうしき業界ぎょうかい団体だんたいである CDGCDMA Development Group)が要求ようきゅう仕様しよう作成さくせい[1]、 その様々さまざま評価ひょうかて 2001ねん6がつ3GPP2標準ひょうじゅん規格きかく C.S0030-0 として採用さいようされた [2]

ビットレート入力にゅうりょくとなる音声おんせい信号しんごう種類しゅるい有声音ゆうせいおん/無声音むせいおん/無音むおん状態じょうたいなど)と指定していされているモードとのわせにより動的どうてきわる。音声おんせい信号しんごう内容ないようおうじて8.55 kbps(フルレート)、4.0 kbps(ハーフレート)、2.0 kbps(1/4レート)0.8 kbps(1/8レート)のいずれかのビットレート符号ふごうする。1/8レートは無音むおん状態じょうたい(しゃべっていない状態じょうたい)のみで使つかわれる。

これらの符号ふごうデータはそれぞれ CDMA2000 ネットワークのレートセット1(9.6 Kbps を基準きじゅんとする通信つうしんレート)でのフレームレート 9600 bps、4800 bps、2400 bps、1200 bps を使つか送受信そうじゅしんされる。CDMA2000 ネットワークで使つかわれている CDMA 方式ほうしきは、かく利用りようしゃのビットレートががるほどおおくの利用りようしゃ同時どうじ接続せつぞくできる特性とくせいがあり、コーデックのビットレートを可変かへんにして平均へいきんビットレートをげることは1基地きちきょくあたりの収容しゅうようすう同時どうじ通話つうわ可能かのう利用りようしゃすう)の向上こうじょう役立やくだっている。

平均へいきんビットレートは基地きちきょくがわ指示しじする「符号ふごうモード」(パラメータめい "RATE_REDUC")で制御せいぎょする。符号ふごうモードは、基地きちきょくたりの収容しゅうようすう携帯けいたい電話でんわ基地きちきょくとのあいだ無線むせん状態じょうたいなど通信つうしんネットワークがわ状態じょうたいと、要求ようきゅうされる通信つうしん品質ひんしつQoS)によりめられる。平均へいきんビットレート符号ふごうモード 0 がもっとたかく 1、2 と順次じゅんじひくくなり、また音声おんせい品質ひんしつ同様どうよう低下ていかする。

符号ふごうモードは 0 から 3 までの4モードがあり、それぞれプレミアムモード、スタンダードモード、エコノミーモード、キャパシティセービングモードともばれる。くわえて、最大さいだいビットレートをハーフレート(4.0 kbps)におさえるハーフレートマックスモード(half-rate max mode)があり、モード 0 とモード 1 に適用てきようできる。

平均へいきんビットレートは音声おんせい内容ないようによりわるが、符号ふごうモードと平均へいきんてき会話かいわでの想定そうてい平均へいきんビットレート(符号ふごうのレート)との関係かんけい以下いかのようになる [3]

SMV の符号ふごうレート
RATE_REDUC (binary) 符号ふごうモード 想定そうてい平均へいきんビットレート 説明せつめい
‘000’ 0 7.95 kbps プレミアムモード
‘001’ 1 5.82 kbps スタンダードモード
‘010’ 2 4.50 kbps エコノミーモード
‘011’ 3 3.95 kbps キャパシティセービングモード
‘100’ 4 4.00 kbps モード0 + ハーフレートマックスモード
‘101’ 5 3.67 kbps モード1 + ハーフレートマックスモード
‘110’ 将来しょうらいのために予約よやく
‘111’ 将来しょうらいのために予約よやく

SMV で使つかアルゴリズムは、CELP一種いっしゅである eX-CELPeXtended CELP)をもちいる。これは1つの技術ぎじゅつではなく、EVRC使用しようされている RCELP アルゴリズムなど様々さまざまなアイデアをわせ選択せんたくして使つかうものである [4]

また、それ以前いぜん開発かいはつされた EVRC同様どうよう雑音ざつおん抑制よくせい機能きのう仕様しようまれており、フロントエンドとして使つかわれる。

SMV の特徴とくちょう以下いかとおりである。

CDMA2000 ネットワークでのサービス種別しゅべつあらわすサービスオプションとしては SO56(Service Option 56)がてられている。

SMV の符号ふごうデータを RTPもちいインターネットじょうおくるためのデータ形式けいしきは、IETF標準ひょうじゅんRFC 3558定義ていぎされている [5]

SMV は 3GPP2 でのマルチメディアようファイルフォーマットである 3G2 でも使つかうことができる。携帯けいたい電話でんわでの音声おんせい通信つうしんよう以外いがいに、マルチメディアメッセージングサービスやマルチメディアストリーミングサービスなどの 3GPP2定義ていぎされた各種かくしゅマルチメディアサービスで使用しようすることができる。

SMV では CELP一種いっしゅである eX-CELPeXtended CELP)とばれる技術ぎじゅつもちいる。

一般いっぱんてきCELP人間にんげん音声おんせいこえどう相当そうとうする線形せんけい予測よそくフィルターと声帯せいたい相当そうとうする適応てきおうがた固定こていがたのコードブックとでモデルし、「合成ごうせいによる分析ぶんせき」(analysis-by-synthesis)の手法しゅほうもちいてコードブックから誤差ごさ最小さいしょうになるものを探索たんさくする。

eX-CELP の基本きほんてきとなるかんがかたは、通常つうじょうCELP固定こていてきなアルゴリズムを使つか入力にゅうりょく信号しんごうとできるだけおな波形はけいになるように符号ふごうしようとするのにたいし、様々さまざまなアルゴリズムをわせて知覚ちかくじょう重要じゅうよう部分ぶぶん強化きょうかした符号ふごうおこなうことである [6]

具体ぐたいてきには、 CELP をベースとしながら、以下いかのような方法ほうほうで聴感じょう音質おんしつとすことなくビットレートの低減ていげんおこなっている [6] [7] [4]

  • オープンループとクローズドループのわせ(closed-loop-open-loop-analysis、COLA
合成ごうせいによる分析ぶんせきでのクローズドループだけでなく、完全かんぜん一致いっち必要ひつようないパラメータはオープンループで符号ふごうするなど、柔軟じゅうなんえる
  • 入力にゅうりょく信号しんごうこまかい分類ぶんるいとアルゴリズムのえ(variant algorithm structures、VAS
入力にゅうりょく信号しんごうこまかくカテゴリーけして処理しょり
定常ていじょうてき有声音ゆうせいおん定常ていじょうてき有声音ゆうせいおん発声はっせい開始かいし定常ていじょうてき無声音むせいおん定常ていじょうてき無声音むせいおん背景はいけい雑音ざつおんのみ、など)
  • 信号しんごう修正しゅうせい
EVRC使つかわれる RCELP アルゴリズムのように、入力にゅうりょく信号しんごう知覚ちかくじょう影響えいきょう範囲はんい効率こうりつてき符号ふごうできるよう修正しゅうせいする
  • 柔軟じゅうなんせいのある固定こていコードブック
CELP での固定こていコードブックを入力にゅうりょく信号しんごう分類ぶんるいわせた複数ふくすうのサブコードブックにけ、それぞれの信号しんごう適切てきせつ表現ひょうげんできるようにする
  • マルチモード
定常ていじょうてき有声音ゆうせいおん(ほぼおな波形はけいかえし)とそれ以外いがいとで符号ふごう処理しょり全体ぜんたい構成こうせいえる(Type 1/0 の2種類しゅるい構成こうせい存在そんざい

SMV と CDMA2000 ネットワークでなが使つかわれている EVRC(EVRC revision 0)の、MOS 以下いかのようになる[4]MOS は、総合そうごうてき音質おんしつあらわ主観しゅかん評価ひょうかで1から5のをとり、5がもっと音質おんしつたかく1がもっとひくい。

コーデック MOS (Clean) MOS (Noisy) 説明せつめい
EVRC 3.581 3.346 EVRC revision 0 での
SMV (モード0) 3.900 3.569 EVRC とおな平均へいきんビットレート
SMV (モード1) 3.636 3.528
SMV (モード2) 3.464 3.526

ここで "MOS (Clean)" は背景はいけい雑音ざつおんときの、"MOS (Noisy)" は背景はいけい雑音ざつおんがあるときMOS である。おな平均へいきんビットレートでの総合そうごうてき音質おんしつは EVRC よりたかく、7 わり程度ていど平均へいきんビットレート(モード1)でも EVRC とさほどわらない。

脚注きゃくちゅう

[編集へんしゅう]
  1. ^ S. Craig Greer, Andrew DeJaco. “Standardization of the Selectable Mode Vocoder” (PDF). 2010ねん7がつ14にち閲覧えつらん
  2. ^ 3GPP2 C.S0030-0 v1.0 Selectable Mode Vocoder (SMV) Service Option for Wideband Spread Spectrum Communication Systems” (PDF). 3rd Generation Partnership Project 2 (2001ねん6がつ). 2010ねん7がつ14にち閲覧えつらん
  3. ^ 3GPP2 C.S0030-0 v3.0 Selectable Mode Vocoder (SMV) Service Option for Wideband Spread Spectrum Communication Systems” (PDF). 3rd Generation Partnership Project 2 (2004ねん1がつ). 2010ねん7がつ14にち閲覧えつらん
  4. ^ a b c Y. Gao, A. Benyassine, J. Thyssen, H. Su, E. Shlomot. Ex-Celp : A Speech Coding Paradigm, IEEE Int. Conf. Acoust. Speech Signal Process, pp.689-692, 2001.
  5. ^ IETF (2003ねん7がつ). “RTP Payload Format for Enhanced Variable Rate Codecs (EVRC) and Selectable Mode Vocoders (SMV)”. IETF Network Working Group.. 2010ねん7がつ14にち閲覧えつらん
  6. ^ a b Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed). Springer Handbook of Speech Processing. pp.381-382, Springer, 2007. ISBN 978-3540491255.
  7. ^ Y. Gao, E. Shlomot, A. Benyassine, J. Thyssen, H. Su, C. Murgia. The Smv Algorithm Selected By Tia And 3gpp2 For Cdma, IEEE Int. Conf. Acoust. Speech Signal Process, pp.709-712, 2001.

参考さんこう文献ぶんけん

[編集へんしゅう]

関連かんれん項目こうもく

[編集へんしゅう]

外部がいぶリンク

[編集へんしゅう]
  • 3GPP2 Specifications 3GPP2 仕様しようのウェブページ
  • RFC 3558 - RTP Payload Format for Enhanced Variable Rate Codecs (EVRC) and Selectable Mode Vocoders (SMV)