(Translated by https://www.hiragana.jp/)
MPEG-4 Part 3 - Wikipedia コンテンツにスキップ

MPEG-4 Part 3

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』

MPEG-4 Part 3(エムペグフォー パート 3)は Moving Picture Experts Group(MPEG)が規格きかくした国際こくさい標準ひょうじゅんである MPEG-4だい3で、オーディオ符号ふごう方式ほうしき定義ていぎされている。一般いっぱんてきにはMPEG-4オーディオMPEG-4 Audio)の名称めいしょうばれ、JISではMPEG-4音響おんきょう訳語やくご使つかわれる [1]

MPEG-4オーディオの規格きかくISO/IEC 14496-3 で定義ていぎされ [2] [3]最初さいしょ規格きかくは1999ねん発行はっこうされた [4]。 ISO/IEC 14496-3 の翻訳ほんやくとして JIS X 4332-3("音響おんきょう映像えいぞうオブジェクトの符号ふごうだい3音響おんきょう")がある[1]

MPEG-4オーディオはおおくのオーディオ符号ふごう方式ほうしきあつめたもので、音声おんせい音楽おんがく自然しぜんおと合成ごうせいしたおとなど様々さまざま信号しんごうあつかうことができ、非常ひじょうひくビットレートからまった劣化れっかこうビットレートまでひろ範囲はんいビットレート音質おんしつでの符号ふごう方式ほうしきをサポートしている。ひろられている MPEG-4 AACほかに、ロスレス圧縮あっしゅくおこなMPEG-4 ALSMPEG-4 SLSMPEG-4 CELPTwinVQHVXC(Harmonic Vector eXcitation Coding)、HILN(Harmonic and Individual Lines plus Noise)、TTSI(Text To Speech Interface)など様々さまざま符号ふごう技術ぎじゅつ規格きかくされている。

MPEG-4 は、それ以前いぜん様々さまざま規格きかくことなり特定とくていのアプリケーションをターゲットとしたものではなく、蓄積ちくせきインターネット通信つうしん携帯けいたい電話でんわテレビ電話でんわデジタル放送ほうそうなどすべてのアプリケーションで使つかえることを目的もくてきとしている。MPEG-4オーディオは性質せいしつことなるツールのわせからなり、アプリケーションの内容ないようおうじてわせて使つかえるようになっている。

概要がいよう

[編集へんしゅう]

ISO/IECMoving Picture Experts Group によるオーディオ符号ふごう標準ひょうじゅん制定せいてい作業さぎょうは1988ねんからはじまり [5]ビデオCDなどの蓄積ちくせきけいメディアを対象たいしょうとした MPEG-1放送ほうそう通信つうしん映画えいがなどでの高音こうおんしつオーディオを対象たいしょうとした MPEG-2オーディオなどが規格きかくされた。

MPEG-4元々もともとモバイル機器ききけのちょうひくビットレート符号ふごう規格きかくとして1993ねんなつ制定せいてい作業さぎょうはじまった [6]。 その対象たいしょうとする範囲はんい拡大かくだいされ、将来しょうらい様々さまざまなアプリケーションに対応たいおう可能かのう一般いっぱんてき符号ふごう標準ひょうじゅんになった。

以前いぜん規格きかくである MPEG-1MPEG-2オーディオとのかんがかたちがいは以下いかとおりである[3]

  • 保存ほぞん転送てんそう多重たじゅう形式けいしき定義ていぎ
  • ひくビットレート符号ふごうのサポート
  • 複数ふくすうのツールのわせによるオブジェクトベースの符号ふごう
  • 合成ごうせいおん音声おんせい/音楽おんがく)のサポート
  • あやまたいせい機能きのう
  • スケーラビリティの機能きのう

以前いぜん規格きかく符号ふごう方式ほうしきのみを定義ていぎしていたが、MPEG-4 ではファイル形式けいしき複数ふくすうのデータの多重たじゅう形式けいしき定義ていぎしている。

また、モバイル機器ききなどのため、ちょうひくビットレート符号ふごう(2 kbps~ の音声おんせい符号ふごう、4 kbps~ の音楽おんがく符号ふごう)やあやまたいせい機能きのうがサポートされている。テキストベースの情報じょうほうから音声おんせい音楽おんがく合成ごうせいする合成ごうせいおん機能きのうもちいればさらにひくいビットレートを実現じつげんできる。

さらに、要求ようきゅうされる QoSおう複数ふくすうビットレートでデータをせるスケーラビリティ機能きのうがある。

ことなった要素ようそ技術ぎじゅつオーディオオブジェクトとしてわせて使つかうことができ、様々さまざまなアプリケーションの要求ようきゅうおうじられる柔軟じゅうなんせいつ。

詳細しょうさい

[編集へんしゅう]

MPEG-4オーディオは、様々さまざまなアプリケーションに対応たいおうするため、ことなったおおくの要素ようそ技術ぎじゅつ(ツール)から構成こうせいされている。

ツールはおおきくけて、人間にんげん音声おんせいのみをあつか音声おんせい符号ふごうツールと、音楽おんがくなど一般いっぱんてきなオーディオ信号しんごう可逆かぎゃく圧縮あっしゅくおこなうオーディオ符号ふごうツール、ロスレス圧縮あっしゅくおこなうロスレスオーディオ符号ふごうツール、再生さいせいがわ音楽おんがく合成ごうせいおこなうの合成ごうせいツール、およびそれ以外いがい各種かくしゅツールに分類ぶんるいできる[3]

  1. 音声おんせい符号ふごうツール(Speech coding tools)
    1. 自然しぜん音声おんせい符号ふごうツール(Natural speech coding)- 人間にんげん音声おんせいあつかうツール
    2. 音声おんせい合成ごうせいインタフェース(Text-to-speech interface、TTSI)
      • MPEG-4 Hybrid/Multi-Level Scalable TTS Interface
  2. オーディオ符号ふごうツール(Audio coding tools)- オーディオ信号しんごう可逆かぎゃく圧縮あっしゅくツール
    1. 汎用はんようオーディオ符号ふごうツール(General Audio coding tools)- MPEG-4 AAC など
      • MPEG-4 AAC(Advanced Audio Coding)
      • TwinVQ
      • MPEG-4 low delay
      • MPEG-4 BSAC(Bit Sliced Arithmetic Coding)
      • MPEG-4 SBR(Spectral Band Replication、スペクトル帯域たいいき複製ふくせい
    2. パラメトリックオーディオ符号ふごうツール(Parametric audio coding tools)- 音楽おんがくなどをパラメータして表現ひょうげん
      • MPEG-4 HILN(Harmonic and Individual Lines plus Noise)
      • MPEG-4 SSC(SinuSoidal Coding)
  3. ロスレスオーディオ符号ふごうツール(Lossless audio coding tools)- オーディオ信号しんごうロスレス圧縮あっしゅくツール
  4. 合成ごうせいツール(Synthesis tools)- 再生さいせいがわ音楽おんがく合成ごうせいするツール
    • MPEG-4 Structured Audio(SA)
  5. コンポジションツール(Composition tools)- 各種かくしゅオーディオオブジェクトをわせるツール
  6. スケーラビリティツール(Scalability tools)- ビットレート拡張かくちょうせいのためのツール
  7. アップストリーム(Upstream)- ストリーミングでのビットレート音質おんしつ制御せいぎょツール
  8. あやまたいせい機能きのう(Error robustness facilities)- あやまたいせいたせるための各種かくしゅツール

MPEG-4オーディオは対象たいしょうとする範囲はんいひろ使用しようできるツールもおおい。また符号ふごうさい選択せんたくできるパラメータの範囲はんいひろい。特定とくていのシステムのためにすべての機能きのうふくめるのはコストなどをかんがえると現実げんじつてきではないため、MPEG-4オーディオでは標準ひょうじゅんてきわせがオーディオプロファイルとしてあらかじめ用意よういされている。

サブパート

[編集へんしゅう]

ツールの仕様しようはMPEG-4オーディオのかくサブパート(Subpart)で定義ていぎされている。 MPEG-4オーディオの規格きかく以下いかのサブパートからなる[3]

  • Subpart 1 : メイン
  • Subpart 2 : 音声おんせい符号ふごう(Speech coding)- HVXC
  • Subpart 3 : 音声おんせい符号ふごう(Speech coding)- CELP
  • Subpart 4 : 汎用はんようオーディオ符号ふごう(General Audio coding)- AAC, TwinVQ, BSAC
  • Subpart 5 : Structured Audio(SA)
  • Subpart 6 : 音声おんせい合成ごうせいインタフェース(Text-to-speech interface、TTSI)
  • Subpart 7 : パラメトリックオーディオ符号ふごう(Parametric Audio Coding)- HILN
  • Subpart 8 : 高音こうおんしつオーディオようパラメトリック符号ふごう技術ぎじゅつてき説明せつめい
  • Subpart 9 : MPEG-4 での MPEG-1/MPEG-2 オーディオ
  • Subpart 10: オーバーサンプルされたオーディオでのロスレス符号ふごう技術ぎじゅつてき説明せつめいMPEG-4 DST
  • Subpart 11: Audio Lossless Coding
  • Subpart 12: Scalable Lossless Coding

エディション

[編集へんしゅう]

MPEG-4オーディオ標準ひょうじゅんのエディションは以下いかとおり。MPEG-4オーディオの仕様しよう固定こていしたものではなく市場いちばのニーズなどにおうじて拡張かくちょうされている。追加ついか仕様しようかくエディションにたいするつい(Amendment)として発行はっこうされ、おおくはつぎのエディションで本来ほんらい仕様しよう統合とうごうされる。

だい1はん仕様しよう確定かくてい目標もくひょうとする期日きじつわなかったためバージョン 1/2 の2かいけて発行はっこうされ、翌年よくねんだい2ばんとして統合とうごうされた [7]

MPEG-4オーディオのエディションとバージョン
エディション リリースねん 最後さいご改定かいてい 標準ひょうじゅん 説明せつめい
だい1はん 1999 2001 ISO/IEC 14496-3:1999[4] MPEG-4オーディオ バージョン 1
2000 ISO/IEC 14496-3:1999/Amd 1:2000[8] MPEG-4オーディオ バージョン 2、だい1はんたいするおいとして発行はっこう[9][10]
だい2はん 2001 2005 ISO/IEC 14496-3:2001[11]
だい3はん 2005 2008 ISO/IEC 14496-3:2005[12]
だい4はん 2009 改定かいていちゅう[13] ISO/IEC 14496-3:2009[2]

音声おんせい符号ふごう

[編集へんしゅう]

音楽おんがくなどの一般いっぱんてきなオーディオ信号しんごうくらべると人間にんげん音声おんせい声帯せいたいこえどう特性とくせいによってまる固有こゆう波形はけいつため、音声おんせい固有こゆう符号ふごう方式ほうしきもちいることで音楽おんがくよりたか圧縮あっしゅくりつでの符号ふごうができる。

MPEG-4 での音声おんせい符号ふごうツールとして、人間にんげん自然しぜん音声おんせい圧縮あっしゅく復号ふくごうおこな自然しぜん音声おんせい符号ふごうツールと、さらにていビットレートで音声おんせい表現ひょうげん可能かのう音声おんせい合成ごうせいインタフェースが用意よういされている。

自然しぜん音声おんせい符号ふごうツール

[編集へんしゅう]

MPEG-4 の自然しぜん音声おんせい符号ふごうツールはデジタル放送ほうそう携帯けいたい電話でんわインターネット電話でんわ音声おんせいデータベースなどの用途ようと使用しようできる。 電話でんわ品質ひんしつ音声おんせい音声おんせいを 2 ~ 24 kbpsビットレート符号ふごうでき、可変かへんビットレート場合ばあいは 2 kbps 以下いかたとえば 1.2 kbps 程度ていど平均へいきんビットレートでの符号ふごう可能かのうである[14]

MPEG-4 HVXC は 2 ~ 4 kbps のちょうていビットレートをカバーし、復号ふくごう音声おんせい速度そくどとピッチ(音声おんせい基本きほん周波数しゅうはすう)とを独立どくりつして変更へんこうすることができる。

MPEG-4 CELP は2種類しゅるいのサンプリング周波数しゅうはすう(8 kHz, 16 kHz)と 4 ~ 24 kbps のビットレートをカバーする。ビットレート拡張かくちょうせいがあり、おな符号ふごう結果けっかから音質おんしつ帯域たいいきはばことなる様々さまざまなビットレートの情報じょうほうすことができる [15]

音声おんせい合成ごうせいインタフェース

[編集へんしゅう]

MPEG-4 では音声おんせい合成ごうせい共通きょうつうインタフェースが定義ていぎされている。音声おんせい合成ごうせい具体ぐたいてきなアルゴリズムは定義ていぎしない。

基本きほんとなるインタフェース標準ひょうじゅんでは、国際こくさい音声おんせい記号きごう(International Phonetic Alphabet、IPA)の形式けいしきや、任意にんい言語げんごでのテキスト形式けいしき音声おんせい情報じょうほう指定していする。

MPEG-4 Hybrid/Multi-Level Scalable TTS Interface は基本きほんインタフェースを拡張かくちょうしたもので、抑揚よくようなどの韻律いんりつ情報じょうほう指定していでき、より自然しぜん音声おんせい合成ごうせいできる。ビットストリームは階層かいそう構造こうぞうになっており、階層かいそうえるにしたがって韻律いんりつ情報じょうほうえる[16]

汎用はんようオーディオ符号ふごう

[編集へんしゅう]

汎用はんようオーディオ符号ふごう使つかわれる MPEG-4 AACMPEG-2 AACISO/IEC 13818-7)をベースに拡張かくちょうおこなったもので、音楽おんがくなどのオーディオ信号しんごう効率こうりつよく符号ふごうでき、モノラルステレオマルチチャネル信号しんごうあつかうことができる。6 kbps 以上いじょうビットレートでの符号ふごうおこない、1チャネルあたり 64 kbps 以上いじょうでは、欧州おうしゅう放送ほうそう連合れんごう(EBU)が定義ていぎするきびしい条件下じょうけんか試験しけんで「(原音げんおんと)区別くべつできない音質おんしつ」の基準きじゅんたしている[17]

MPEG-2 AAC で標準ひょうじゅんされた AAC Main、AAC LC、AAC SSR のかく方式ほうしきくわえ、MPEG-4 AAC ではていビットレート符号ふごうのための TwinVQ、リアルタイム通信つうしんなどの用途ようとけに符号ふごう遅延ちえんちいさくした AAC LD(Low Delay)、ビットストリームを階層かいそうしてビットレート拡張かくちょうせいたせる BSAC、こういき成分せいぶんをパラメータして情報じょうほう圧縮あっしゅくおこなSBR(Spectral Band Replication)ツールなどおおくの機能きのう拡張かくちょうおこなわれた。

AAC、HE-AAC、HE-AAC v2 かくプロファイルの階層かいそう構造こうぞうかくツールの関係かんけい
MPEG-2 AAC LC(Low Complexity)プロファイルと MPEG-4 AAC LC から HE-AAC v2 プロファイルまでの変遷へんせん

AAC(Advanced Audio Coding)の基本きほんとなる方式ほうしきとして以下いかのものがある。これらは MPEG-2 の AAC プロファイルをベースとしている。

AAC Main
高音こうおんしつの AAC 方式ほうしき。AAC LC の機能きのうふくみ、AAC LC より演算えんざんりょうおおい。
AAC LC(Low Complexity)
AAC Main から後方こうほう予測よそく(backward prediction)の機能きのうのぞいた方式ほうしきおなじビットレートでの音質おんしつは AAC Main よりおとるが演算えんざんりょうすくなく伝送でんそうあやまりにつよい。
AAC SSR(Scalable Sample Rate)
周波数しゅうはすう帯域たいいき拡張かくちょうせいたせるため、4 帯域たいいき帯域たいいき分割ぶんかつフィルターを使つか帯域たいいきごとに符号ふごうおこな方式ほうしきおなじビットストリームから帯域たいいきことなる復号ふくごう結果けっかることができ、用途ようとおうじて演算えんざんりょう調節ちょうせつができる。

おおまかには、AAC は音楽おんがくなどの入力にゅうりょく信号しんごうMDCTもちいて周波数しゅうはすう領域りょういき係数けいすう変換へんかんして長期ちょうき予測よそくなどの処理しょりおこない、聴覚ちょうかく心理しんりがくうえ特性とくせい考慮こうりょしながら帯域たいいきごとに正規せいき量子りょうしおこなったのちハフマン符号ふごう符号ふごうする。復号ふくごうはこのぎゃく操作そうさおこなう。

MPEG-4オーディオでは、量子りょうし符号ふごう方式ほうしきとして TwinVQ や BSAC(Bit-Sliced Arithmetic Coding)を使つか方式ほうしき選択せんたくできる。またこういき成分せいぶんやステレオ信号しんごう少数しょうすうのパラメータで符号ふごう大幅おおはば情報じょうほう圧縮あっしゅくおこなHE-AAC プロファイルもある。

TwinVQ(Transform-domain Weighted Interleave Vector Quantization、変換へんかん領域りょういきおもけインターリーブベクトル量子りょうし)はベクトル量子りょうし一種いっしゅで、MPEG-4 では汎用はんようオーディオ符号ふごうでの量子りょうし符号ふごう方式ほうしきとしてもちいられる。 符号ふごうちょう固定こていなため通信つうしんエラーに比較的ひかくてきつよく、圧縮あっしゅくりつ状況じょうきょうおうじてえることができ [18] [19]、AAC が不得意ふとくいひくいビットレート(6 kbps ~)での音質おんしつ比較的ひかくてきすぐれている。

BSAC(Bit-Sliced Arithmetic Coding)は、ビットストリームを階層かいそうしビットレート拡張かくちょうせいたせるための技術ぎじゅつで、AAC のハフマン符号ふごうわりにもちいられる。チャネルたり 1 kbps のこまかいステップのビットレート拡張かくちょうせいられる[17]

BSAC では、AACと同様どうよう方法ほうほうもとめた量子りょうし周波数しゅうはすう領域りょういき係数けいすうのまとまりを、上位じょういビットからじゅん階層かいそうてきにまとめかく階層かいそうビットプレーンごとにエントロピー符号ふごうおこなう。エントロピー符号ふごう方式ほうしきには算術さんじゅつ符号ふごう(Arithmetic Code)をもちいる。 階層かいそうえるにしたがって下位かいのビット情報じょうほう追加ついかされてデータの欠落けつらくすくなくなり、よりこう品質ひんしつ復号ふくごう結果けっかることができる。

ビットレートを、ネットワーク状況じょうきょうなどの環境かんきょうおうじてこまかい単位たんいでダイナミックにえることができるため、リアルタイムでの QoS 制御せいぎょなどを実現じつげんできる[20]

BSAC は DMB(Digital Multimedia Broadcasting)で使用しようされている。

AAC LD(Low Delay)は符号ふごう遅延ちえんおさえた方式ほうしきで、通信つうしんなどリアルタイムで符号ふごう復号ふくごう必要ひつよう用途ようともちいられる。アルゴリズムからまる符号ふごう遅延ちえんはサンプリング周波数しゅうはすう 48 KHz の場合ばあいで 20ms 以下いかである[17]

AAC での符号ふごう単位たんいであるフレームちょうみじかくするなどの変更へんこうくわえ、圧縮あっしゅくりつ低下ていかえに符号ふごう遅延ちえんちいさくする。

AAC LC をコアに SBR(Spectral Band Replication、スペクトル帯域たいいき複製ふくせい)ツールをわせて圧縮あっしゅく効率こうりつ向上こうじょうさせたプロファイルを HE-AAC(High-Efficiency Advanced Audio Coding)、さらに PS(Parametric Stereo)ツールもわせたものを HE-AAC v2 と[21]HE-AAC は aacPlus や AAC+、HE-AAC v2 は aacPlus v2 や eAAC+ の商標しょうひょうめいばれることもある。

SBR は、入力にゅうりょく信号しんごうていいき成分せいぶんこういき成分せいぶん相関そうかん利用りようし、こういき成分せいぶんスペクトル情報じょうほうなど情報じょうほう復元ふくげんするためのわずかな制御せいぎょ情報じょうほうのみでパラメータし、復号ふくごうていいき成分せいぶん情報じょうほうから予測よそく復元ふくげんすることで情報じょうほう圧縮あっしゅくおこなう。

PS は、ステレオ信号しんごうについて同様どうようかんがかたもちいるものである。ステレオ信号しんごう左右さゆうチャネルの相関そうかん利用りようし、左右さゆうりょうチャネルをわせたモノラル信号しんごうとステレオの空間くうかん情報じょうほうをパラメータしたサイド情報じょうほうけて符号ふごうおこない、復号ふくごうはモノラル信号しんごうとサイド情報じょうほうとからりょうチャネルの信号しんごう復元ふくげんする。サイド情報じょうほう高音こうおんしつ場合ばあいでも 9 kbps 程度ていど[22]左右さゆうチャネルをそのまま符号ふごうするのにくら圧縮あっしゅく効率こうりつたかくなる。

りょう方式ほうしきとももと信号しんごう物理ぶつりてきおなじものを復元ふくげんするのではないが、音響おんきょう心理しんりがくてき自然しぜん復元ふくげんおこなうことができ、大幅おおはば情報じょうほう圧縮あっしゅくができる。 また、HE-AAC をサポートしていないコーデックでも、AAC LC で符号ふごうされたコア部分ぶぶんのみはデコード可能かのうである。

欧州おうしゅう放送ほうそう連合れんごう実施じっしした MUSHRA ほうによる試験しけんでは、HE-AAC で符号ふごうされた 48 kbps ステレオ信号しんごう評価ひょうかは 80てん で、 おなじビットレートの AAC や mp3PRO より音質おんしつたかかった[21]

また、Moving Picture Experts Group による HE-AAC と HE-AAC v2 の MUSHRA ほうによる比較ひかく試験しけんでは、24 kbps の HE-AAC v2 はおなじビットレートの HE-AAC よりはるかにすぐれており、32 kbps の HE-AAC と同等どうとうすぐれた評価ひょうかだった[21]

パラメトリックオーディオ符号ふごう

[編集へんしゅう]

パラメトリックオーディオ符号ふごうツールは、音楽おんがくなどをパラメータていビットレートで符号ふごうする方式ほうしきで、4 kbps~程度ていどひくいビットレートをMPEG-4 HILN(Harmonic and Individual Lines plus Noise) [23] や、高音こうおんしつ音楽おんがく対象たいしょうとする MPEG-4 SSC(SinuSoidal Coding)[22]ふくまれる。 HE-AAC v2 で使つかわれる PS(Parametric Stereo、パラメトリックステレオ)も MPEG-4 SSC を構成こうせいするツールの1つである [24]

MPEG-4 HILN は、音楽おんがく複数ふくすう正弦せいげんノイズわせでパラメータする方式ほうしきで、AAC よりさらにひくいビットレートで音楽おんがく符号ふごうおこなう。周波数しゅうはすう振幅しんぷくのパラメータを変換へんかん補間ほかんすることで、復号ふくごう音楽おんがく速度そくどとピッチとを独立どくりつして変更へんこうできる特徴とくちょうがある。

MPEG-4 SSC(SinuSoidal Coding)は MPEG-4 HILN とくらべると広帯域こうたいいき高音こうおんしつのオーディオけの符号ふごう方式ほうしきで、トランジェントツール(Transient tool)、正弦せいげんツール(Sinusoidal tool)、ノイズツール(Noise tool)、パラメトリックステレオ符号ふごうツール(Parametric Stereo coding tool)の 4 つのツールから構成こうせいされる。トランジェントツールはおとおおきくわる部分ぶぶんをパラメータする。正弦せいげんツールは比較的ひかくてき定常ていじょうてき部分ぶぶん周波数しゅうはすう位相いそう振幅しんぷくがゆっくりと変化へんかする正弦せいげんわせでパラメータする。ノイズツールは正弦せいげんツールで表現ひょうげんしきれない成分せいぶん特定とくてい時間じかんてきエンベロープスペクトルエンベロープつノイズとして表現ひょうげんする。パラメトリックステレオ符号ふごうツールはステレオ信号しんごうようで、ステレオ信号しんごうをモノラル成分せいぶん左右さゆうチャネルのちがいをあらわ少数しょうすうのパラメータで表現ひょうげんする。左右さゆうチャネルのちがいをあらわすパラメータとして、フィルターで分割ぶんかつしたかく周波数しゅうはすう領域りょういきでのチャネルあいだ強度きょうど位相いそう相互そうご相関そうかんもちいる [21][22]

Structured Audio

[編集へんしゅう]

Structured Audio(構造こうぞうオーディオ)はデコーダーがわ音楽おんがくやサウンドエフェクトを合成ごうせいするツールで、非常ひじょう表現ひょうげんりょくたか音楽おんがくを 2~3 kbps 以下いかのビットレートで符号ふごうすることができる[25]

Structured Audio は特定とくてい合成ごうせい方法ほうほう定義ていぎするのではなく、合成ごうせい方法ほうほう記述きじゅつするための言語げんご定義ていぎする。 Structured Audio は以下いか要素ようそふく[26]

SAOL(Structured Audio Orchestra Language)
合成ごうせい制御せいぎょのアルゴリズムを記述きじゅつするためのデジタル信号しんごう処理しょり言語げんご。シンタックスはC言語げんごちかい。楽器がっきやオーディオエフェクトを定義ていぎしそれらの関係かんけい記述きじゅつ
SASL(Structured Audio Score Language)
単純たんじゅん楽譜がくふ制御せいぎょのための言語げんご実際じっさいおと生成せいせいするために SAOLで定義ていぎされたアルゴリズムの使つかかた記述きじゅつする。楽譜がくふ相当そうとうする。
SASBF(Structured Audio Sample Bank Format)
ウェーブテーブル合成ごうせい使用しようする波形はけいテーブルのあつまりを記述きじゅつするフォーマット。
MIDI
SASL のわり、あるいは SASL とわせてGeneral MIDI使用しようできる。

実際じっさいおと生成せいせい方法ほうほうとして、以下いか方法ほうほう指定していできる[26]

  • General MIDI - MPEG-4 のビットストリームやファイルないGeneral MIDI使用しよう
  • ウェーブテーブル合成ごうせい - SASBF で記述きじゅつされた波形なみかたテーブルにより任意にんいおと生成せいせい
  • アルゴリズム合成ごうせい(Algorithmic Synthesis)- SAOL でアルゴリズムを記述きじゅつすることでユーザ定義ていぎ合成ごうせい制御せいぎょ可能かのう
  • オーディオエフェクト - SAOL でアルゴリズムを記述きじゅつすることで合成ごうせいおん/自然しぜんおんたいするオーディオエフェクトを実現じつげん
  • 汎用はんよう構造こうぞうオーディオ(Generalized Structured Audio)- SAOL によるアルゴリズム記述きじゅつにより様々さまざまなデコーダーのエミュレーション可能かのう

ロスレスオーディオ符号ふごう

[編集へんしゅう]

汎用はんようオーディオ符号ふごうやパラメトリックオーディオ符号ふごうはオーディオ信号しんごう可逆かぎゃく圧縮あっしゅくおこなうため、圧縮あっしゅくりつたかいがもと信号しんごうまったおな信号しんごう復元ふくげんすることはできない。マスタリングとう完全かんぜんせい要求ようきゅうされる用途ようとのために、ロスレス圧縮あっしゅく仕様しようとして以下いかがある[27]

MPEG-4 DST(Direct Stream Transfer)
スーパーオーディオCD使つかわれるロスレス圧縮あっしゅく方式ほうしきオーバーサンプリングされた1ビットオーディオ信号しんごう対象たいしょうとする。
MPEG-4 ALS(Audio Lossless Coding)
スタジオ編集へんしゅうなどでも使つかえる高音こうおんしつのマルチチャネルオーディオ信号しんごうあつかうことができるロスレス圧縮あっしゅく方式ほうしき量子りょうしビットすう32ビットまでの PCM対応たいおうし、任意にんいサンプリング周波数しゅうはすう最大さいだい 65536 チャネルまでのマルチチャネル/マルチトラックがあつかえるなど[28]柔軟じゅうなんせいたかい。
MPEG-4 SLS(Scalable Lossless Coding)
スケーラブルなロスレス圧縮あっしゅく方式ほうしき既存きそん可逆かぎゃく圧縮あっしゅく方式ほうしきである AAC をコアとしてもちい、既存きそん方式ほうしき符号ふごうできなかった誤差ごさ信号しんごう段階だんかいてき符号ふごうすることで、データの欠落けつらくすくなく音質おんしつたかいニアロスレス信号しんごうから、オリジナルのオーディオ信号しんごうとまったくおなじロスレス信号しんごうまで、様々さまざま音質おんしつ信号しんごうおな符号ふごう結果けっかからすことができる。

コンポジションツール

[編集へんしゅう]

MPEG-4オーディオでは複数ふくすうことなるツールをもちいた符号ふごうデータを「オーディオオブジェクト」としてわせることができる [29]最終さいしゅうてきなサウンドトラックはそれらをミキシングして1つにまとめられる。オーディオオブジェクトをわせるためのフレームワークとして、MPEG-4 BIFS(Binary Format for Scenes)のサブセットである AudioBIFSもちいる。

コンポジションツールを使つかうことにより、ミキシング制御せいぎょことなるサンプリング周波数しゅうはすう調整ちょうせいおこなうことができ、また信号しんごう処理しょりルーチンのダウンロードにより独自どくじのデジタルフィルターによる処理しょり各種かくしゅエフェクト残響ざんきょう効果こうかなど)をくわえることが可能かのうである[29]

たとえば、高音こうおんしつ背景はいけい音楽おんがくナレーションわせの場合ばあいMPEG-2 以前いぜん方式ほうしきでは音楽おんがく音声おんせいとをわせた1つのオーディオ信号しんごうを AAC などを使つかだかビットレート(32 kbps/channel 以上いじょう)で符号ふごうするしかないが、MPEG-4 ではオーディオ合成ごうせいツールである Structured Audio と音声おんせい符号ふごうツールの MPEG-4 CELPもちい、背景はいけい音楽おんがくを 2 kbps 程度ていど、ナレーションを 16 kbps 程度ていど符号ふごうしコンポジションツールでわせることができる[29]

さらに音声おんせいのみに残響ざんきょう効果こうかくわえたり、ユーザ操作そうさによりバックグラウンドミュージックのみをしたりするなど、1つのトラックにまとめられている場合ばあいむずかしい操作そうさ容易ようい実現じつげんできる。

あやまたいせい機能きのう

[編集へんしゅう]

MPEG-4 は元々もともとモバイル機器ききなどデータ転送てんそうちゅうあやまりがこりやすい環境かんきょうでの利用りよう想定そうていしていたこともあり、あやま保護ほご(Error Protection)のためのツールなどが用意よういされている。

あやまりにたいする影響えいきょうけやすさは符号ふごうビットストリームない一様いちようではなく、どの部分ぶぶんにどの程度ていど保護ほごおこなうかは影響えいきょうけやすさに依存いぞんする。あやま保護ほごツールでは UEP(Unequal Error Protection、均一きんいつあやま保護ほご)とばれる以下いかのような方法ほうほうあやま保護ほごおこな[30]

  1. 符号ふごう結果けっかフレームを複数ふくすうのサブフレームに分割ぶんかつ
  2. サブフレームをあやまりにたいする影響えいきょうけやすさにおうじてクラス
  3. クラスにおうじた適切てきせつあやま訂正ていせい符号ふごう(FEC)や CRC をサブフレームごとに付加ふか

オーバヘッドをらすため、複数ふくすうのフレームのおなじクラスは1つにまとめられる。 また最終さいしゅうてきなフレームはバーストエラーによる影響えいきょうらすためビットのならえ(インターリーブ)がおこなわれたのち転送てんそうされる。

また、これ以外いがい符号ふごう方式ほうしきごとのあやまたいせいツールなども存在そんざいする。たとえば、AAC ようとして以下いかのツールが定義ていぎされている [31]

  • Virtual CodeBooks tool(VCB11)- コードブックにより MDCT 係数けいすうあやまりを検出けんしゅつ
  • Reversible Variable Length Coding tool(RVLC、リバーシブル可変長かへんちょう符号ふごう)- ぎゃく方向ほうこうにも復号ふくごう可能かのう可変長かへんちょう符号ふごうハフマン符号ふごうわりに使用しよう
  • Huffman codeword reordering(HCR)- ハフマン符号ふごう結果けっかならえにより優先ゆうせんたか係数けいすう固定こてい位置いち配置はいち

AACMDCT 係数けいすう符号ふごうもちいられるハフマン符号ふごう出現しゅつげんかくりつおおきいみじか符号ふごうてる。このため効率こうりつてき情報じょうほう圧縮あっしゅくおこなうことができるが、符号ふごうちょう一定いっていでないためどこかであやまりが発生はっせいするとそれ以降いこうすべての符号ふごうただしく復号ふくごうできない問題もんだいがある。

リバーシブル可変長かへんちょう符号ふごう前後ぜんごどちらの方向ほうこうからでも復号ふくごうできるため、フレームの先頭せんとうからだけでなく最後さいごからも復号ふくごうおこなうことができ、あやまりの影響えいきょう範囲はんいらすことができる。ハフマン符号ふごう結果けっかならえ(HCR)も、固定こてい位置いち配置はいちされた優先ゆうせんたか係数けいすうまさしく復号ふくごうでき、それ以外いがい係数けいすう特定とくていのアルゴリズムによりあやまりの伝播でんぱ影響えいきょうすくなくなるよう配置はいちされるため、可変長かへんちょう符号ふごうによるあやま伝播でんぱ影響えいきょう低減ていげんできる。

オーディオオブジェクトタイプ

[編集へんしゅう]

MPEG-4オーディオでのサウンドトラックは、様々さまざまなツールで作成さくせいされたオーディオオブジェクトわせとして表現ひょうげんでき、様々さまざまなアプリケーションに柔軟じゅうなん対応たいおうできる[32]。 オーディオオブジェクトには、それぞれタイプをあらわす ID があたえられる。 オーディオオブジェクトタイプ ID の一覧いちらん以下いかしめす。

MPEG-4 Audio Object Types[2]
オブジェクトタイプID オーディオオブジェクトタイプ 最初さいしょ発行はっこうねん 説明せつめい
1 AAC Main 1999 AAC LC をふく
2 AAC LC(Low Complexity) 1999 MPEG-2 Part 7 Low Complexity profile(LC)に PNS(Perceptual Noise Substitution)をわせたもの
3 AAC SSR(Scalable Sample Rate) 1999 MPEG-2 Part 7 Scalable Sampling Rate profile(SSR)に PNS(Perceptual Noise Substitution)をわせたもの
4 AAC LTP(Long Term Prediction) 1999 AAC LC をふく
5 SBR(Spectral Band Replication 2003[33] "High Efficiency AAC Profile"(HE-AAC v1)でAAC LC とわせて使用しよう
6 AAC Scalable 1999
7 TwinVQ 1999 ていビットレートでのオーディオ符号ふごう方式ほうしき
8 CELP(Code Excited Linear Prediction) 1999 音声おんせい符号ふごう方式ほうしき(4 kbps~)
9 HVXC(Harmonic Vector eXcitation Coding) 1999 ちょうていビットレート音声おんせい符号ふごう方式ほうしき(2 kbps~)
10 (Reserved)
11 (Reserved)
12 TTSI(Text-To-Speech Interface) 1999
13 Main synthesis 1999 ウェーブテーブル合成ごうせい(Wavetable synthesis)、アルゴリズム合成ごうせい(Algorithmic Synthesis)とオーディオエフェクトをふく
14 Wavetable synthesis 1999 General MIDI をふく
15 General MIDI 1999
16 Algorithmic Synthesis and Audio Effects 1999
17 ER AAC LC 2000 あやまたいせい(Error Resilient、ER)がある
18 (Reserved )
19 ER AAC LTP 2000 あやまたいせいがある
20 ER AAC Scalable 2000 あやまたいせいがある
21 ER TwinVQ 2000 あやまたいせいがある
22 ER BSAC(Bit-Sliced Arithmetic Coding) 2000 AAC をベースに BSAC(Bit-Sliced Arithmetic Coding)とばれるほそつぶのビットレート拡張かくちょうせいのある符号ふごう手法しゅほうわせたもの。あやまたいせいがある。
23 ER AAC LD(Low Delay) 2000 通話つうわなどリアルタイムせい要求ようきゅうされる用途ようと使用しようするてい遅延ちえん符号ふごうあやまたいせいがある。
24 ER CELP 2000 あやまたいせいがある
25 ER HVXC 2000 あやまたいせいがある
26 ER HILN(Harmonic and Individual Lines plus Noise) 2000 あやまたいせいがある
27 ER Parametric 2000 あやまたいせいがある
28 SSC(SinuSoidal Coding) 2004[34][35] 音楽おんがくなどを対象たいしょうとした正弦せいげん符号ふごう
29 PS(Parametric Stereo) 2004[36],
2006[37]

[38]

"HE-AAC v2 Profile" で AAC LCMPEG-4 SBRわせて使用しよう。 PS 符号ふごうツールは2004ねん定義ていぎされ、オブジェクトタイプは2006ねん定義ていぎされた。
30 MPEG Surround 2007[39] MPEG Spatial Audio Coding(SAC)の名称めいしょうでもられるサラウンドオーディオの符号ふごう手法しゅほう[40][41] (MPEG Surround は2007ねんに ISO/IEC 23003-1 でも定義ていぎ[42]
31 (Reserved)
32 MPEG-1/2 Layer-1 2005[43]
33 MPEG-1/2 Layer-2 2005[43]
34 MPEG-1/2 Layer-3 2005[43] "MP3 on MP4" の名称めいしょうでもられる
35 DST(Direct Stream Transfer 2005[44] スーパーオーディオCD(SACD)で使用しようされるロスレス圧縮あっしゅく方式ほうしき
36 ALS(Audio Lossless Coding 2006[38] オーディオ信号しんごうロスレス圧縮あっしゅく方式ほうしき
37 SLS(Scalable Lossless Coding 2006[45] オーディオ信号しんごうのスケーラブルなロスレス圧縮あっしゅく方式ほうしき
38 (Reserved)
39 ER AAC ELD(Enhanced Low Delay) 2008[46] てい遅延ちえん AAC の改良かいりょうばんあやまたいせいがある
40 SMR(Symbolic Music Representation)Simple 2008 シンボル情報じょうほう音楽おんがく表現ひょうげんする SMR(Symbolic Music Representation)は MPEG-4 Part 23(ISO/IEC 14496-23:2008)[47][48]定義ていぎされている
41 SMR Main 2008 MPEG-4 Part 23(ISO/IEC 14496-23:2008)で定義ていぎ[47][48]
42 USAC(Unified Speech and Audio Coding) 標準ひょうじゅん作業さぎょうちゅう[49]音声おんせいとオーディオの符号ふごう方式ほうしき統合とうごうしたもの(MPEG-D Part 3 - ISO/IEC 23003-3でも標準ひょうじゅん予定よてい
43 SAOC(Spatial Audio Object Coding) 標準ひょうじゅん作業さぎょうちゅう[50][51][52]
44 LD MPEG Surround 標準ひょうじゅん作業さぎょうちゅう[51][52]てい遅延ちえん MPEG サラウンド符号ふごうでのサイド情報じょうほう(MPEG-D Part 2 - ISO/IEC 23003-2 でも標準ひょうじゅん)をあらわ

オーディオプロファイル

[編集へんしゅう]

MPEG-4オーディオでは、様々さまざまなアプリケーションに対応たいおうできるよう、オーディオオブジェクトタイプの標準ひょうじゅんてきわせがオーディオプロファイルとして定義ていぎされている。オーディオプロファイルには、必要ひつようとされる演算えんざんりょうおうじて最大さいだいサンプリング周波数しゅうはすうなどのパラメータがことなる複数ふくすうのレベルが定義ていぎされているものもある。

MPEG-4 Audio Profiles[2]
オーディオプロファイル オーディオオブジェクトタイプ リリースねん
AAC Profile AAC LC 2003
High Efficiency AAC Profile AAC LC, SBR 2003
HE-AAC v2 Profile AAC LC, SBR, PS 2006
Main Audio Profile AAC Main, AAC LC, AAC SSR, AAC LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI, Main synthesis 1999
Scalable Audio Profile AAC LC, AAC LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI 1999
Speech Audio Profile CELP, HVXC, TTSI 1999
Synthetic Audio Profile TTSI, Main synthesis 1999
High Quality Audio Profile AAC LC, AAC LTP, AAC Scalable, CELP, ER AAC LC, ER AAC LTP, ER AAC Scalable, ER CELP 2000
Low Delay Audio Profile CELP, HVXC, TTSI, ER AAC LD, ER CELP, ER HVXC 2000
Natural Audio Profile AAC Main, AAC LC, AAC SSR, AAC LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI, ER AAC LC, ER AAC LTP, ER AAC Scalable, ER TwinVQ, ER BSAC, ER AAC LD, ER CELP, ER HVXC, ER HILN, ER Parametric 2000
Mobile Audio Internetworking Profile ER AAC LC, ER AAC Scalable, ER TwinVQ, ER BSAC, ER AAC LD 2000
HD-AAC Profile AAC LC, SLS[53] 2009[54]
ALS Simple Profile ALS(標準ひょうじゅん作業さぎょうちゅう[50][55]

保存ほぞん/転送てんそう形式けいしき

[編集へんしゅう]

MPEG-4 では、符号ふごう復号ふくごう方法ほうほうだけではなく、符号ふごうされた複数ふくすうのデータストリームから最終さいしゅうてきな1つの基本きほんストリームにまとめる方法ほうほう保存ほぞんおこな形式けいしき仕様しよう定義ていぎされている。

MPEG-4 が対象たいしょうとするアプリケーションの範囲はんいひろ要求ようきゅう様々さまざまなであるため、基本きほんストリームを転送てんそうする方法ほうほう定義ていぎせず、トランスポートそうとのインタフェースが DMIF(Delivery Multimedia Interface Format)として ISO/IEC 14496-6 で標準ひょうじゅんされている[2]

オブジェクトベースの符号ふごう必要ひつよういMPEG-4オーディオアプリケーションけには、オーバヘッドのすくない LATM とそれを転送てんそうもちいる LOAS が定義ていぎされている。

トランスポートそう仕様しようれいとしては、IETF定義ていぎした RFC 3016RTP Payload Format for MPEG-4 Audio/Visual Streams)、RFC 3640RTP Payload Format for Transport of MPEG-4 Elementary Streams)、RFC 4281(The Codecs Parameter for "Bucket" Media Types)、RFC 4337(MIME Type Registration for MPEG-4)などがある。

MPEG-4オーディオの多重たじゅう蓄積ちくせき転送てんそう形式けいしき[2]
種別しゅべつ 標準ひょうじゅん 説明せつめい
多重たじゅう(Multiplex) ISO/IEC 14496-1 MPEG-4 Multiplex scheme(M4Mux)
多重たじゅう(Multiplex) ISO/IEC 14496-3 Low Overhead Audio Transport Multiplex(LATM)
蓄積ちくせき(Storage) ISO/IEC 14496-3 、
ISO/IEC 13818-7 がオリジナル定義ていぎ
Audio Data Interchange Format(ADIF)- AAC のみ
蓄積ちくせき(Storage) ISO/IEC 14496-12 MPEG-4 ファイルフォーマット(MP4) / ISOベースメディアファイルフォーマット
転送てんそう(Transmission) ISO/IEC 14496-3 、
ISO/IEC 13818-7 がオリジナル定義ていぎ
Audio Data Transport Stream(ADTS)- AAC のみ
転送てんそう(Transmission) ISO/IEC 14496-3 Low Overhead Audio Stream(LOAS)、LATM がベース

注釈ちゅうしゃく出典しゅってん

[編集へんしゅう]
  1. ^ a b JIS, JIS X4332-3 - 音響おんきょう映像えいぞうオブジェクトの符号ふごうだい3音響おんきょう, 2002.
  2. ^ a b c d e f ISO/IEC (2009ねん). “ISO/IEC 14496-3:2009 - Information technology -- Coding of audio-visual objects -- Part 3: Audio”. ISO. 2010ねん9がつ4にち閲覧えつらん
  3. ^ a b c d ISO/IEC (2009) (PDF), ISO/IEC 14496-3:2009 - Information technology -- Coding of audio-visual objects -- Part 3: Audio, ISO, http://webstore.iec.ch/preview/info_isoiec14496-3%7Bed4.0%7Den.pdf 2010ねん9がつ4にち閲覧えつらん 
  4. ^ a b ISO (1999ねん). “ISO/IEC 14496-3:1999 - Information technology -- Coding of audio-visual objects -- Part 3: Audio”. ISO. 2010ねん9がつ4にち閲覧えつらん
  5. ^ Didier Le Gall (1991-04) (PDF), MPEG: a video compression standard for multimedia applications, Communications of the ACM, http://www.cis.temple.edu/~vasilis/Courses/CIS750/Papers/mpeg_6.pdf 2010ねん9がつ4にち閲覧えつらん 
  6. ^ 渡邊わたなべ 敏明としあき (2002ねん). “MPEG-4 の概要がいよう” (PDF). 東芝とうしば. 2010ねん9がつ4にち閲覧えつらん
  7. ^ Jürgen Herre, Bernhard Grill (2000) (PDF), Overview of MPEG-4 audio and its applications in mobile communications, IEEE, https://web.archive.org/web/20031021020652/http://www.ifip.or.at/con2000/icct2000/icct483.pdf 2010ねん9がつ4にち閲覧えつらん 
  8. ^ ISO (2000ねん). “ISO/IEC 14496-3:1999/Amd 1:2000 - Audio extensions”. ISO. 2010ねん9がつ4にち閲覧えつらん
  9. ^ ISO/IEC JTC 1/SC 29/WG 11 (1999-07) (PDF), ISO/IEC 14496-3:/Amd.1 - Final Committee Draft - MPEG-4 Audio Version 2, ftp://ftp.tnt.uni-hannover.de/pub/MPEG/audio/mpeg4/documents/w2803/w2803_n.pdf 2010ねん9がつ4にち閲覧えつらん 
  10. ^ Heiko Purnhagen (1999-06-07) (PDF), An Overview of MPEG-4 Audio Version 2, Heiko Purnhagen, ftp://ftp.tnt.uni-hannover.de/pub/papers/1999/AES17-HP.pdf 2010ねん9がつ4にち閲覧えつらん 
  11. ^ ISO (2001ねん). “ISO/IEC 14496-3:2001 - Information technology -- Coding of audio-visual objects -- Part 3: Audio”. ISO. 2010ねん9がつ4にち閲覧えつらん
  12. ^ ISO (2005ねん). “ISO/IEC 14496-3:2005 - Information technology -- Coding of audio-visual objects -- Part 3: Audio”. ISO. 2010ねん9がつ4にち閲覧えつらん
  13. ^ MPEG. “MPEG standards - Full list of standards developed or under development”. chiariglione.org. 2010ねん9がつ4にち閲覧えつらん
  14. ^ ISO/IEC 14496-3:2009 page vii.
  15. ^ Karlheinz Brandenburg, Oliver Kunz, Akihiko Sugiyama. “MPEG-4 Natural Audio Coding - Natural Speech Coding Tools”. 2010ねん9がつ4にち閲覧えつらん
  16. ^ ISO/IEC 14496-3:2009 page viii.
  17. ^ a b c ISO/IEC 14496-3:2009 page ix.
  18. ^ NTT PC (2010ねん). “用語ようご解説かいせつ辞典じてん TwinVQ”. 2010ねん9がつ4にち閲覧えつらん
  19. ^ NTTヒューマンインタフェース研究所けんきゅうじょ (1996ねん). “ようこそTwinVQのふるさとへ(きゅうウェブサイト)”. NTT. 2010ねん9がつ4にち閲覧えつらん
  20. ^ ISO/IEC 14496-3:2009, Page ix.
  21. ^ a b c d Stefan Meltzer, Gerald Moser (2006ねん1がつ). “HE-AAC v2” (PDF). EBU. 2010ねん9がつ4にち閲覧えつらん
  22. ^ a b c ISO/IEC 14496-3:2005 Subpart 8, Page 2.
  23. ^ ISO/IEC 14496-3:2005 Subpart 7, Page 2.
  24. ^ ISO/IEC 14496-3:2005 Subpart 8, Annex 8.A, Page 64.
  25. ^ ISO/IEC 14496-3:2005 Subpart 5, Page 4.
  26. ^ a b Giorgio Zoia (2005ねん10がつ). “MPEG Technologies: Structured Audio”. chiariglione.org. 2010ねん9がつ4にち閲覧えつらん
  27. ^ ISO/IEC 14496-3:2009 Page x - xi.
  28. ^ 原田はらだ のぼる, 守谷もりや けんひろし, かまほん ゆう (2008ねん2がつ). “MPEG-4 ALSの性能せいのう応用おうよう関連かんれんする標準ひょうじゅん活動かつどう” (PDF). NTT. 2010ねん9がつ4にち閲覧えつらん
  29. ^ a b c ISO/IEC 14496-3:2009 Page xi - xii.
  30. ^ ISO/IEC 14496-3:2005 Subpart 1, Page 64-65.
  31. ^ ISO/IEC 14496-3:2005 Page xiii - xiv.
  32. ^ ISO/IEC 14496-3:2009 Page vi.
  33. ^ ISO (2003ねん). “Bandwidth extension, ISO/IEC 14496-3:2001/Amd 1:2003”. ISO. 2010ねん9がつ4にち閲覧えつらん
  34. ^ ISO (2004ねん). “Parametric coding for high-quality audio, ISO/IEC 14496-3:2001/Amd 2:2004”. ISO. 2010ねん9がつ4にち閲覧えつらん
  35. ^ ISO/IEC JTC1/SC29/WG11 (2003ねん7がつ25にち). “Text of ISO/IEC 14496-3:2001/FPDAM2(Parametric Audio) - N5713” (DOC). 2010ねん9がつ4にち閲覧えつらん
  36. ^ 3GPP (2004ねん9がつ30にち). “3GPP TS 26.401 V6.0.0 (2004-09), General Audio Codec audio processing functions; Enhanced aacPlus General Audio Codec; General Description(Release 6)” (DOC). 3GPP. 2010ねん9がつ4にち閲覧えつらん
  37. ^ 3GPP (2005ねん1がつ4にち). “ETSI TS 126 401 V6.1.0(2004-12) - Universal Mobile Telecommunications System (UMTS); General audio codec audio processing functions; Enhanced aacPlus general audio codec; General description (3GPP TS 26.401 version 6.1.0 Release 6)”. 3GPP. 2010ねん9がつ4にち閲覧えつらん
  38. ^ a b ISO (2006ねん). “Audio Lossless Coding (ALS), new audio profiles and BSAC extensions, ISO/IEC 14496-3:2005/Amd 2:2006”. ISO. 2010ねん9がつ4にち閲覧えつらん
  39. ^ ISO (2007ねん). “BSAC extensions and transport of MPEG Surround, ISO/IEC 14496-3:2005/Amd 5:2007”. ISO. 2010ねん9がつ4にち閲覧えつらん
  40. ^ ISO/IEC JTC1/SC29/WG11 (2005ねん7がつ). “Tutorial on MPEG Surround Audio Coding”. 2010ねん9がつ4にち閲覧えつらん
  41. ^ ISO/IEC JTC1/SC29/WG11 (2005ねん7がつ). “Tutorial on MPEG Surround Audio Coding”. archive.org. 2010ねん2がつ9にち閲覧えつらん
  42. ^ ISO (2007ねん1がつ29にち). “ISO/IEC 23003-1:2007 - Information technology -- MPEG audio technologies -- Part 1: MPEG Surround”. ISO. 2010ねん9がつ4にち閲覧えつらん
  43. ^ a b c ISO (2005ねん). “MPEG-1/2 audio in MPEG-4, ISO/IEC 14496-3:2001/Amd 3:2005”. ISO. 2010ねん9がつ4にち閲覧えつらん
  44. ^ ISO (2005ねん). “Lossless coding of oversampled audio, ISO/IEC 14496-3:2001/Amd 6:2005”. ISO. 2010ねん9がつ4にち閲覧えつらん
  45. ^ ISO (2006ねん). “Scalable Lossless Coding (SLS), ISO/IEC 14496-3:2005/Amd 3:2006”. ISO. 2010ねん9がつ4にち閲覧えつらん
  46. ^ ISO (2008ねん). “Enhanced low delay AAC, ISO/IEC 14496-3:2005/Amd 9:2008”. ISO. 2010ねん9がつ4にち閲覧えつらん
  47. ^ a b ISO (2008ねん). “ISO/IEC 14496-23:2008, Information technology -- Coding of audio-visual objects -- Part 23: Symbolic Music Representation”. ISO. 2010ねん9がつ4にち閲覧えつらん
  48. ^ a b ISO (2008ねん). “Symbolic Music Representation conformance, ISO/IEC 14496-4:2004/Amd 29:2008”. ISO. 2010ねん9がつ4にち閲覧えつらん
  49. ^ ISO/IEC JTC 1/SC 29/WG 11 (2009ねん4がつ). “89th WG11 meeting notice - Work plan and time line”. 2010ねん9がつ4にち閲覧えつらん
  50. ^ a b ISO/IEC JTC1/SC29/WG11 (2009-07-03) (DOC), ISO/IEC 14496-3:200X/PDAM 2 – ALS Simple Profile and Transport of SAOC , N10826, http://www.itscj.ipsj.or.jp/sc29/open/29view/29n10483t.doc 2010ねん9がつ4にち閲覧えつらん 
  51. ^ a b ISO (2009ねん). “ISO/IEC 14496-3:2009/FDAM 2, ALS simple profile and transport of SAOC”. ISO. 2010ねん9がつ4にち閲覧えつらん
  52. ^ a b ISO/IEC JTC1/SC29/WG11 (2009-10) (DOC), ISO/IEC 14496-3:2009/FPDAM 2 – ALS simple profile and transport of SAOC , N11032, http://www.itscj.ipsj.or.jp/sc29/open/29view/29n10730t.doc 2010ねん9がつ4にち閲覧えつらん 
  53. ^ ISO/IEC JTC1/SC29/WG11 (2008-10-17) (DOC), ISO/IEC 14496-3:2005/PDAM 10:200X HD-AAC profile, MPEG2008/N10188, http://www.itscj.ipsj.or.jp/sc29/open/29view/29n9813t.doc 2010ねん9がつ4にち閲覧えつらん 
  54. ^ ISO (2009ねん9がつ11にち). “ISO/IEC 14496-3:2009/Amd 1:2009 - HD-AAC profile and MPEG Surround signaling”. ISO. 2010ねん9がつ4にち閲覧えつらん
  55. ^ ISO (2009ねん10がつ8にち). “ISO/IEC 14496-3:2009/FDAM 2 - ALS simple profile and transport of SAOC”. ISO. 2010ねん9がつ4にち閲覧えつらん

参考さんこう文献ぶんけん

[編集へんしゅう]
  • Andreas Spanias, Ted Painter, Venkatraman Atti (ed). Audio signal processing and coding. Wiley-Interscience, John Wiley & Sons, Inc., 2006. ISBN 978-0471791478.
  • ISO/IEC. Information technology — Coding of audio-visual objects — Part 3:Audio. ISO/IEC 14496-3:2005, Third edition, 2005.
  • ISO/IEC. Information technology — Coding of audio-visual objects — Part 3:Audio. ISO/IEC 14496-3:2009, Fourth edition, 2009.

関連かんれん項目こうもく

[編集へんしゅう]

外部がいぶリンク

[編集へんしゅう]