便利なキーワード検索サイト ことなびトップページへ
デル株式会社







ことなびTOP  サイトマップ  ことなびとは?



便利!NINJA TOOLS
→FC2検索 用語 Wikipedia YouTube

音声圧縮 とは?

 ページ内リンク   ↓ウィキペディア(Wikipedia)記事  ↓Yahoo!知恵袋

音声圧縮: Audio compression)とは、音声ファイルのサイズを削減する目的で設計されたデータ圧縮の一種である。音声圧縮アルゴリズムは、「オーディオコーデック」として実装される。汎用データ圧縮アルゴリズムは音声データには適さず、オリジナルの87%以下に圧縮できることがほとんどなく、リアルタイムの再生にも適さない。そのため、音声向けの可逆圧縮アルゴリズムや非可逆圧縮アルゴリズムが生み出された。非可逆圧縮アルゴリズムは圧縮率が非常に高く、一般の音響機器によく使われている。

出典: 『ウィキペディア(Wikipedia)』


和英辞典

音声圧縮 [おんせいあっしゅく] 別ウィンドウで表示  …  (n) voice compression

ノースウエスト航空 のマイルは、国内航空会社のマイレージと違って無期限!! 格安パックツアーでも
100%マイルが付くのでお得!! 国内往復分15000マイルを貯めて沖縄や北海道へ!!


関連商品

本  画像&音声圧縮技術のすべて―インターネット/ディジタルテレビ/モバイル通信時代の必須技術 (TECH I)別ウィンドウで表示

藤原 洋 /  最安値(新品): ¥ 2,200  最安値(中古): ¥ 1,657 
おすすめ度5.0(全レビューの平均)TECHI関連の雑誌は値段が安い割りに中身が詳細にわたって書かれており、非常に仕事の上で参考になりますよ(^^  (jthomas さんのレビュー)

本  よくわかるポータブルデジタルオーディオ―音声圧縮技術が築く新たなライフスタイル別ウィンドウで表示

加賀 章喜 /  最安値(新品): ¥ 1,680  最安値(中古): ¥ 639 
おすすめ度5.0(全レビューの平均)音の原理からCDのフォーマット、MP3、WMA、AACといった圧縮方法の特徴などが図を交えて丁寧に解説されており、アナログからデジタルへの変換や各種フォーマットに関する知識が身に付きます。 携帯型オーディオプレーヤーの種類と選び方は、購入を検討している方には参考になるでしょう。ネットワークプレーヤーについても1章を割いて解説しています。 特定のオーディオプレーヤーに特化していないため、多くの方にお薦めできます。  (ひでまろ さんのレビュー)

PCソフトウェア  超圧縮 XVD Plus 「活用ガイドブック」付き別ウィンドウで表示

おすすめ度5.0(全レビューの平均)高画質です。VHSのライブラリー等を圧縮したいのならもってこいでしょう。ただし、数時間単位の圧縮をする人はそれなりのスペックのPCを用意してください。相当時間がかかります。CPUの目安は2Ghzくらいでしょうか。

PCソフトウェア  超圧縮 XVD Plus別ウィンドウで表示

おすすめ度4.0(全レビューの平均)




ウィキペディア(Wikipedia)記事


音声圧縮: Audio compression)とは、音声ファイルのサイズを削減する目的で設計されたデータ圧縮の一種である。音声圧縮アルゴリズムは、「オーディオコーデック」として実装される。汎用データ圧縮アルゴリズムは音声データには適さず、オリジナルの87%以下に圧縮できることがほとんどなく、リアルタイムの再生にも適さない。そのため、音声向けの可逆圧縮アルゴリズムや非可逆圧縮アルゴリズムが生み出された。非可逆圧縮アルゴリズムは圧縮率が非常に高く、一般の音響機器によく使われている。

可逆でも非可逆でも、情報の冗長性を削減するために、符号化手法、パターン認識、線形予測などの手法を駆使して、圧縮を行う。音声品質は若干落ちるが、多くのユーザーはその違いに気づかず、必要なデータ量は大幅に削減される。例えば、1枚のコンパクトディスクで、高品質な音楽データなら1時間しか記録できないが、可逆圧縮すれば2時間ぶんを記録でき、MP3のような非可逆圧縮なら7時間ぶんの音楽を記録できる。

目次

可逆音声圧縮

記憶媒体と通信帯域幅は年々コストが低くなっているため、音声ファイルを永久的に保管するための形式として、Monkey's AudioFLACShorten などの可逆圧縮フォーマットがよく使われるようになってきている。特にレコーディングエンジニアやオーディオマニアが可逆圧縮フォーマットをよく使う。圧縮率は汎用の可逆データ圧縮と同程度(オリジナルの50%から60%)である。次世代DVD向けに Dolby TrueHD のような可逆圧縮フォーマットも登場している。

音声の全てのデータを保持しつつ、大幅な圧縮率を達成することは困難である。そもそも、実世界で録音された音声は非常に複雑で、圧縮技法のひとつであるパターンの繰り返しの検出が困難である。画像の場合もコンピュータグラフィックスよりも実世界の写真の方が圧縮しにくいのと同じである。ただし音声の場合、コンピュータが生成した音も非常に複雑な波形を含み、多くの圧縮アルゴリズムでは圧縮が難しい。これは、音声波形がそのままでは単純化するのが難しく、人間の耳で行われているように周波数領域に(必要なら可逆に)変換してやる必要があるためである。

また、音声の標本化された値は非常に素早く変化するため、汎用のデータ圧縮アルゴリズムでは音声をうまく扱えず、同じバイト列が何度も繰り返されることもほとんどない。[-1 1]フィルタによる畳み込みは、スペクトルを若干ホワイトノイズ化(平坦化)する傾向があり、そのため可逆圧縮のエンコーダで利用される。その場合、デコーダが逆の操作を行って元の信号を復元する。FLACShortenTTA といったコーデックは、信号の周波数スペクトルを推定するのに線形予測法を用いる。エンコーダでは、その予測の逆を行って周波数スペクトルのピークを小さくすることでホワイトノイズ化し、デコーダは線形予測法をそのまま使って元の信号を再構築する。

可逆オーディオコーデックは音質には問題がないため、有用性は以下の観点で判断される。

  • 圧縮・伸張の速度
  • 圧縮率
  • ソフトウェア・ハードウェアでの採用状況
  • 誤り訂正能力

非可逆音声圧縮

非可逆音声圧縮は、様々な場面で使われている。MP3プレイヤーやコンピュータのような直接的な利用だけでなく、DVDビデオでの音声圧縮、デジタルテレビでの音声圧縮インターネット上のストリーミングメディア、衛星ラジオやケーブルラジオなどで使われている。非可逆圧縮は重要でないデータを捨てているため、可逆圧縮よりも遥かに圧縮率が高い(オリジナルの5%から20%)。

非可逆音声圧縮の開発には音響心理学の成果が応用されている。すなわち、人間の聴覚は全ての音声データを認識しているわけではない。多くの非可逆圧縮ではまず、知覚されないと思われる音、すなわち人間の耳には聞こえにくい音を識別し、知覚的冗長性を減らす。典型例としては、高周波数成分や大きな音と同時に鳴っている小さな音などである。それらの音は正確度を減じて符号化されるか、全く符号化されない。

このような聞こえない音の除去はビット数削減効果はそれほど大きくない。非可逆圧縮での圧縮の大部分はそれとは相補的なノイズシェーピングという現象によるものである。信号を符号化するビット数を減らすと、S/Nが悪化する。音響心理学に基づいた非可逆圧縮では、このような増大したノイズを知覚されないように「隠す」技法が重要である。これは例えば、高周波数成分に割り当てるビット数を削減することでなされる。そのようにするのは、元の情報に高周波数成分が少ないからではなく、人間の耳が低い周波数しか知覚できないからである。それによってノイズが隠蔽され、知覚されなくなる。

知覚モデルに基づく冗長性削減でも十分な圧縮率が得られない場合、さらなる非可逆圧縮が必要となる。音源によっては、そうしても音質の低下を感じないこともある。例えば、人間の話し声は音楽よりも圧縮可能である。非可逆圧縮の多くはデータレートを調整・設定可能であり、例えばビット毎秒で表現する。さらなる圧縮においても人間の聴覚モデルに基づいて、音の重要性を判断して圧縮していく。実際の聴覚モデルは様々で、それぞれ特定の用途に特化している。帯域幅や記憶容量によって、非可逆圧縮した結果の音質は様々だが、一般に明らかな音質低下はユーザーに敬遠される。

非可逆圧縮によってデータは失われ、伸張しても復元できないので、音声ファイルの保管には好まれないこともある。従って、普段は非可逆圧縮を使っていても、保管には可逆圧縮を使いたいという場合もある。また、圧縮技術は日々進化しているため、新たな高品質の非可逆圧縮法が登場した場合、その新たな方式で圧縮したファイルを作るにはオリジナルの音声データが必要となる。非可逆圧縮された音声データを伸張して別の非可逆圧縮方式で圧縮すると、どんどん音質が低下していく。

符号化手法

変換領域

知覚的に不要な音声信号内の部分を特定するため、多くの非可逆圧縮アルゴリズムでは時間領域の標本波形を変換領域にコンバートするため、修正離散コサイン変換 (MDCT) などを使う。一般に周波数領域に変換すると、周波数成分ごとに可聴性を考慮してビットが割り当てられる。周波数成分の可聴性は、まずマスキングしきい値を計算し、それ未満の音は人間には知覚されないと判断する。

マスキングしきい値の計算には、絶対可聴しきい値同時マスキングの原理を使い、場合によっては経時マスキングも利用する。等ラウドネス曲線を使って各周波数成分の重み付けも行うことがある。このような脳も含めた人間の聴覚モデルに基づいた現象群を心理音響モデルと呼ぶ。

時間領域

別の非可逆圧縮方式として、線形予測符号 (LPC) が人間の話し声(スピーチ)向けに使われている。この場合、音源(LPCに基づいた人間の話し声など)を量子化する前にホワイトノイズ化(平坦化)を行う。

応用

非可逆圧縮アルゴリズムの性質から、伸張と再圧縮を繰り返すたびに音質が低下する。従って、編集過程で一時保存する際の方式としては適切でない。一方、リスニングのみの目的で利用する場合には、それなりの音質を保ったまま劇的にファイル容量を削減できる。

有用性

非可逆オーディオコーデックの有用性は、以下の観点で判断される。

  • 音質
  • 圧縮率
  • 圧縮・伸張の速度
  • アルゴリズムの本質的なレイテンシ(リアルタイム・ストリーミングで重要)
  • ソフトウェアやハードウェアの採用状況

非可逆圧縮フォーマットは、ストリーミングやリアルタイムでの利用(携帯電話網での音声のデジタル転送時など)が多い。そのため、データは流れに沿って即座に伸張される必要があり、全データの転送完了後に伸張するといった手法は採用できない。オーディオコーデックは必ずしもストリーミング用途に使えるわけではないので、ストリーミング用に設計されたコーデックを選ばなければならない。

データのエンコード/デコードに使われる手法によってレイテンシが異なる。コーデックによっては、比較的長い期間のデータを解析して効率を最適化するため、レイテンシが大きくなる。アルゴリズムの本質的なレイテンシは重要である。例えば、電話のように双方向のデータ転送(音声のやりとり)がある場合、遅延が大きくなるとサービス品質に致命的な問題を生じる。

圧縮の速度はアルゴリズムが実施する操作の回数に比例するが、レイテンシは1ブロックの音声を処理するまでに解析する標本数に比例する。最小ケースでは、レイテンシは0である(例えば、単純にビット深度を小さくする場合)。LPC のような時間領域のアルゴリズムもレイテンシは小さく、そのために電話でのスピーチ圧縮でよく使われる。MP3などのアルゴリズムでは、周波数領域の心理音響モデルを実装して多数の標本を解析するため、レイテンシは 23ミリ秒程度になる(双方向通信で使えば46ミリ秒になる)。

スピーチ圧縮

スピーチ圧縮は、音声圧縮の重要なカテゴリである。人間の耳を近似した知覚モデルは、話し声と音楽では若干異なる。扱わなければならない周波数の範囲が、話し声の方が音楽よりずっと狭くてすみ、波形もそれほど複雑でない。結果として、スピーチは低ビットレートで高い音質の符号化が可能である。

これは、一般に次のような手法を組み合わせることで実現される。

  • 一人の人間の話し声だけを対象として符号化する。
  • 人間の聴覚が聴ける範囲の周波数だけを対象とし、それ以外の部分を捨てる。

スピーチ圧縮の初期のアルゴリズムとして、A-lawアルゴリズムμ-lawアルゴリズムがある(→G.711)。

関連項目

外部リンク


ウィキペディア All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの記事を複製、改変、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。ことなびに掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。



Yahoo!知恵袋





「音声圧縮」 検索数の推移 (過去1ヶ月間)

powered by  goo ( NTT Resonant Inc. )


  ↓ニュース  ↓YouTube  ↓テレビ番組  ↓はてブ  ↓ヤフオク
  ↓このページへのリンク

ニュース記事

powered by  Google+ Yahoo!

●... 0 0 0 0 0 0 0 0 0. プリンタ用表示. 速報. 2004/03/06 15:26 更新. MSとAT&T、音声圧縮技術めぐる特許訴訟で和解. 米AT&TとMicrosoftは3月5日、音声圧縮技術をめぐる特許訴訟で和解合意に至ったと発表した。 ...別ウィンドウで表示   (2008年11月13日)

●ネットワーク対応長時間録音システムは、独自技術により音声ピックアップ部(音声圧縮フロントエンドNVR-40)をネットワーク接続したもの。 これにより、企業内ネットワークインフラをそのまま活用可能で、通話記録が必要な部門に ...別ウィンドウで表示   (2008年11月12日)

●ドルビーデジタル(AC-3)音声圧縮対応. ドルビープロロジック・サラウンド対応. 5.1chデジタルサラウンド(デジタル出力)対応. リニアPCMオーディオ対応. 音声8ストリームから1ストリーム選択可能. スペシャルモード. マルチアングル対応 ...別ウィンドウで表示   (2008年10月29日)

●動画圧縮には Crystal Net SFM CODECを、音声圧縮には GSM CODECを使用してお届けしています。 ご意見・ご感想を電子メールでお送りください。 電子メール宛先:ibs-mmj@mmj.ho.nec.co.jp ...別ウィンドウで表示   (2007年11月21日)

音声圧縮は、マイクロソフト社が開発した「WMA」方式を採用した。 記録媒体には著作権保護機能に対応したスマートメディアを使う。 同社によると、デジタル音声再生機能と液晶テレビが一体化したモバイル機器は初めて。 多機能なのは ...別ウィンドウで表示   (2004年5月20日)

●また音声圧縮に、LPEC(エルペック)というソニー独自の方式を採用しており、パソコンで編集する場合は、別売りの専用キットを買わなければならない。 購入する際はその点も留意したい。 「お野菜にさっとしみこむ浅漬けの素」 日清フーズ ...別ウィンドウで表示   ()

YouTube

powered by YouTube


※.クリックすると動画が再生されます。

テレビ番組サーチ

powered by Yahoo!TV

はてなブックマーク

powered by Hatena

 PageRank5以上の相互リンク
 ・相互リンクスクエア  (PageRank 5)
 ・相互リンク相互リンク アクセスランキング インプロス  (PageRank 5)
 →便利!NINJA TOOLS
 →FC2検索  用語  Wikipedia  YouTube


スポンサー

powered by  コンテンツマッチ広告のブレイナー


Yahooオークション

powered by Yahoo!

 








デル株式会社 ThinkPad アウトレット Apple Store(Japan) PCDEPOT WEB本店/OZZIO Sony Style(ソニースタイル) シマンテックダウンロードストア マカフィー・ストア

ことなびTOP -  サイトマップ sitemap.xml  -  ことなびとは? -  利用規約

©2007 Kotonavi.com