便利なキーワード検索サイト ことなびトップページへ
デル株式会社







ことなびTOP  サイトマップ  ことなびとは?



便利!NINJA TOOLS
→FC2検索 用語 Wikipedia YouTube

情報量 とは?

 ページ内リンク   ↓ウィキペディア(Wikipedia)記事  ↓Yahoo!知恵袋

情報量(じょうほうりょう、エントロピーとも)は、情報理論の概念で、あるできごと(事象)が起きた際、それがどれほど起こりにくいかを表す尺度である。頻繁に起こるできごと(たとえば「犬が人を噛む」)が起こったことを知ってもそれはたいした「情報」にはならないが、逆に滅多に起こらないできごと(たとえば「人が犬を噛む」)が起これば、それはより多くの「情報」を含んでいると考えられる。情報量はそのできごとがどれだけの情報をもっているかの尺度であるともみなすことができる。

出典: 『ウィキペディア(Wikipedia)』


情報量はてなダイアリーを別ウィンドウで表示  :  起こりにくさ。情報理論で言う選択情報量。 ある事象が確率 P で起こるとしよう。 「この事象が実際に起こった」という知らせは、 - log P [ビット](または[シャノン]) だけの情報量を持つ。 従って、「どこにでもありそうな話」というのは P が 1 に近いため、持っている情報量は 0 に近づく。 参考→エントロピー リスト::数学関連

出典: 『はてなダイアリー』


和英辞典

情報量 [じょうほうりょう] 別ウィンドウで表示  …  (n) information content information volume

ノースウエスト航空 のマイルは、国内航空会社のマイレージと違って無期限!! 格安パックツアーでも
100%マイルが付くのでお得!! 国内往復分15000マイルを貯めて沖縄や北海道へ!!


関連商品

本  情報量統計学 (情報科学講座 (A・5・4))別ウィンドウで表示

坂元 慶行 /  最安値(新品): ¥ 4,305 
↓のレビューにある通り、かなり分かりやすい。 具体例も豊富である。 数理統計学の本で、歩きながらでも理解できる本に 初めて出会った。  (primavera76th さんのレビュー)

本  赤池情報量規準AIC―モデリング・予測・知識発見別ウィンドウで表示

樺島祥介 /  最安値(新品): ¥ 2,625 

本  情報量規準 (シリーズ・予測と発見の科学)別ウィンドウで表示

小西 貞則 /  最安値(新品): ¥ 3,780  最安値(中古): ¥ 3,350 




ウィキペディア(Wikipedia)記事


情報量(じょうほうりょう、エントロピーとも)は、情報理論の概念で、あるできごと(事象)が起きた際、それがどれほど起こりにくいかを表す尺度である。頻繁に起こるできごと(たとえば「犬が人を噛む」)が起こったことを知ってもそれはたいした「情報」にはならないが、逆に滅多に起こらないできごと(たとえば「人が犬を噛む」)が起これば、それはより多くの「情報」を含んでいると考えられる。情報量はそのできごとがどれだけの情報をもっているかの尺度であるともみなすことができる。

なおここでいう「情報」とは、あくまでそのできごとの起こりにくさ(確率)だけによって決まる純粋に数学的な量のことであり、それが個人・社会にとってどれだけ意義のあるものかとは無関係である。たとえば「自分が宝くじに当たった」事象と「見知らぬAさんが宝くじに当たった」事象は、前者の方が有意義な情報に見えるが、両者の情報量は全く同じである(宝くじが当たる確率は所与条件一定のもとでは誰でも同じであるから)。

目次

選択情報量(自己エントロピー)と平均情報量(エントロピー)

それぞれのできごとの情報量だけでなく、それらのできごとの情報量の平均値をも情報量と呼ぶ。両者を区別する場合には、前者を選択情報量自己エントロピーとも)、後者を平均情報量エントロピーとも)と呼ぶ。

選択情報量

事象Eが起こる確率P(E)とするとき、 事象 E が起こったことを知らされたとき受け取る(選択)情報量I(E)

I(E)=\log \frac{1}{P(E)}=-\log P(E)

と定義する。

起こりにくい事象(=生起確率が低い事象)の情報量ほど、値が大きい。

上式中の対数 (log) のとして何を選んでも、情報量の値が定数倍変わるだけなので、本質的な差はないものの、底としては2を選ぶことが多い。

底が2の場合、1 / 2nの確率で起こる事象の情報量nである。

直観的意味

整数uに対し、uの対数logmum進法でのuの桁数にほぼ等しい値を表す。したがって、確率1 / uで起こる事象の情報量は、ほぼuの桁数になる。

情報量の加法性

AとBが独立な事象のとき、「AもBも起こる」という事象の情報量は、Aの情報量とBの情報量の和である。

情報量には加法性がある。例えば、52枚のトランプから無作為に1枚を取り出すという試行を考える。「取り出したカードはハートの4である」という事象の情報量は、前述の定義からlog52 であると分かる。ここで、「取り出したカードのスートはハートである」という事象と「取り出したカードの数字は4である」という事象の二つを考えると、前者の情報量はlog4、後者はlog13 である。この両者の和はlog4 + log13 = log(4×13) = log52 となり、「取り出したカードはハートの4である」という事象の情報量と等しい。これは直感的要請に合致する。

平均情報量(エントロピー)

Ωを、台が有限集合である確率空間とする。Ω上の確率分布 Pが与えられたとき、各事象A\in\Omegaの選択情報量 − logP(A)の期待値

H(P) = - \sum_{A\in\Omega} P(A) \log P(A)

Pエントロピーと呼ぶ(平均情報量シャノン情報量情報論のエントロピーとも)。

ただし、ここでP(A)=0のときは、P(A)logP(A) = 0とみなす。これは\lim_{p\to+0}p \log p=0であることによる。

また有限集合U上の値を取る確率変数Xが確率分布Pに従う場合には、XエントロピーをH(X)=H(P)によって定める。すなわち、

H(X) = - \sum_{x\in U} \Pr(X=x) \log \Pr(X=x)

エントロピーは常に非負の値(または無限大)を取る。

xyがそれぞれ確率変数XYに従う場合には、組(x,y)も確率変数とみなせる。この確率変数を(X,Y)と書くことにすると、確率変数(X,Y)のエントロピーは

H(X,Y) = - \sum_{x,y} \Pr(X=x,Y=y) \log \Pr(X=x,Y=y)

になる。これを結合エントロピーと呼ぶ。

X,Yが互いに独立な確率変数である場合には、H(X,Y)H(X) + H(Y)に一致する。すなわち、全体の情報量H(X,Y)は、それぞれの確率変数の情報量の和である。

しかし、XYが互いに独立ではない場合は、H(X,Y)H(X) + H(Y)は一致せず、前者より後者の方が大きい値になる。両者の情報量の差を相互情報量と呼び、

I(X,Y) = H(X) + H(Y) − H(X,Y)

で表す。相互情報量は常に非負の値になる。

事象Bが生じているという条件下における事象Aの条件付き情報量-\log\Pr(A|B)によって定める。確率変数Xが与えられたとき、事象「X = x」の条件付き情報量-\log \Pr(X=x|B)xに関する平均値を条件付きエントロピーといい、

H(X|B) = - \sum_{x}\Pr(X=x|B) \log \Pr(X=x|B)

で表す。

さらに確率変数Yが与えられたとき、事象「Y = y」が生じているという条件下における事象「X = x」の条件付きエントロピーH(X | Y = y)yに関する平均値

H(X|Y) = \sum_{y} \Pr(Y=y) H(X|Y=y)

もやはり条件付きエントロピーと呼ぶ。

エントロピーの基本的性質

  1. 情報量は確率だけによって決まる。
  2. 情報量は非負の値または無限大を取る。
  3. nビットのビット列の空間(情報源)から(一様ランダムとは限らない方法で)ランダムにビット列を選んだときのエントロピーは、n以下になる。エントロピーがnになる必要十分条件は、ビット列が一様ランダムに選ばれることである。
  4. 確率変数XとYが独立である必要十分条件は、H(X) + H(Y) = H(X,Y)が成立することである。

コイン投げの例

あるコインを投げたときに表が出る確率を p、裏が出る確率を 1 - p とする。このコインを投げたときに得られる平均情報量(エントロピー)は、

\left. H(X)= - p \log{p} - (1-p)\log{(1-p)} \right.

である。

この関数f(p) = − plogp − (1 − p)log(1 − p)エントロピー関数と呼ぶ。

画像:entropy_coin.png

図を見ると分かるように、p = 0p = 1 では H はゼロである。つまり、コインを投げる前から裏または表が出ることが確実に分かっているときに得られる平均情報量は、ゼロである。H が最大になるのは p = 1 / 2 のときであり、一般にすべての事象(できごと)が等確率になるときにエントロピーが最大になる。

連続系のエントロピー

実数値を取る確率変数Xの確率密度関数をp(x)とするとき、Xのエントロピーを

h(X) = - \int_{-\infty}^{\infty}p(x)\log p(x) dx

によって定義する。

Xが有限集合に値を取る確率変数である場合には、Xのシャノン情報量H(X)も定義できる。Xがn通りの値を取るとき、H(X)h(X)は、

h(X) = H(Un) − H(X)

を満たす。

ただし、ここでUnn元集合上の一様分布とする(すなわちH(Un) = logn)。

Renyiエントロピー

Ωを、台が有限集合である確率空間とする。PΩ上の確率分布とし、αを非負の実数とする。

\alpha\neq 1のとき、PのdegeeαRenyiエントロピー

H_{\alpha}(P)=\frac{\log(\sum_{A\in\Omega}P(A)^{\alpha})}{1-\alpha}

によって定義する。 また、\alpha=1,\inftyの場合には、Renyiエントロピーを

\left\{ \begin{array}{lll} H_1(P) &= \lim_{\alpha\to 1}&H_{\alpha}(P)\\  H_{\infty}(P) &= \lim_{\alpha\to\infty}&H_{\alpha}(P) \end{array} \right.

によって定義する。

単にRenyiエントロピーと言った場合はH2(P)を意味することも多い。

さらに、確率変数Xが確率分布Pに従うとき、Hα(X)Hα(X) = Hα(P)によって定義する。

Renyiエントロピーは以下の性質を満たす:

  • H_0(P) = \log\#\Omega が成立する。
  • H1(P) はシャノン情報量 H(P) = -\sum_{A\in\Omega} P(A)\log P(A) と一致する。
  • α が2以上の整数の場合には、 H_{\alpha}(P) = \frac{1}{1-\alpha} \log\Pr(X_1=\cdots=X_\alpha) が成立する。ここで、 X_1,\ldots,X_\alpha は確率分布 P に従う独立同一分布であって、 \Pr(X_1=\cdots=X_\alpha)x_1,\ldots,x_\alpha をそれぞれX_1,\ldots,X_\alpha に従って選んだときにx_1=\cdots=x_\alpha が成立する確率とする。
  • H_{\infty}(P)=\min_{A\in\Omega}\{-\log P(A)\} が成立する。この H_{\infty}(P)minエントロピーともいう。

歴史

「エントロピー」の概念は1865年ルドルフ・クラウジウスがギリシャ語の「変換」を意味する言葉を語源として、熱力学における気体のある状態量として導入した。これは統計力学では微視的な状態数の対数に比例する量として表される。1929年にはレオ・シラードが、気体についての情報を観測者が獲得することと統計力学におけるエントロピーとの間に直接の関係があることを示し、現在 1 ビット(1 シャノン)と呼ぶ量が統計力学で k ln 2 に対応するという関係を導いていた[1]

現在の情報理論におけるエントロピーの直接の導入は1948年クロード・シャノンによるもので、その著書『通信の数学的理論』でエントロピーの概念を情報理論に応用した[2]。シャノン自身は統計力学でこの概念と関連する概念がすでに使われていることを知らずにこの定義に到達したが、その名称を考えていたとき同僚フォン・ノイマン(数学)が、統計力学のエントロピーに似ていることを指摘し「統計エントロピーが何なのかを理解してる人は少ないから議論になったときに君が有利であろう」と語ったことを受けて、シャノンはエントロピーと名付けた[3]

なお、シャノン以前にもラルフ・ハートレー1928年に、集合Aに対して\log \# Aという量を考察している(“\#A”はA元数)。\log \# AA上の一様分布のエントロピーに一致する。 現在では、\log \# AAハートレー・エントロピーと呼ぶ。

単位

情報量は本来無次元の量である。しかし、対数の底として何を用いたかによって値が異なるので,単位を付けて区別している。前述のように、情報量は確率の逆数の桁数の期待値なので、単位も桁数のそれを流用する。この為、対数の底として2、e、10を選んだときの情報量の単位は、それぞれビット(bit)、ナット(nat)、ディット(dit)である。

また、今のところ主流ではないものの、1997年日本工業規格 JIS X 0016:1997(これは国際規格 ISO/IEC 2382-16:1996と一致している)は、これらの量を表す単位を別に定めている(ノートも参照)。

対数の底と単位
通常の単位 JISおよびISOが定めた単位 備考
2 ビット (bit) シャノン (shannon) lg
e=2.718… ナット (nat) ナット (nat) ln, 自然対数
10 ディット (dit) ハートレー (hartley) log, 常用対数

単位「シャノン」、「ハートレー」の名称は、それぞれ情報量の概念を提案したクロード・シャノンラルフ・ハートレーにちなむ。

脚注

[ヘルプ]
  1. ^ Szilard, L. (1929) "Über die Entropieverminderung in einem Thermodynamischen System bei Eingriffen Intelligenter Wesen", Zeitschrift für Physik 53:840–856
  2. ^ H・J・モロウィッツ『ピザの熱力学』
  3. ^ 韓太舜、小林欣吾『情報と符号の数理』

関連項目


ウィキペディア All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの記事を複製、改変、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。ことなびに掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。



Yahoo!知恵袋


  • サンプリング周波数の話別ウィンドウで表示

    サンプリング周波数の話サンプリング周波数が1/53000秒のものがある。量子化されたものが16ビットだとすると、音楽を30秒間再生したときの情報量を求めよ……というのが情報のテストで出ました。結局答えられませんでしたが…どなたか答えを教えていただけませんか?;;
    解決日時:Thu, 04 Dec 2008 21:38:22 +0900 /  回答数:1 /  スコア:58,040点
  • 昔の映像も、地デジで見るのとアナログで見るのに画質の差はあるのですか?別ウィンドウで表示

    昔の映像も、地デジで見るのとアナログで見るのに画質の差はあるのですか?
    解決日時:Wed, 03 Dec 2008 23:50:23 +0900 /  回答数:2 /  スコア:39,503点
  • 携帯の料金で、ダウンロードする際の通信料と情報量とはそれぞれどう言う料金の事....別ウィンドウで表示

    携帯の料金で、ダウンロードする際の通信料と情報量とはそれぞれどう言う料金の事でしょうか??
    解決日時:Wed, 03 Dec 2008 20:14:03 +0900 /  回答数:2 /  スコア:86,172点
  • この間、デスクトップのパソコンのメモリ増設を行いました。最初に付いていたメモ....別ウィンドウで表示

    この間、デスクトップのパソコンのメモリ増設を行いました。最初に付いていたメモリは128MB×2でスロットの開きが2つあったので1G×2を増設しました。そして、増設したあとシステム情報で見たら、合計物理メモリの欄は2.304.50MBになっているのに、システムプロパティの全般タブの下のメモリ数をみると248MB RAMとなっていました。何故増えていないのでしょうか?仮想メモリの推奨と現在の割り当ては370MBになっています。増設したことによって設定は必要なのでしょうか?誰か詳しく教えて下さい。OSは、Windows XP SP2です。足りないことがあったら教えて下さい。
    解決日時:Wed, 03 Dec 2008 20:50:35 +0900 /  回答数:3 /  スコア:18,700点
  • 次の交差点はラジオの交通情報でよく渋滞している箇所として放送されますがなぜで....別ウィンドウで表示

    次の交差点はラジオの交通情報でよく渋滞している箇所として放送されますがなぜでしょうか?それぞれの地域にお住まいの方、その箇所を車やバイクでお通りの方がいらっしゃいましたら教えてください。因みに次の箇所は私は行ったことがありません。①神奈川県横浜市戸塚区原宿交差点②神奈川県箱根町湯本交差点③千葉県船橋市中山競馬場入口交差点
    解決日時:Thu, 04 Dec 2008 16:49:56 +0900 /  回答数:1 /  スコア:27,998点
  • 人が死ぬ前にそこにいないはずの人が見えるのでしょうか?「嫌われ松子の一生」で....別ウィンドウで表示

    人が死ぬ前にそこにいないはずの人が見えるのでしょうか?「嫌われ松子の一生」では松子の妹が死ぬ前に「おかえり、お姉ちゃん」と言ってまた松子が死ぬ時には松子に妹が見えたのはー死ぬ前に妹は未来の姉の死に際に会いに行ったのでしょうか?
    解決日時:Wed, 03 Dec 2008 22:41:00 +0900 /  回答数:5 /  スコア:9,608点



「情報量」 検索数の推移 (過去1ヶ月間)

powered by  goo ( NTT Resonant Inc. )


  ↓ニュース  ↓YouTube  ↓テレビ番組  ↓はてブ  ↓ヤフオク
  ↓このページへのリンク

ニュース記事

powered by  Google+ Yahoo!

●常識的な考え方だと、「情報量は少ないほうが勉強は楽」と思われていますが、それは私の実感とは違います。 確かに、無意味な情報をただ丸暗記するなら情報量は少ない方が楽でしょう。 しかし、 意味のある情報の場合、その「意味」を構成する最低限の情報量は必要. なのです。 ...別ウィンドウで表示   (2008年11月28日)

●... 調査会社の米IDCが、電子メールや文書、写真や動画などのデジタル情報量の規模について、米EMCの依頼で調査報告書をまとめた。 ... 情報量は161エクサバイト(1610億Gバイト)に上った。 この量は、これまでに書かれた書籍の情報量 ...別ウィンドウで表示   (2008年11月27日)

●専門知識を教えてみよう: 第16回 情報量は少ない方が考えやすい (1/4) ウィスキーの水割りを作ろうとしてマドラーを探していると、家族の1人が「はい、マドラー」と割り箸を差し出しました。 ... 情報量は少ない方が考えやすい. 1|2|3|4 ...別ウィンドウで表示   (2008年11月26日)

●第16回 情報量は少ない方が考えやすい (2/4) ... 情報量を減らすべきである. となります。 ... Pを削ってXYZだけにしてしまうとバラバラになって相互の関連が分からなくなり、かえって「覚えにくく」なるというのが「情報量は多い方が覚えやすい」ということです。 ...別ウィンドウで表示   ()

●0 0 0 0 0 0 0 0 0 0 0 ... 2006年から2011年の5年間で、世界のデジタル情報量は10倍になる見通し。 ... 世界のデジタル情報量、4年後には6倍に――米予測. 関連リンク. プレスリリース [ITmedia] ...別ウィンドウで表示   (2008年11月23日)

情報量が爆発的に増大し続ける現在、膨大な情報の海を航海し、新たな価値を創出していくための情報基盤はどうあるべきなのか。 経済産業省は、情報検索・解析などの知的情報アクセス分野の技術研究開発を促進する「情報大航海プロジェクト」 ...別ウィンドウで表示   (2008年4月18日)

YouTube

powered by YouTube


※.クリックすると動画が再生されます。

テレビ番組サーチ

powered by Yahoo!TV

 PageRank5以上の相互リンク
 ・相互リンクスクエア  (PageRank 5)
 ・相互リンク相互リンク アクセスランキング インプロス  (PageRank 5)
 →便利!NINJA TOOLS
 →FC2検索  用語  Wikipedia  YouTube


スポンサー

powered by  コンテンツマッチ広告のブレイナー


Yahooオークション

powered by Yahoo!

 








デル株式会社 ThinkPad アウトレット Apple Store(Japan) PCDEPOT WEB本店/OZZIO Sony Style(ソニースタイル) シマンテックダウンロードストア マカフィー・ストア

ことなびTOP -  サイトマップ sitemap.xml  -  ことなびとは? -  利用規約

©2007 Kotonavi.com