情報量 とは?ページ内リンク ↓ウィキペディア(Wikipedia)記事 ↓Yahoo!知恵袋情報量(じょうほうりょう、エントロピーとも)は、情報理論の概念で、あるできごと(事象)が起きた際、それがどれほど起こりにくいかを表す尺度である。頻繁に起こるできごと(たとえば「犬が人を噛む」)が起こったことを知ってもそれはたいした「情報」にはならないが、逆に滅多に起こらないできごと(たとえば「人が犬を噛む」)が起これば、それはより多くの「情報」を含んでいると考えられる。情報量はそのできごとがどれだけの情報をもっているかの尺度であるともみなすことができる。 出典: 『ウィキペディア(Wikipedia)』 情報量 出典: 『はてなダイアリー』 関連商品
坂元 慶行 /
最安値(新品): ¥ 4,305
|
目次 |
それぞれのできごとの情報量だけでなく、それらのできごとの情報量の平均値をも情報量と呼ぶ。両者を区別する場合には、前者を選択情報量(自己エントロピーとも)、後者を平均情報量(エントロピーとも)と呼ぶ。
事象Eが起こる確率をP(E)とするとき、 事象 E が起こったことを知らされたとき受け取る(選択)情報量I(E) を

と定義する。
起こりにくい事象(=生起確率が低い事象)の情報量ほど、値が大きい。
上式中の対数 (log) の底として何を選んでも、情報量の値が定数倍変わるだけなので、本質的な差はないものの、底としては2を選ぶことが多い。
底が2の場合、1 / 2nの確率で起こる事象の情報量はnである。
整数uに対し、uの対数logmuはm進法でのuの桁数にほぼ等しい値を表す。したがって、確率1 / uで起こる事象の情報量は、ほぼuの桁数になる。
AとBが独立な事象のとき、「AもBも起こる」という事象の情報量は、Aの情報量とBの情報量の和である。
情報量には加法性がある。例えば、52枚のトランプから無作為に1枚を取り出すという試行を考える。「取り出したカードはハートの4である」という事象の情報量は、前述の定義からlog52 であると分かる。ここで、「取り出したカードのスートはハートである」という事象と「取り出したカードの数字は4である」という事象の二つを考えると、前者の情報量はlog4、後者はlog13 である。この両者の和はlog4 + log13 = log(4×13) = log52 となり、「取り出したカードはハートの4である」という事象の情報量と等しい。これは直感的要請に合致する。
Ωを、台が有限集合である確率空間とする。Ω上の確率分布 Pが与えられたとき、各事象
の選択情報量 − logP(A)の期待値

をPのエントロピーと呼ぶ(平均情報量、シャノン情報量、情報論のエントロピーとも)。
ただし、ここでP(A)=0のときは、P(A)logP(A) = 0とみなす。これは
であることによる。
また有限集合U上の値を取る確率変数Xが確率分布Pに従う場合には、XのエントロピーをH(X)=H(P)によって定める。すなわち、
。エントロピーは常に非負の値(または無限大)を取る。
値x、yがそれぞれ確率変数X、Yに従う場合には、組(x,y)も確率変数とみなせる。この確率変数を(X,Y)と書くことにすると、確率変数(X,Y)のエントロピーは

になる。これを結合エントロピーと呼ぶ。
X,Yが互いに独立な確率変数である場合には、H(X,Y)はH(X) + H(Y)に一致する。すなわち、全体の情報量H(X,Y)は、それぞれの確率変数の情報量の和である。
しかし、XとYが互いに独立ではない場合は、H(X,Y)とH(X) + H(Y)は一致せず、前者より後者の方が大きい値になる。両者の情報量の差を相互情報量と呼び、
で表す。相互情報量は常に非負の値になる。
事象Bが生じているという条件下における事象Aの条件付き情報量を
によって定める。確率変数Xが与えられたとき、事象「X = x」の条件付き情報量
のxに関する平均値を条件付きエントロピーといい、

で表す。
さらに確率変数Yが与えられたとき、事象「Y = y」が生じているという条件下における事象「X = x」の条件付きエントロピーH(X | Y = y)のyに関する平均値

もやはり条件付きエントロピーと呼ぶ。
あるコインを投げたときに表が出る確率を p、裏が出る確率を 1 - p とする。このコインを投げたときに得られる平均情報量(エントロピー)は、

である。
この関数f(p) = − plogp − (1 − p)log(1 − p)をエントロピー関数と呼ぶ。
図を見ると分かるように、p = 0 と p = 1 では H はゼロである。つまり、コインを投げる前から裏または表が出ることが確実に分かっているときに得られる平均情報量は、ゼロである。H が最大になるのは p = 1 / 2 のときであり、一般にすべての事象(できごと)が等確率になるときにエントロピーが最大になる。
実数値を取る確率変数Xの確率密度関数をp(x)とするとき、Xのエントロピーを

によって定義する。
Xが有限集合に値を取る確率変数である場合には、Xのシャノン情報量H(X)も定義できる。Xがn通りの値を取るとき、H(X)とh(X)は、
を満たす。
ただし、ここでUnはn元集合上の一様分布とする(すなわちH(Un) = logn)。
Ωを、台が有限集合である確率空間とする。PをΩ上の確率分布とし、αを非負の実数とする。
のとき、PのdegeeαのRenyiエントロピーを

によって定義する。 また、
の場合には、Renyiエントロピーを

によって定義する。
単にRenyiエントロピーと言った場合はH2(P)を意味することも多い。
さらに、確率変数Xが確率分布Pに従うとき、Hα(X)をHα(X) = Hα(P)によって定義する。
Renyiエントロピーは以下の性質を満たす:
が成立する。
と一致する。
が成立する。ここで、
は確率分布 P に従う独立同一分布であって、
は
をそれぞれ
に従って選んだときに
が成立する確率とする。
が成立する。この
をminエントロピーともいう。「エントロピー」の概念は1865年にルドルフ・クラウジウスがギリシャ語の「変換」を意味する言葉を語源として、熱力学における気体のある状態量として導入した。これは統計力学では微視的な状態数の対数に比例する量として表される。1929年にはレオ・シラードが、気体についての情報を観測者が獲得することと統計力学におけるエントロピーとの間に直接の関係があることを示し、現在 1 ビット(1 シャノン)と呼ぶ量が統計力学で k ln 2 に対応するという関係を導いていた[1]。
現在の情報理論におけるエントロピーの直接の導入は1948年のクロード・シャノンによるもので、その著書『通信の数学的理論』でエントロピーの概念を情報理論に応用した[2]。シャノン自身は統計力学でこの概念と関連する概念がすでに使われていることを知らずにこの定義に到達したが、その名称を考えていたとき同僚フォン・ノイマン(数学)が、統計力学のエントロピーに似ていることを指摘し「統計エントロピーが何なのかを理解してる人は少ないから議論になったときに君が有利であろう」と語ったことを受けて、シャノンはエントロピーと名付けた[3]。
なお、シャノン以前にもラルフ・ハートレーが1928年に、集合Aに対して
という量を考察している(“
”はAの元数)。
はA上の一様分布のエントロピーに一致する。 現在では、
をAのハートレー・エントロピーと呼ぶ。
情報量は本来無次元の量である。しかし、対数の底として何を用いたかによって値が異なるので,単位を付けて区別している。前述のように、情報量は確率の逆数の桁数の期待値なので、単位も桁数のそれを流用する。この為、対数の底として2、e、10を選んだときの情報量の単位は、それぞれビット(bit)、ナット(nat)、ディット(dit)である。
また、今のところ主流ではないものの、1997年に日本工業規格 JIS X 0016:1997(これは国際規格 ISO/IEC 2382-16:1996と一致している)は、これらの量を表す単位を別に定めている(ノートも参照)。
| 底 | 通常の単位 | JISおよびISOが定めた単位 | 備考 |
|---|---|---|---|
| 2 | ビット (bit) | シャノン (shannon) | lg |
| e=2.718… | ナット (nat) | ナット (nat) | ln, 自然対数 |
| 10 | ディット (dit) | ハートレー (hartley) | log, 常用対数 |
単位「シャノン」、「ハートレー」の名称は、それぞれ情報量の概念を提案したクロード・シャノン、ラルフ・ハートレーにちなむ。
PageRank5以上の相互リンク
・相互リンクスクエア
(PageRank 5)
・相互リンク インプロス
(PageRank 5)
→便利!NINJA TOOLS
→FC2検索
用語
Wikipedia
YouTube
![]() |
![]() |
![]() |
![]() |
![]() |
|
![]() |
![]() |