MochiuWiki : SUSE, EC, PCB
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
ツール
リンク元
関連ページの更新状況
特別ページ
ページ情報
We ask for
Donations
検索
個人用ツール
ログイン
Toggle dark mode
名前空間
ページ
議論
表示
閲覧
ソースを閲覧
履歴を表示
情報理論 - 相互情報量のソースを表示
提供: MochiuWiki : SUSE, EC, PCB
←
情報理論 - 相互情報量
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、次のグループのいずれかに属する利用者のみが実行できます:
管理者
、new-group。
このページのソースの閲覧やコピーができます。
== 概要 == 相互情報量 (Mutual Information) は、2つの確率変数間の相互依存性を定量化する指標のことである。<br> <br> 相互情報量I(X;Y)は、2つの確率変数XとY間の依存関係の強さを測る尺度であり、次式で表される。<br> <math>I(X;Y) = \sum \left( p(x, y) \log_{2} \dfrac{p(x,y)}{p(x)p(y)} \right)</math> <br> 上式は、確率変数XとYの同時確率分布p(x,y)と、それぞれの周辺確率分布p(x), p(y)の比の対数を用いて計算される。<br> <br> 相互情報量の性質として、非負性 (I(X;Y)は常に0以上の値を取る) が挙げられる。<br> <math>I(X;Y) = 0</math> となるのは、XとYが統計的に独立である場合のみである。<br> <br> これは、値が大きいほど、2つの変数間の依存関係が強いことを示す。<br> <br> また、相互情報量は対称性を持つため、<math>I(X;Y) = I(Y;X)</math> が成り立つ。<br> これは、XからYへの情報量とYからXへの情報量が等しいことを意味する。<br> <br> 相互情報量は、エントロピーH(X)およびH(Y)、結合エントロピーH(X,Y)を用いて、次式のように表現することも可能である。<br> <math>I(X;Y) = H(X) + H(Y) - H(X,Y)</math> <br> 実際の応用例として、相互情報量は機械学習における特徴選択、信号処理、通信システムの設計、生物情報学におけるデータ解析等、幅広い分野で活用されている。<br> 例えば、特徴選択では、入力特徴量と目的変数との相互情報量を計算することにより、予測に有用な特徴を選択することができる。<br> <br> なお、相互情報量を正規化して0から1の範囲に収めることもできる。 これは、<u>正規化相互情報量 (Normalized Mutual Information)</u> と呼ばれ、異なるスケールのデータ間で比較を行う場合に使用される。<br> <br><br> == 相互情報量の例 == ==== サイコロ ==== 例えば、2つのサイコロを投げる場合、サイコロの出目が完全に独立であれば相互情報量は0となる。<br> 一方、2つのサイコロが何らかの方法で連動している場合 (例: 1つ目のサイコロが偶数の時、2つ目も必ず偶数になる)、相互情報量は正の値となり、その依存関係の強さを反映する。<br> <br> ==== 天気予報 ==== 天気予報の的中率と傘の所持に関する例を考える。<br> <br> * 確率変数Xを"雨が降るか否か" *: X = 1 : 雨 *: X = 0 : 晴れ * 確率変数Yを"傘を持っているか否か" *: Y = 1 : 持っている *: Y = 0 : 持っていない <br> また、以下に示すような同時確率分布があるとする。<br> * <math>p(X = 1, \, Y = 1) = 0.36</math> : 雨が降り、傘を持っている * <math>p(X = 1, \, Y = 0) = 0.04</math> : 雨が降り、傘を持っていない * <math>p(X = 0, \, Y = 1) = 0.14</math> : 晴れで、傘を持っている * <math>p(X = 0, \, Y = 0) = 0.46</math> : 晴れで、傘を持っていない <br> この場合の周辺確率<br> * <math>p(X = 1) = 0.36 + 0.04 = 0.4</math> : 雨が降る確率 * <math>p(X = 0) = 0.14 + 0.46 = 0.6</math> : 晴れの確率 * <math>p(Y = 1) = 0.36 + 0.14 = 0.5</math> : 傘を持っている確率 * <math>p(Y = 0) = 0.04 + 0.46 = 0.5</math> : 傘を持っていない確率 <br> 相互情報量I(X;Y)は、次式のように計算される。<br> <math> \begin{align} I(X;Y) &= \sum \left( p(x,y) \, log_{2} \dfrac{p(x,y)}{p(x)p(y)} \right) \\ &= 0.36 \times log_{2} \dfrac{0.36}{0.4 \times 0.5} \\ &+ 0.04 \times log_{2} \dfrac{0.04}{0.4 \times 0.5} \\ &+ 0.14 \times log_{2} \dfrac{0.14}{0.6 \times 0.5} \\ &+ 0.46 \times log_{2} \dfrac{0.46}{0.6 \times 0.5} \\ &\approx 0.287 \mbox{[bits]} \end{align} </math><br> <br> この値が正であることは、天気予報と傘の所持には相関があることを示している。<br> もし、天気予報を全く気にせずにランダムに傘を持ち歩いていた場合、相互情報量は0に近付く。<br> <br> 逆に、完璧に天気予報に従って傘を持ち歩く場合 (雨の時は必ず傘を持ち、晴れの時は決して持たない)、相互情報量はより大きな値となる。<br> <br> ==== 文字の出現頻度 ==== 日本語において、「ん」の次に来る文字には強い制限がある。<br> (例: 「ん」の次に「な行」の文字は来ない)<br> <br> このような場合、「現在の文字」と「次の文字」という2つの確率変数の間には強い相関があり、相互情報量は高くなる。<br> 一方、ランダムな文字列では、このような相関は存在せず相互情報量は低くなる。<br> <br> このように、相互情報量は2つの確率変数間の依存関係を定量的に評価することができ、データ分析や自然言語処理等、様々な分野で活用されている。<br> <br><br> == 条件付きエントロピー == 相互情報量は未知であることが多いため、相互情報量に関する式は使用できない。<br> <br> 事象Aおよび事象Bを構成する要素の取り得る確率に対するエントロピーの総和が条件付きエントロピーとなる。<br> ここで、<math>\log_{2}</math> の外側の <math>P(a, b)</math> は結合確率、<math>\log_{2}</math> の内側の <math>P(a, b)</math> は条件付き確率を当てはめる。<br> <br> <math>H(A|B) = - \sum_{A} \sum_{B} P(a, b) \log_{2} P(a|b)</math><br> <br> これにより、条件付きエントロピー <math>H(A|B)</math> および 相互情報量 <math>I(A;B)</math> を求めることができる。<br> <br> 例題: サイコロを1回振る時の事象をAとする。 サイコロの目が4以上である事象をBとする。 この時、条件付きエントロピー <math>H(A|B)</math> を求めよ。 解答: 事象Bが4以上かつ事象Aに4が出る確率は、<math>P(a = 4, \, b \ge 4) = \dfrac{1}{6}</math> ※サイコロの1つの目が出る確率は、<math>\dfrac{1}{6}</math> であるため。 事象Bが4以上であることが判明している上で、事象Aに4の出目が出る確率は、<math>P(a = 4 | b \ge 4) = \dfrac{1}{3}</math> 事象Bが4以上かつ事象Aに5, 6が出る確率 および 事象Bが3以下 かつ 事象Aに1, 2, 3が出る確率も上記と同様に考えればよい。 <math>H(A|B) = - \sum_{A} \sum_{B} P(a, b) \log_{2} P(a|b)</math> から <math> \begin{aligned} H(A|B) &= - \sum_{A} \sum_{B} \dfrac{1}{6} \log_{2} \dfrac{1}{3} \\ &= 6 \times \dfrac{1}{6} \log_{2} \dfrac{1}{3} \\ &= \log_{2} 3 \quad \mbox{[bit]} \end{aligned} </math> <br><br> == 相互情報量の関係式 == 下図に、事象Aおよび事象Bの持つエントロピーの相互関係を示す。<br> <br> 事象Aの持つエントロピーと事象Bの持つエントロピーの共通事象部分を相互情報量という。<br> 事象Bが発生していることが分かった上での事象Aのエントロピーを <math>H(A|B)</math> とする時、次式で表すことができる。<br> <br> [[ファイル:Infomation Theorim Mutual Information 1.png|フレームなし|中央]] [[ファイル:Infomation Theorim Mutual Information 2.png|フレームなし|中央]] <br> <math> \begin{array}{lcl} I(A;B) &\ge& 0 \\ I(A;B) &=& H(A) - H(A|B) \\ &=& H(B) - H(B|A) \\ &=& H(A) + H(B) - H(A,B) \end{array} </math> <br><br> {{#seo: |title={{PAGENAME}} : Exploring Electronics and SUSE Linux | MochiuWiki |keywords=MochiuWiki,Mochiu,Wiki,Mochiu Wiki,Electric Circuit,Electric,pcb,Mathematics,AVR,TI,STMicro,AVR,ATmega,MSP430,STM,Arduino,Xilinx,FPGA,Verilog,HDL,PinePhone,Pine Phone,Raspberry,Raspberry Pi,C,C++,C#,Qt,Qml,MFC,Shell,Bash,Zsh,Fish,SUSE,SLE,Suse Enterprise,Suse Linux,openSUSE,open SUSE,Leap,Linux,uCLnux,Podman,電気回路,電子回路,基板,プリント基板 |description={{PAGENAME}} - 電子回路とSUSE Linuxに関する情報 | This page is {{PAGENAME}} in our wiki about electronic circuits and SUSE Linux |image=/resources/assets/MochiuLogo_Single_Blue.png }} __FORCETOC__ [[カテゴリ:情報理論]]
情報理論 - 相互情報量
に戻る。
案内
メインページ
最近の更新
おまかせ表示
MediaWiki についてのヘルプ
ツール
リンク元
関連ページの更新状況
特別ページ
ページ情報
We ask for
Donations
Collapse