Skip to content

京都大学 情報学研究科 知能情報学専攻 2021年8月実施 専門科目 S-3

Author

祭音Myyura

Description

2次元実数空間におけるデータ点 \((x, y)\) が、確率密度関数 \(f(x, y)\) をもつ確率分布に従うとする。 この確率分布は、クラス \(A\)\(B\) に対応する2つの確率分布の混合分布であり、それぞれが以下の確率密度関数をもつ:

\[ f_A(x, y) = \frac{1}{\pi} \exp\left(-\frac{x^2}{a} - ay^2\right), \ f_B(x, y) = \frac{1}{\pi} \exp\left(-(x-2)^2 - (y-3)^2\right). \]

また、クラス \(A\), \(B\) の事前確率(混合重み) \(p_A, p_B\) は、それぞれ

\[ p_A = \frac{1}{1 + \exp(b)}, \quad p_B = 1 - p_A \]

とする。なお、\(a\) は正の実数定数、\(b\) は実数定数とする。

設問1 クラス \(A\) に属することが予め分かっている3つのデータ点 \((1,1), (2,2), (0,1)\) が与えられたときの、\(a\) の最尤推定値を求めよ。

設問2 \(a = 1\) とする。あるデータ点 \((x, y)\) がクラス \(A\)\(B\) のいずれに属するかを、クラスの事後確率の大小を比較することで判定する。データ点 \((x, y)\) がクラス \(A\) に属すると判定する条件を与えよ。

設問3 データ点 \((1,1)\) がクラス \(A\) に属する事後確率が、クラス \(A\) の事前確率と一致する時の \(a\) の値を求めよ。

設問4 \(a = 0.5\) とする。2つのデータ点 \((0,0), (1,2)\) が観測されたときの、\(b\) の最尤推定値を求めよ。なお、\(\exp(-10) \approx 0\) としてよい。

Kai

設問1

We only need to find the value of \(a\) that maximizes the log-joint likelihood function \(L(a)\)

\[ \begin{aligned} L(a) &= \ln \prod_{i=1}^{n}\left\{p_{A}f_{A}(x_{i},y_{i})+p_{B}f_{B}(x_{i},y_{i})\right\}\\ &\propto \ln \prod_{i=1}^{n}f_{A}(x_{i},y_{i}) = -n\ln \pi -\frac{1}{a}\sum_{i=1}^{n}x_{i}^{2}-a\sum_{i=1}^{n}y_{i}^{2}\\ \end{aligned} \]

Then,

\[ \frac{\partial L(a)}{\partial a} = \frac{1}{a^{2}}\sum_{i=1}^{n}x_{i}^{2}-\sum_{i=1}^{n}y_{i}^{2} = 0 \Rightarrow a = \sqrt{\frac{\sum_{i=1}^{n}x_{i}^{2}}{\sum_{i=1}^{n}y_{i}^{2}}} \]

Therefore, the maximum likelihood estimate of \(a\) is

\[ a = \sqrt{\frac{1^{2}+2^{2}+0^{2}}{1^{2}+2^{2}+1^{2}}} = \frac{\sqrt{30}}{6} \]

設問2

Let \(f'_A(x,y)\) and \(f'_B(x,y)\) denote the posterior class probabilities of a data point \((x,y)\) belongs to \(A\) and \(B\), resp. Let \(P(x,y)\) denote the joint probability density function of \(x\) and \(y\). From the Bayes' theorem, we have

\[ \begin{aligned} f'_A(x,y) &= \frac{f_A(x,y)p_A}{P(x,y)}\\ f'_B(x,y) &= \frac{f_B(x,y)p_B}{P(x,y)} \end{aligned} \]

by comparing the posterior class probabilities we have

\[ f_A(x,y) p_A > f_B(x,y) p_b \Rightarrow \frac{1}{\pi(1+e^{b})}e^{-\frac{x^2}{a} - ay^2} >\frac{e^{b}}{\pi(1+e^{b})}e^{-(x-2)^{2}-(y-3)^{2}} \]

by set \(a = 1\) we have

\[ \frac{1}{\pi(1+e^{b})}e^{-x^{2}-y^{2}} >\frac{e^{b}}{\pi(1+e^{b})}e^{-(x-2)^{2}-(y-3)^{2}} \]

which can be simplied to

\[ 6y+2x+b-13 < 0 \]

設問3

Since the prior probability and posterior probability is equal, we have

\[ f'_A(x,y) = \frac{f_A(x,y)p_A}{P(x,y)} = p_A \]

which implies that

\[ f_A(x,y) = P(x, y). \]

Note that \(P(x,y) = p_{A}f_{A}(x,y)+p_{B}f_{B}(x,y)\), hence

\[ (1-p_{A})f_{A}(x,y) = (1-p_{A})f_{B}(x,y) \]

i.e., \(f_A(x,y) = f_B(x,y)\), which implies that

\[ \begin{align} -\frac{x^{2}}{a}-ay^{2} = -(x-2)^{2}-(y-3)^{2} \tag{i} \end{align} \]

solving (i) by substituting \((x,y) = (1,1)\), we have

\[ a= \frac{5\pm \sqrt{21}}{2} \]

設問4

The objective is

\[ \begin{aligned} T(b) &= \ln \prod_{i=1}^{n}f(x_{i},y_{i})\\ &= \ln \prod_{i=1}^{n}\left(p_{A}f_{A}(x_{i},y_{i})+p_{B}f_{B}(x_{i},y_{i})\right)\\ &= \sum_{i=1}^{n} \ln \left(p_{A}f_{A}(x_{i},y_{i})+p_{B}f_{B}(x_{i},y_{i})\right)\\ \end{aligned} \]

by solving the following equations (note that when \(a = 0.5\), we have \(f_{A}(0,0)=1/\pi\), \(f_{A}(1,2)=e^{-4}/\pi\), \(f_{B}(0,0)=e^{-13}/\pi\approx 0\), \(f_{B}(1,2)=e^{-2}/\pi\).)

\[ \begin{aligned} \frac{\partial T(b)}{\partial b} &= \frac{e^{b}}{1+e^{b}}\sum_{i=1}^{n}\frac{-f_{A}(x_{i},y_{i})+f_{B}(x_{i},y_{i})}{f_{A}(x_{i},y_{i})+e^{b}f_{B}(x_{i},y_{i})} = 0 \end{aligned} \]

we have

\[ \frac{-e^{-4}+e^{-2}}{e^{-4}+e^{b-2}} = 1 \Rightarrow b = \ln(e^{2}-2)-2 \]