京都大学 情報学研究科 システム科学専攻 2017年8月実施 専門科目 確率統計
Author
uogxtc, 祭音Myyura
Description
問題1
確率変数 \(X_1, \ldots, X_n, Y_1, \ldots, Y_m\) は独立に正規分布に従い、 \(X_i \sim N(a\theta, \sigma^2)\), \(Y_j \sim N(b\theta, \sigma^2)\), \(i = 1, \ldots, n\), \(j = 1, \ldots, m\) とする。 ただし、 \(N(\mu, \sigma^2)\) は平均 \(\mu\)、分散 \(\sigma^2\) の正規分布を表す。 ここで \(n, m\) は正の整数、 \(a, b\) は正の定数で既知とし、 \(\theta, \sigma^2\) は未知パラメータである。このとき以下の設問に答えなさい。
(1) \(\theta, \sigma^2\) について、 \(X_1, \ldots, X_n, Y_1, \ldots, Y_m\) をすべて用いた最尤推定量を求めなさい。
(2) 定数 \(\alpha, \beta\) を用いて \(\tilde{\theta} = \alpha \bar{X} + \beta \bar{Y}\) と定義する。ただし \(\bar{X} = (X_1 + \cdots + X_n)/n\), \(\bar{Y} = (Y_1 + \cdots + Y_m)/m\) である。 \(\tilde{\theta}\) の期待値 \(E(\tilde{\theta})\) と分散 \(V(\tilde{\theta})\) を求めなさい。
(3) \(\tilde{\theta}\) が \(\theta\) の不偏推定量となるために \(\alpha, \beta\) が満たす条件を求めなさい。 また、不偏推定量となる \(\tilde{\theta}\) が \(V(\tilde{\theta})\) を最小にするときの \(\alpha, \beta\) の値を求めなさい。
問題2
あるコインを投げると、確率 \(p \ (0 < p < 1)\) で表、確率 \(q \ (= 1 - p)\) で裏が出る。 このコインを表が出るまで連続して投げ続ける。 ただし、毎回のコイン投げは独立な試行である。 初めて表が出るまでに投げた回数(表が出た試行を含む)を確率変数 \(T\) で表す。 以下の設問に答えなさい。
(1) \(T = n\) (\(n = 1, 2, \ldots\)) となる確率 \(P(T = n)\) を求めなさい。ただし、 \(P(\cdot)\) は確率を表す。
(2) 確率変数 \(T\) の期待値(平均)と分散を求めなさい。
あるスロットマシン(窓は一つとする)を引くと、 \(m\) 種類(\(m = 1, 2, \ldots\))の異なる図柄が等確率で出る。 便宜上、 \(m\) 種類の図柄のそれぞれに \(\{1, 2, \ldots, m\}\) の異なる番号を付ける。 このスロットマシンを連続して引くことを考え、 \(n\) 回目(\(n = 1, 2, \ldots\))に引いた際に出た図柄の番号を確率変数 \(X_n\) \(\in \{1, 2, \ldots, m\}\) で表す。 ただし、スロットマシンを引く試行は独立である。この時、 \(m\) 種類の図柄のうち異なる図柄が初めて \(i\) 種類(\(i = 1, 2, \ldots, m\))になるまでスロットマシンを引いた回数を \(T_{m,i}\) と表すと、
と再帰的に定義できる。以下の設問に答えなさい。
(3) 確率変数 \(U_{m,i}\) (\(i = 2, \ldots, m\)) として、
とする。 \(U_{m,i} = k\) (\(k = 1, 2, \ldots\)) となる確率 \(P(U_{m,i} = k)\) を求めなさい。
(4) すべての図柄が初めて出るまでスロットマシンを引いた回数 \(T_{m,m}\) に対し、その期待値(平均)が以下の式で与えられることを示しなさい。
Kai
問題 1
(1)
The likelihood function is
from which we know that the log-likelihood is:
Set \(\frac{\partial\log L}{\partial\sigma}=0\) , we will find
The MLE of \(\theta\) is obtained in a similar way.
(2)
Similarly,
Then
For variance we have
(3)
When \(\tilde{\theta}\) is an unbiased estimate of \(\theta\),
which is equivalent to
The variance of \(\tilde{\theta}\) will be written as
The minima of \(\text{Var}(\tilde{\theta})\) is at
and
問題2
(For this question, readers may refer to geometric distribution, 幾何分布.)
(1)
where \(t_i\) is the result of the \(i\)-th coin toss
(2)
This is a commonly seen series. We consider
Eq. (i) subtracted by Eq. (ii) is
Then
Now consider the second moment.
Thus
and
(3)
The most tricky part is to understand the question (at least for me the formulation of \(T_{m,i}\) is not obvious). A quick explanation: \(T_{m,i}\) is the number of trials (slot machine draws) that you have done when the \(i\)-th unique pattern (図柄) first appears. For example, when you draw for the first time, you definitely get a new pattern. The first pattern comes from one draw, so \(T_{m,1}=1.\) Then you do another 3 draws and they are all the same as the 1-st pattern, while the 5-th draw you get a new pattern! Then \(T_{m,2}=1+3+1=5.\) And similar procedures will tell you \(T_m,3,\ldots,T_{m,m}.\)
Then we will notice that \(T_{m,i}-T_{m,i-1}\) is exactly the number of your keeping drawing from the already got \((i-1)\) types of patterns, plus one which you draw one new pattern from the \((m-i+1)\) types.
Then \(U_m,i\) follows a geometric distribution, thus
(4)
We first find \(\mathbb{E}[U_m,i]\), which has already been done in 問題2 の (2).
i.e.,
Therefore,