京都大学 情報学研究科 システム科学専攻 2017年8月実施 専門科目 確率統計
Author
uogxtc, 祭音Myyura
Description
問題1
確率変数 は独立に正規分布に従い、 , , , とする。
ただし、 は平均 、分散 の正規分布を表す。
ここで は正の整数、 は正の定数で既知とし、 は未知パラメータである。このとき以下の設問に答えなさい。
(1) について、 をすべて用いた最尤推定量を求めなさい。
(2) 定数 を用いて と定義する。ただし , である。
の期待値 と分散 を求めなさい。
(3) が の不偏推定量となるために が満たす条件を求めなさい。
また、不偏推定量となる が を最小にするときの の値を求めなさい。
問題2
あるコインを投げると、確率 で表、確率 で裏が出る。
このコインを表が出るまで連続して投げ続ける。
ただし、毎回のコイン投げは独立な試行である。
初めて表が出るまでに投げた回数(表が出た試行を含む)を確率変数 で表す。
以下の設問に答えなさい。
(1) ( ) となる確率 を求めなさい。ただし、 は確率を表す。
(2) 確率変数 の期待値(平均)と分散を求めなさい。
あるスロットマシン(窓は一つとする)を引くと、 種類( )の異なる図柄が等確率で出る。
便宜上、 種類の図柄のそれぞれに の異なる番号を付ける。
このスロットマシンを連続して引くことを考え、 回目( )に引いた際に出た図柄の番号を確率変数 で表す。
ただし、スロットマシンを引く試行は独立である。この時、 種類の図柄のうち異なる図柄が初めて 種類( )になるまでスロットマシンを引いた回数を と表すと、
と再帰的に定義できる。以下の設問に答えなさい。
(3) 確率変数 ( ) として、
とする。
( ) となる確率 を求めなさい。
(4) すべての図柄が初めて出るまでスロットマシンを引いた回数 に対し、その期待値(平均)が以下の式で与えられることを示しなさい。
Kai
問題 1
(1)
The likelihood function is
from which we know that the log-likelihood is:
Set , we will find
The MLE of is obtained in a similar way.
(2)
Similarly,
Then
For variance we have
(3)
When is an unbiased estimate of ,
which is equivalent to
The variance of will be written as
\alpha=\frac{\frac{2a}{b^2}}{2(1+\frac{a^2}{b^2})}=\frac{a}{a^2+b^2},
\beta=\frac{1-\frac{a^2}{a^2+b^2}}b=\frac b{a^2+b^2}.
You can't use 'macro parameter character #' in math mode ### 問題2 (For this question, readers may refer to geometric distribution, 幾何分布.) #### (1)
\begin{aligned}\Pr(T=n)&=\Pr(t_{1}=tail) \times \Pr(t_{2}=tail) \times \cdots \times P(t_{n}=head)\&=q^{n-1}p,\end{aligned}
You can't use 'macro parameter character #' in math mode where $t_i$ is the result of the $i$-th coin toss #### (2)
\mathbb{E}[T]=\sum_{k=1}^n(pk)q^{k-1}=\sum_{k=0}^{n-1}p(k+1)q^k, \tag{i}
q\mathbb{E}[T]=\sum_{k=1}^n(pk)q^k. \tag{ii}
(1-q)\mathbb{E}[T]=p-pn\cdot q^n+\sum_{k=1}^{n-1}p\cdot q^k.
\begin{aligned}
\mathbb{E}[T]&=\left(\frac{pq}{1-q}+p\right)/(1-q)\
&=\frac{p}{(1-q)^{2}}=\frac{1}{p}.
\end{aligned}
\mathbb{E}[T^2]=\sum_{k=1}^\infty k^2q^{k-1}p=\sum_{k=0}^\infty(k+1)^2q^kp.
q\mathbb{E}[T^2]=\sum_{k=1}^\infty k^2q^kp,
\begin{aligned}(1-q)\mathbb{E}[T^{2}]&=p+\sum_{k=1}^{\infty}(2k+1)q^{k}p\
&=\frac{2q}p+\frac{pq}{1-q}+p\
&=\frac{2-p}p,
\end{aligned}
\mathbb{E}[T^2]=\frac{2-p}{p^2},
\mathrm{Var}(T)=\frac{2-p}{p^2}-\frac{1}{p^2}=\frac{1-p}{p^2}.
You can't use 'macro parameter character #' in math mode #### (3) The most tricky part is to understand the question (at least for me the formulation of $T_{m,i}$ is not obvious). A quick explanation: $T_{m,i}$ is the number of trials (slot machine draws) that you have done when the $i$-th unique pattern (図柄) first appears. For example, when you draw for the first time, you definitely get a new pattern. The first pattern comes from one draw, so $T_{m,1}=1.$ Then you do another 3 draws and they are all the same as the 1-st pattern, while the 5-th draw you get a new pattern! Then $T_{m,2}=1+3+1=5.$ And similar procedures will tell you $T_m,3,\ldots,T_{m,m}.$ Then we will notice that $T_{m,i}-T_{m,i-1}$ is exactly the number of your keeping drawing from the already got $(i-1)$ types of patterns, plus one which you draw one new pattern from the $(m-i+1)$ types. Then $U_m,i$ follows a geometric distribution, thus
\Pr(U_{m,i}=k)=\left(\frac{i-1}{m}\right)^{k-1}\left(\frac{m-i+1}{m}\right).
You can't use 'macro parameter character #' in math mode #### (4) We first find $\mathbb{E}[U_m,i]$, which has already been done in 問題2 の (2). i.e.,
\mathbb{E}[U_{m,i}]=\frac{1}{\frac{m-i+1}{m}}=\frac{m}{m-i+1}.
\begin{aligned}
T_{m,m}&=1+U_{m,2}+U_{m,3}+\ldots+U_{m,m}\
\mathbb{E}[T_{m,m}]&=1+\sum_{i=2}^m\mathbb{E}[U_{m,i}]\
&=1+\sum_{i=2}^m\frac m{m-i+1}=1+m\sum_{i=2}^m\frac1{m-i+1}\
&=1+m\sum_{i=2}^m\frac1{m-i+1}=1+m\sum_{j=2}^m\frac1{j-1}.
\end{aligned}