東京大学情報理工学研究科数理情報学 2022年8月実施第5問

Author

hari64boli64

Description

自然数（正の整数）に対して、

を満たす整数の列をの三値表現と呼ぶ。また、の三値表現で、の範囲の各整数に対して、

が成立するものをの疎な三値表現と呼ぶ。以下の設問に答えよ。

(1) 自然数に対し、疎な三値表現で表現可能な自然数の最大値を求めよ。

(2) 任意の自然数に対し、の疎な三値表現は一意的に定まることを示せ。

(3) 自然数の二進表現を疎な三値表現へ変換する時間アルゴリズムを設計せよ。

(4) 整数の列に対して、零でない整数の個数をと表す。自然数の疎な三値表現と任意の三値表現に対し、

が成り立つことを示せ。

(5) 自然数に対し、を集合上の離散一様分布に従う確率変数とする。の疎な三値表現を用いて、確率変数で定める。このとき、

が成り立つことを示せ。ただし、は自然数全体の集合、はの期待値とする。

Kai

平衡三進法と呼ばれる有名な記法が元ネタ？

(1)

貪欲に 1 を割り当てていくのが最善。が答え。

が 奇 数 が 偶 数

(2)

存在性は (3) より言えるので、一意性のみ言えばよい。相異なる疎な表現とが存在したとする。これらの内、相異なる添え字の内、最小のものを考える。

の内、片方がの場合、この桁においてのズレが生じるが、これ以降の桁において生成できるズレは、の倍数のみ。よって、とで表す数が異なり矛盾。

が、共にかの場合、この桁においてのズレが生じるが、これ以降の桁において生成できるズレは、疎性に注意すると、の倍数のみ。よって、とで表す数が異なり矛盾。

以上より、示された。

(3)

下位のビットから見ていって、二進数のをに変換していくのが主な方針である。詳細は以下。計算量は自明にである。

油断した実装だと、十進法における (二進表現で ) が三進表現でになって、疎でなくなるので注意(一敗)。正しくは、である。実装では、右から左でなく、左から右の向きに記しているので注意。

なお、Slack 上では、上位のビットから貪欲に見ていくという方針もあった。コード 1 において、anotherSolution という関数で実装している。尤も、二進表現を疎な三進表現に変換せよという問題だったので、あまり想定解ではないかも知れない。

コード 1

import math
from collections import defaultdict

from numba import jit
from tqdm import tqdm


@jit(cache=True)
def toSparseTernaryRepresentation(S: str):
    ret = ""
    i = 0
    while i < len(S):
        if S[i] == "0":
            ret += "0,"
            i += 1
        elif S[i] == "1":
            cnt = 0
            while i < len(S) and S[i] == "1":
                cnt += 1
                i += 1
            if cnt == 1:
                ret += "1,"
            else:
                ret += "-1," + "0," * (cnt - 1)
                # originally, the following
                # must be inplace operation
                # for the sake of efficiency
                S = S[:i] + "1" + S[i + 1 :]
    return ret[:-1]


def anotherSolution(n: int):
    def L(i):
        if i <= 0:
            return 0
        if i % 2 == 1:
            return (2 ** (i + 1) - 1) // 3
        else:
            return 2 * (2**i - 1) // 3

    d = []
    for i in range(math.ceil(math.log2(n)) + 3)[::-1]:
        if abs(n - (2**i)) <= L(i - 1):
            n -= 2**i
            d.append(1)
        elif abs(n + (2**i)) <= L(i - 1):
            n += 2**i
            d.append(-1)
        else:
            d.append(0)

    d = d[::-1]
    while d[-1] == 0:
        d.pop()
    return ",".join(map(str, d))


def problem5():
    maxN = 16
    zeroCnt = 0
    cntPer3 = defaultdict(int)
    for n in tqdm(range(1, (1 << maxN) + 1)):
        S = bin(n)[2:][::-1]
        T = toSparseTernaryRepresentation(S)
        S += "0" * (maxN - len(S))
        listT = list(map(int, T.split(",")))
        listT += [0] * (maxN - len(listT))
        if listT[maxN // 2] == 0:
            zeroCnt += 1
            cntPer3[tuple(S[maxN // 2 - 1 : maxN // 2 + 2][::-1])] += 1
    print(f"result: {zeroCnt/(1<<maxN)}")
    print(f"cntPer3: {sorted(cntPer3.items())}")


def main():
    maxIntPerDigit = defaultdict(int)
    for n in range(1, 1000 + 1):
        S = bin(n)[2:][::-1]

        # ternary representation
        T = toSparseTernaryRepresentation(S)
        print(f"binary: {S} | ternary: {T}")

        # another solution
        T2 = anotherSolution(n)
        assert T == T2, f"{T} != {T2}"

        # assertion
        TasInt = sum([c * (2**i) for i, c in enumerate(list(map(int, T.split(","))))])
        assert TasInt == n

        # count
        maxIntPerDigit[len(T.split(","))] = max(maxIntPerDigit[len(T.split(","))], n)

    print(f"maxIntPerDigit: {maxIntPerDigit}")


if __name__ == "__main__":
    main()
    # problem5()

result

binary: 1 | ternary: 1
binary: 01 | ternary: 0,1
binary: 11 | ternary: -1,0,1
binary: 001 | ternary: 0,0,1
binary: 101 | ternary: 1,0,1
binary: 011 | ternary: 0,-1,0,1
binary: 111 | ternary: -1,0,0,1
binary: 0001 | ternary: 0,0,0,1
binary: 1001 | ternary: 1,0,0,1
binary: 0101 | ternary: 0,1,0,1
binary: 1101 | ternary: -1,0,-1,0,1
binary: 0011 | ternary: 0,0,-1,0,1
binary: 1011 | ternary: 1,0,-1,0,1
binary: 0111 | ternary: 0,-1,0,0,1
binary: 1111 | ternary: -1,0,0,0,1
binary: 00001 | ternary: 0,0,0,0,1

(4)

題意が成立しないと仮定すると、ある自然数に対して、疎な三値表現以外の表現によって、の最小値は達成される。そのような最小値を達成する表現に対して、(3) と似たような手順を踏むことによって、さらに疎な表現が得られることを示し、最小値である事に対する矛盾か、疎な三値表現の一意性に対する矛盾を導く。

下位ビットから上位ビットに向かって対象としている疎でない表現に対する文字列検索を走査していく。

まず、表現にかが出現する場合、それぞれとで置き換えればより疎な表現が得られるので、が減少している。その時点で操作を終了する。

次に、表現にやが出現する場合について考える。そのようなまとまり (ラン) を (3) と同様に最後まで考えて、やが出現しているとしてよい。それぞれとでそれぞれ置き換えるという操作を行う。が減少すれば、終了する。そうでない場合、すなわち、まとまりの長さがの場合、は変化こそしていないが、その時点までの疎性は保証されることに注意する。

以上の操作を最上位ビットになるまで繰り返す。

これがの減少如何を問わず、最後のビットまで見た、という条件によって終了することは、 (3) の操作で高々1つしか桁が増えないこと、および、最後のビットが定義よりで、その先はだけであることから従う。この時点では変化していないが、先述の通り、また、操作の内容より、必ず疎な表現になっている。そして、仮定より、この表現のは、仮定の時点で登場している疎な三値表現のよりも小さい。よって、自然数に対して二つの異なる疎な三値表現が得られるので、疎な三値表現の一意性に矛盾する。

以上より、疎な三値表現以外の表現によって、の最小値は達成されないことが示された。

(5)

あまり想定解な気はしないが、一応の値が出てきたので、書いておく。

ある桁に注目した際に、その桁がになる確率を求める。ただし、左右の方向に無限に列が続くとする。が無限であることから、そのような値と求めるべき値は一致する。

(3) のアルゴリズムにおける、変換前の 2 進数における状態で場合分けをして考える。すると、以下のような表が得られる。

変換前の2進数(当該桁+前後)	その桁が0になる確率
000	1
001	1/2(後続が0) 2/3(繰り上がりなし)
010	1/4(後続が11) + 1/4(後続が10) 1/3(繰り上がり)
011	1
100	1
101	1/2(後続が0) 2/3(繰り上がりなし)
110	1/4(後続が11) + 1/4(後続が10) 1/3(繰り上がり)
111	1

この表における確率を合計すると、となるが、これは、求めるべき確率がであることと一致する。

この表の意味を説明する。まず、前準備として、変換前の 2 進数において、になっている桁が、変換により繰り上がってになる確率を考える。例えば、変換前にだった場合、変換によって、とになる。このような確率を求める。これは、この確率をと置くと、

後 続 が 後 続 が 、 か つ 、 こ こ で も 繰 り 上 が り が 起 き る 場 合 後 続 が の 場 合

であるので、となる。

次に、実際に表を埋める。

の場合に当該桁 (つまり、真ん中の桁) が必ずになることは、その変換アルゴリズムから明らか。

の場合に当該桁がになる確率を考える。後続がの場合、変換前の二進数はとなり、変換によって、となるので、となる。しかし、先述の繰り上がりによって、後続がとなってしまうと、変換によって、となり、となる。よって、繰り上がりが起きない確率を求めなければならず、これは、である。

の場合に当該桁がになる確率を考える。これも殆ど同様で、繰り上がりが起きるかどうかに注意すると、これはとなる。

他も同様。

よって、期待値はと示された。

Author​

Description​

Kai​

(1)​

(2)​

(3)​

コード 1​

result​

(4)​

(5)​

Author

Description

Kai

(1)

(2)

(3)

コード 1

result

(4)

(5)