跳到主要内容

東京大学 新領域創成科学研究科 メディカル情報生命専攻 2024年8月実施 問題9

Author

祭音Myyura

Description

ゲノム解析パイプラインにおける計算タスク間の依存関係を有向非巡回グラフ で表す。 頂点 は個々の計算タスクを表している。計算タスク の出力を計算タスク の入力とするために より先に の計算が終了している必要がある場合には辺 を加えて依存関係の制約を表す。 グラフ は非巡回グラフであり、閉路を含まない。

(1) 計算タスクの順列であって依存関係の制約に違反しない計算順序を「正しい計算順序」と呼ぶことにする。以下のグラフにおいて、正しい計算順序を1つ示せ。

(2) 任意の有向非巡回グラフ が与えられたとき、正しい計算順序を一つ出力する時間計算量 のアルゴリズムを示せ。ただし、入力グラフは隣接リスト表現で与えられており、 はそれぞれ の要素数を表す。

(3) 任意の有向非巡回グラフ および各計算タスク に対して非負の計算時間 が与えられている。計算機は無限にあり、計算タスクは任意の数だけ同時並行で実行できるものとする。また、計算機間でデータを移動するための通信時間は無視する。依存関係の制約に違反せずに全ての計算が終わるまでの最短時間を求める時間計算量 のアルゴリズムを示せ。ただし、入力グラフは隣接リスト表現で与えられているものとする。

Kai

(1)

解答例: v1, v5, v8, v11, v2, v6, v12, v7, v9, v3, v10, v4

(2)

アルゴリズムの手順:

  1. 初期化: 各頂点 の入次数(自身を終点とする辺の数)を計算し、配列などに保存する。キューの準備: 入次数が0のすべての頂点をキュー に追加する。
  2. リストの準備: 計算順序を記録するための空のリスト を用意する。
  3. 探索処理: キュー が空になるまで以下の操作を繰り返す。
    1. から頂点 を取り出し、 の末尾に追加する。
    2. グラフの隣接リストを参照し、 を始点とする各辺 について、頂点 の入次数を1減らす。
    3. 入次数が0になった頂点 があれば、それを に追加する。
  4. 出力: リスト を正しい計算順序として出力する。

時間計算量の見積もり:

  • ステップ1の入次数の計算は、すべての辺を1回ずつ調べるため です。
  • ステップ4のループ処理では、各頂点が正確に1回キューに入り、 に追加されるため 、各辺 も始点 が処理される際に正確に1回評価されるため です。
  • したがって、全体の時間計算量は となります。

(3)

無限の計算機があり並行処理が可能な場合、全体の最短計算時間は「DAG上の最長経路(クリティカルパス)」の長さに等しくなります。

アルゴリズムの手順:

  1. (2)のアルゴリズムを実行し、グラフ の頂点をトポロジカルソートした順序のリスト を取得する。

  2. 各頂点 の「計算が完了する最短時間」を保持する配列 を用意し、すべての について で初期化する。

  3. トポロジカルソートされたリスト の先頭から順に頂点 を取り出し、以下の更新処理を行う。

    1. 隣接リストを参照し、 から出る各辺 の先の頂点 について、以下の漸化式で完了時間を更新する。

    (これは、 の計算を始めるためには、先行するすべてのタスク の計算が終わるのを待つ必要があるためです)

  4. すべての頂点の処理が終わった後、配列 に格納されている値の最大値 を求めて出力する。これが全体の最短完了時間となる。

時間計算量の見積もり:

  • ステップ1のトポロジカルソートは です。
  • ステップ2の初期化は です。
  • ステップ3の更新処理では、トポロジカルソートの順に各頂点を1回ずつ訪問し、その頂点から出るすべての辺を1回ずつ評価するため、全体で です。
  • ステップ4の最大値の探索は です。したがって、全体の時間計算量は となります。