東京大学 新領域創成科学研究科 メディカル情報生命専攻 2024年8月実施 問題9
Author
祭音Myyura
Description
ゲノム解析パイプラインにおける計算タスク間の依存関係を有向非巡回グラフ
(1) 計算タスクの順列であって依存関係の制約に違反しない計算順序を「正しい計算順序」と呼ぶことにする。以下のグラフにおいて、正しい計算順序を1つ示せ。
(2) 任意の有向非巡回グラフ
(3) 任意の有向非巡回グラフ
Kai
(1)
解答例: v1, v5, v8, v11, v2, v6, v12, v7, v9, v3, v10, v4
(2)
アルゴリズムの手順:
- 初期化: 各頂点
の入次数(自身を終点とする辺の数)を計算し、配列などに保存する。キューの準備: 入次数が0のすべての頂点をキュー に追加する。 - リストの準備: 計算順序を記録するための空のリスト
を用意する。 - 探索処理: キュー
が空になるまで以下の操作を繰り返す。 から頂点 を取り出し、 の末尾に追加する。 - グラフの隣接リストを参照し、
を始点とする各辺 について、頂点 の入次数を1減らす。 - 入次数が0になった頂点
があれば、それを に追加する。
- 出力: リスト
を正しい計算順序として出力する。
時間計算量の見積もり:
- ステップ1の入次数の計算は、すべての辺を1回ずつ調べるため
です。 - ステップ4のループ処理では、各頂点が正確に1回キューに入り、
に追加されるため 、各辺 も始点 が処理される際に正確に1回評価されるため です。 - したがって、全体の時間計算量は
となります。
(3)
無限の計算機があり並行処理が可能な場合、全体の最短計算時間は「DAG上の最長経路(クリティカルパス)」の長さに等しくなります。
アルゴリズムの手順:
-
(2)のアルゴリズムを実行し、グラフ
の頂点をトポロジカルソートした順序のリスト を取得する。 -
各頂点
の「計算が完了する最短時間」を保持する配列 を用意し、すべての について で初期化する。 -
トポロジカルソートされたリスト
の先頭から順に頂点 を取り出し、以下の更新処理を行う。 - 隣接リストを参照し、
から出る各辺 の先の頂点 について、以下の漸化式で完了時間を更新する。
(これは、
の計算を始めるためには、先行するすべてのタスク の計算が終わるのを待つ必要があるためです) - 隣接リストを参照し、
-
すべての頂点の処理が終わった後、配列
に格納されている値の最大値 を求めて出力する。これが全体の最短完了時間となる。
時間計算量の見積もり:
- ステップ1のトポロジカルソートは
です。 - ステップ2の初期化は
です。 - ステップ3の更新処理では、トポロジカルソートの順に各頂点を1回ずつ訪問し、その頂点から出るすべての辺を1回ずつ評価するため、全体で
です。 - ステップ4の最大値の探索は
です。したがって、全体の時間計算量は となります。