This branch is 4 commits ahead of, 2 commits behind main.

Name	Name	Last commit message	Last commit date
Latest commit Yuto729 Jun 26, 2024 69a4a42 · Jun 26, 2024 History 5 Commits
configs	configs	Update base.yaml	Jun 26, 2024
data	data	initial commit	Jun 6, 2024
notebooks	notebooks	initial commit	Jun 6, 2024
src	src	initial commit	Jun 6, 2024
.DS_Store	.DS_Store	initial commit	Jun 6, 2024
README.md	README.md	Update README.md	Jun 26, 2024
main.py	main.py	Update main.py	Jun 26, 2024
requirements.txt	requirements.txt	initial commit	Jun 6, 2024

Repository files navigation

DL基礎講座2024　最終課題「Optical Flow Prediction from Event Camera (EventCamera)」

変更

config/base.ymlについて, バッチサイズが16以上だと演習環境でメモリエラーが発生するのでバッチサイズを8に変更しました.
main.pyにて2箇所誤りがありましたので修正しました.
- 159行目: batch["event_volume_old"] => batch["event_volume"]
- 166行目: submission.npy => submission

環境構築

requirements

python 3.11

Conda

conda create -n <環境名> python=3.11
conda activate <環境名>
pip install -r requirements.txt

ベースラインモデルを動かす

訓練・提出ファイル作成

python3 main.py

main.pyと同様のディレクトリ内に，学習したモデルのパラメータmodel.pthとテストデータに対する予測結果submission.npyファイルが作成されます．
ベースラインは非常に単純な手法のため，改善の余地が多くあります．Event CameraではOmnicampusにおいてベースラインのtest EPE=4.02を下回った提出のみ，修了要件として認めることとします．

各ファイルの説明

`main.py`

目的: アプリケーションのエントリーポイント.モデルの初期化、トレーニングの実行、テスト、結果の保存を行う.
主要な関数:
- set_seed: シード値を設定する.
- compute_epe_error: 予測されたオプティカルフローと正解データのend point errorを計算する.
- save_optical_flow_to_npy: オプティカルフローデータを .npy ファイルに保存する.
- main: トレーニング, テスト, 予測の保存を行う.

`src/models/base.py`

目的: ニューラルネットワークモデルの基本的な構成要素を含む.
主要なコンポーネント:
- build_resnet_block: ResNetスタイルのブロックを構築する.
- general_conv2d: 汎用的な畳み込み層.
- upsample_conv2d_and_predict_flow: 特徴マップをアップサンプルし、オプティカルフローを予測する.

`src/models/evflownet.py`

目的: イベントベースのデータからオプティカルフローを予測するための EVFlowNet モデルの定義を含む.
主要なコンポーネント:
- EVFlowNet: オプティカルフローを予測するためのニューラルネットワークモデル.
- forward: モデルのフォワードパスを定義する.

`src/datasets.py`

目的: トレーニングとテスト用のデータセットをロードおよび前処理するためのユーティリティを提供する.
主要な関数:
- train_collate: トレーニング用のデータバッチを準備する.
- DataLoader: データをロードする.
- Sequense: シーケンスデータを格納する.

DSEC Dataset (A Stereo Event Camera Dataset for Driving Scenarios) [link] の詳細

訓練データは合計2015データあり, イベントデータ，タイムスタンプ，正解オプティカルフローのRGB画像が与えられる．
97データがテストデータとして与えられる．
- テストデータに対する回答は正解のオプティカルフローとし，訓練時には与えられない．

データセットのダウンロード

こちらからtrain.zipとtest.zipをダウンロードし，data/ディレクトリに展開してください．

タスクの詳細

本コンペでは，与えられたイベントデータ，適切なオプティカルフローをモデルに出力させる．
評価は以下の式で計算されるEPE（End point Error）を用いる．
Unable to render expression.
```
$$\text{EPP}(\hat{u}, \hat{v}, u, v) = \sqrt{(\hat{u} - u)^2 + (\hat{v} - v)^2}$$
```
ここで：
Unable to render expression.
```
$\hat{u}$
```
と
Unable to render expression.
```
$\hat{v}$
```
は予測されたオプティカルフローの x 成分および y 成分.
Unable to render expression.
```
$u$
```
と
Unable to render expression.
```
$v$
```
は正解のオプティカルフローの x 成分および y 成分.

考えられる工夫の例

異なるスケールでのロスを足し合わせる．
- ベースラインモデルはUNet構造なので，デコーダーの中間層の出力は最終的な出力サイズの0.5,0.25,...倍になっています．各中間層の出力を用いてロスを計算することで，勾配消失を防ぎ，性能向上が見込めます．
連続する2フレームを入力に用いる．
- オプティカルフローはフレーム間でのピクセルの移動を表すベクトルです．したがって，入力に2フレーム（あるいはそれ以上）用いることで，イベントデータの変化量を用いてオプティカルフローの予測が可能になります．
画像の前処理．
- 画像の前処理には形状を同じにするためのResizeのみを利用しています．第5回の演習で紹介したようなデータ拡張を追加することで，疑似的にデータを増やし汎化性能の向上が見込めます．ただし，イベントデータは非常に疎なデータなので少し工夫が必要かもしれません．

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

DL基礎講座2024　最終課題「Optical Flow Prediction from Event Camera (EventCamera)」

変更

環境構築

requirements

Conda

ベースラインモデルを動かす

訓練・提出ファイル作成

各ファイルの説明

`main.py`

`src/models/base.py`

`src/models/evflownet.py`

`src/datasets.py`

DSEC Dataset (A Stereo Event Camera Dataset for Driving Scenarios) [link] の詳細

データセットのダウンロード

タスクの詳細

考えられる工夫の例

About

Releases

Packages

ailorg/dl_lecture_competition_pub

Folders and files

Latest commit

History

Repository files navigation

DL基礎講座2024 最終課題「Optical Flow Prediction from Event Camera (EventCamera)」

変更

環境構築

requirements

Conda

ベースラインモデルを動かす

訓練・提出ファイル作成

各ファイルの説明

main.py

src/models/base.py

src/models/evflownet.py

src/datasets.py

DSEC Dataset (A Stereo Event Camera Dataset for Driving Scenarios) [link] の詳細

データセットのダウンロード

タスクの詳細

考えられる工夫の例

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

DL基礎講座2024　最終課題「Optical Flow Prediction from Event Camera (EventCamera)」

`main.py`

`src/models/base.py`

`src/models/evflownet.py`

`src/datasets.py`

Packages