Vision Transformers for Cross-domain Few-shot Learning

This code was adapted from the following repositories:

Install requirements

setup.sh

Get pretrained ViT-B16 model

cd checkpoints/pretrained_ckpts/
!wget https://storage.googleapis.com/vit_models/imagenet21k/ViT-B_16.npz

Prepare meta-dataset following these instructions

Fine tune ViT on new dataset:

-Extract datasets to ./data folder. Set model configs and fine-tune.

-Currently supports fine tuning on CIFAR-10, CIFAR-100, Omniglot, Aircraft, Textures dataset.

-To fine-tune on other datasets add Dataloaders in utils/data_utils.py

python train.py --model_config=vit_configs/dtd_224.gin

Evaluate single feature extractor on tasks from Meta-Dataset:

python eval_vit.py --testsets dtd  --trainset 'dtd' --img_size 224

Evaluate ViT with Selecting Universal Representations on Meta-Dataset:

python eval_vit_sur.py --testsets cu_birds  --trainset 'imagenet dtd' --img_size 224 --num_tasks 100

Visualize attention maps on image

python visualize_attention.py --test_img data/test_imgs/dog.jpg

Name		Name	Last commit message	Last commit date
Latest commit History 56 Commits
cdfsl_dataset		cdfsl_dataset
data/test_imgs		data/test_imgs
doc		doc
models		models
utils		utils
vit_configs		vit_configs
.gitignore		.gitignore
README.md		README.md
eval_vit.py		eval_vit.py
eval_vit_sur.py		eval_vit_sur.py
paths.py		paths.py
requirements.txt		requirements.txt
setup.sh		setup.sh
train.py		train.py
train_args.py		train_args.py
train_timm_vit.py		train_timm_vit.py
visualize_attention.py		visualize_attention.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Vision Transformers for Cross-domain Few-shot Learning

Install requirements

Get pretrained ViT-B16 model

Prepare meta-dataset following these instructions

Fine tune ViT on new dataset:

Evaluate single feature extractor on tasks from Meta-Dataset:

Evaluate ViT with Selecting Universal Representations on Meta-Dataset:

Visualize attention maps on image

About

Releases

Packages

Languages

manogna-s/ViT-MetaDataset

Folders and files

Latest commit

History

Repository files navigation

Vision Transformers for Cross-domain Few-shot Learning

Install requirements

Get pretrained ViT-B16 model

Prepare meta-dataset following these instructions

Fine tune ViT on new dataset:

Evaluate single feature extractor on tasks from Meta-Dataset:

Evaluate ViT with Selecting Universal Representations on Meta-Dataset:

Visualize attention maps on image

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages