This branch is 7 commits behind dunbar12138/Audiovisual-Synthesis:master.

Name	Name	Last commit message	Last commit date
Latest commit dunbar12138 Jan 13, 2020 4166dcb · Jan 13, 2020 History 14 Commits
audioUtils	audioUtils	Update audiovisual synthesis	Dec 29, 2019
data	data	Update audiovisual synthesis	Dec 29, 2019
example	example	Add example run	Jan 12, 2020
scripts	scripts	Add example run	Jan 12, 2020
tmp	tmp	Update Audiovisual	Jan 12, 2020
vocoder	vocoder	Update Audio2audio	Dec 27, 2019
.gitignore	.gitignore	Update Audiovisual	Jan 12, 2020
README.md	README.md	Update README.md	Jan 13, 2020
model_vc.py	model_vc.py	Update audiovisual synthesis	Dec 29, 2019
model_video.py	model_video.py	Update Audio2audio	Dec 27, 2019
requirements.txt	requirements.txt	Update audiovisual synthesis	Dec 29, 2019
saveWav.py	saveWav.py	Update Audio2audio	Dec 27, 2019
test_audio.py	test_audio.py	Update Audiovisual	Jan 12, 2020
test_audiovisual.py	test_audiovisual.py	Update Audiovisual	Jan 12, 2020
train_audio.py	train_audio.py	Add example run	Jan 12, 2020
train_audiovisual.py	train_audiovisual.py	Add example run	Jan 12, 2020

Repository files navigation

Audiovisual-Synthesis

Unsupervised Any-to-many Audiovisual Synthesis via Exemplar Autoencoders

Kangle Deng, Aayush Bansal, Deva Ramanan

project page / demo / arXiv

This repo provides a PyTorch Implementation of our work.

Acknowledgements: This code borrows heavily from Auto-VC and Tacotron.

Summary Video

Dependencies

First, make sure ffmpeg installed on your machine.

Then, run: pip install -r requirements.txt

Data

We provide our CelebAudio Dataset at link.

Train

Voice Conversion

Check 'scripts/train_audio.sh' for an example of training a Voice-Conversion model. Make sure directory 'logs' exist.

Generally, run:

python train_audio.py --data_path PATH_TO_TRAINING_DATA --experiment_name EXPERIMENT_NAME --save_freq SAVE_FREQ --test_path_A PATH_TO_TEST_AUDIO --test_path_B PATH_TO_TEST_AUDIO --batch_size BATCH_SIZE --save_dir PATH_TO_SAVE_MODEL