Long Short Term Memory Units

This is self-contained package to train a language model on word level Penn Tree Bank dataset. It achieves 115 perplexity for a small model in 1h, and 81 perplexity for a big model in a day. Model ensemble of 38 big models gives 69 perplexity. This code is derived from https://github.com/wojciechz/learning_to_execute (the same author, but a different company).

More information: http://arxiv.org/pdf/1409.2329v4.pdf

Name	Name	Last commit message	Last commit date
Latest commit Wojciech Zaremba May 20, 2015 7687025 · May 20, 2015 History 13 Commits
data	data	LSTM model for Penn Tree Bank.	Feb 13, 2015
CONTRIBUTING.md	CONTRIBUTING.md	Typo.	Feb 13, 2015
LICENSE	LICENSE	LSTM model for Penn Tree Bank.	Feb 13, 2015
README.md	README.md	Added link.	Feb 16, 2015
base.lua	base.lua	Cleaned according to mszlazak suggestion.	May 20, 2015
data.lua	data.lua	Fixed run_test.	Mar 27, 2015
main.lua	main.lua	do gates in one go. Work by szagoruyko.	May 20, 2015

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Long Short Term Memory Units

About

Releases

Packages

Languages

License

yang-fei/lstm

Folders and files

Latest commit

History

Repository files navigation

Long Short Term Memory Units

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages