Конечно, есть и не один. К примеру в рамках проектов iWeb и COCA было проиндексировано порядка сотни тысяч лексем. Первый анализировал лексику всемирной паутины (корпус включает материалы из сети общим объемом 14 млрд. слов), второй опирался на более широкий материал, включая разговорную, литературную, газетную лексику, художественные и научные тексты (450 миллионов слов, крупнейший жанрово сбалансированный корпус). Ознакомиться можно здесь.
Американский национальный корпус (Open American National Corpus, OANC), Брауновский корпус (Brown Corpus, BC) и корпус американского английского (Corpus of Historical American English, COHA) также поддерживаются в актуальном состоянии и полезны для исследователей американского английского.
Если интересует британский вариант языка, больше подойдет Британский национальный корпус (British National Corpus, BNC).