Difference between revisions of "Corpora for English"

From ACL Wiki

Jump to navigation Jump to search

Revision as of 11:21, 24 April 2008

Please add new items to the List of resources by language.
Please help us move items below into the List of resources by language.

English

Galician

German

Iranian

Multilingual

Russian

Slovak

Slovak National Corpus

Italian

Link collections

Corpora tools

List of stop words
Poliqarp - open source XML-aware indexer, search engine and concordancer
The Sketch Engine
Treebank tokenization scheme

Uncategorized

Arabic

Arabic Newswire Part 1

Bosnian

The Oslo Corpus of Bosnian Texts

Bulgarian

Corpus of spoken Bulgarian

Croatian

Croatian Language Corpus at the IHJJ

Czech

Czech National Corpus

Danish

Danish news corpus

English

Finnish

Finnish text bank

French

Base Textuelle de Moyen Francais

German

Haitian Creole

HAITIAN CREOLE ELECTRONIC TEXTS

Italian

Oxford Text Archive Corpus of Italian Newspapers

Japanese

list of Japanese transitive - intransitive verb pairs

Polish

IPI PAN Polish Corpus

Romanian

Romanian NLP

Sanskrit

Sanskrit Library

Slovenian

Slovene-English Parallel Corpus

Spanish

Swahili

Helsinki Corpus of Swahili (HCS)

Retrieved from "https://aclweb.org/aclwiki/index.php?title=Corpora_for_English&oldid=5009"

Corpora