Jun. 6th, 2008

kurgus: (Default)
Банда лингвистов из ВикиСловаря опубликовала конкорданс - то есть список 1000 наиболее частотных слов корпуса текстов русскоязычной википедии состоянием на февраль 2008

Слова расположены в соответствии с частотами их появлния в текстах - то есть, по идее, семантически и грамматически случайно, однако конкорданс при чтении производит впечатление пресловутого коллективного бессознательного в стиле Юнга с его архетипами и, иногда, вполне фрейдистскими фрагментами.

Во всяком случае, семантически и грамматически связанные фрагменты присутствуют.

Ниже приведены некоторые фрагменты в формате /Лемма/  /Число документов/ /Частота в корпусе/


Рекорд - грамматически вполне оформленное предложение. Как и положено, на лингвистическую тематику:

Profile

kurgus: (Default)
kurgus

June 2017

S M T W T F S
    123
45678910
111213 14151617
18192021222324
252627282930 

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 18th, 2025 12:49 am
Powered by Dreamwidth Studios