Вики-Конкорданс: поток Вики-сознания
Jun. 6th, 2008 06:02 pmБанда лингвистов из ВикиСловаря опубликовала конкорданс - то есть список 1000 наиболее частотных слов корпуса текстов русскоязычной википедии состоянием на февраль 2008
Слова расположены в соответствии с частотами их появлния в текстах - то есть, по идее, семантически и грамматически случайно, однако конкорданс при чтении производит впечатление пресловутого коллективного бессознательного в стиле Юнга с его архетипами и, иногда, вполне фрейдистскими фрагментами.
Во всяком случае, семантически и грамматически связанные фрагменты присутствуют.
Ниже приведены некоторые фрагменты в формате /Лемма/ /Число документов/ /Частота в корпусе/
Рекорд - грамматически вполне оформленное предложение. Как и положено, на лингвистическую тематику:
Слова расположены в соответствии с частотами их появлния в текстах - то есть, по идее, семантически и грамматически случайно, однако конкорданс при чтении производит впечатление пресловутого коллективного бессознательного в стиле Юнга с его архетипами и, иногда, вполне фрейдистскими фрагментами.
Во всяком случае, семантически и грамматически связанные фрагменты присутствуют.
Ниже приведены некоторые фрагменты в формате /Лемма/ /Число документов/ /Частота в корпусе/
Рекорд - грамматически вполне оформленное предложение. Как и положено, на лингвистическую тематику:
( Read more... )