Начать новую тему Ответить на тему
Статистика раздачи
Размер: 201.42 МБ | | Скачали: 40
Сидеров: 10  [0 байт/сек]    Личеров: 3  [0 байт/сек]
Пред. тема | След. тема 

Автор
Сообщение

Ответить с цитатой 

WORD Frequency List: 12,500 Most Common Words / Частотный список: 12,500 наиболее употребляемых слов

Данная раздача устарела. Новая версия доступна

Описание: Данный список получен в результате обработки известных в сети списков , BNC 6318 и COCA 5000., а также списков Пола Нэйшна, используемых в его программе RANGE
Алгоритм составления списка.
1. Исключение повторяющихся записей из Longman 3000, BNC 6318 и COCA 5000. (Прим* слова, представленные несколькими частями речи, повторяются в этих списках по нескольку раз, например слово "like" в таблице BNC встречается шесть раз - в качестве глагола, в качестве прилагательного, в качестве предлога, союза, наречия и существительного).
2. Объединение BNC 6318 и COCA 5000 (=5874 записи).
3. Добавление остатка из Longman 3000 (+70 записей). ВАЖНО! Нумерация слов в Longman 3000 изначально отсутствовала (слова в этом списке даются просто в алфавитном порядке), поэтому в качестве основного списка для дальнейшего постоения нумерации был выбран BNC 6318 как наиболее полный из всех. Это значит, что слово, попадающее в TOP 3000 по версии Longman Corpus, на самом деле может оказаться в пятой тысячи, а то и выше (например sock, cushion, garlic и др.).
4. Добавление заголовков из первых 6000 слов Пола Нэйшна (+1963 записей). Слова распределены равномерно среди уже имеющихся с небольшим смещением от начала, но в то же время в порядке их появления в списках Пола Нэйшна и частоты употребления в ANC.
5. Добавление некоторых наиболее популярных форм из TOP 6000 Пола Нэйшна (+200 записей).
6. Добавление оставшихся заголовков из 7000-14000 по версии Пола Нэйшна с высокой частотой использования в ANC (=12527)

ПРИМЕЧАНИЕ* (1) Первые 7090 слов полученного списка являются своеобразным ядром, полностью объединившим в себе остальные списки - Longman, COCA и BNC - а также включают в себя около 5000 наиболее употребляемых слов по версии Paul Nation. (2) Первые 8100 слов данного списка добирают в себя все 6000 слов по версии Пола Нэйшна.
The trialling of fourteen 1,000 word-family lists made from the British National Corpus, showed that the lists
were properly sequenced and there were no glaring omissions from the lists.
If 98% coverage of a text is needed for unassisted comprehension, then a 8,000
to 9,000 word-family vocabulary is needed for comprehension of written text
and a vocabulary of 6,000 to 7,000 for spoken text.


Clearly, spoken language makes slightly greater use of the high-
frequency words of the language than written language does. In
contrast, we need to consider that text coverage greater than 98% may
be needed to cope effectively with the transitory nature of spoken
language. The data we have looked at in this article suggest the
following conclusions.

1. The greatest variation in vocabulary coverage is most likely to occur in the
first 1,000 words, and in the proper nouns. The first 1,000 plus proper
nouns cover 78%–81% of written text, and around 85% of spoken text.
2. The fourth 1,000 and fifth 1,000 words provide around 3% coverage of
most written text, and 1.5%–2% coverage of spoken text.
3. The four levels of the sixth to ninth 1,000 provide around 2% coverage of
written text and around 1% coverage of spoken text.
4. The five levels of tenth to fourteenth 1,000 provide coverage of less than
1% of written text and 0.5% of spoken.



В файле Excel
для удобства по нажатию ENTER, CTRL+ENTER и ПРОБЕЛ вызываются три макроса. Первые два - для быстрого перемещения между листами с сохранением активного номера слова. Последний - для создания групповой метки слов, например для наложения фильтра только на нужные слова и последующей их печати.

(Добавлено 5.03.2012)
(Добавлено 13.09.2012)
(Добавлено 01.05.2013)
Правила, инструкции, FAQ!!!
Торрент   Скачать торрент Магнет ссылка
Скачать торрент
[ Размер 18.95 КБ / Просмотров 159 ]

Статус
Проверен 
 
Размер  201.42 МБ
Приватный: Нет (DHT включён)
.torrent скачан  40
Как залить торрент? | Как скачать Torrent? | Ошибка в торренте? Качайте магнет  


     Отправить личное сообщение
   
Страница 1 из 1
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему


Сейчас эту тему просматривают: нет зарегистрированных пользователей и гости: 1


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Перейти:  
Ресурс не предоставляет электронные версии произведений, а занимается лишь коллекционированием и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями. Если вы являетесь правообладателем какого-либо представленного материала и не желаете чтобы ссылка на него находилась в нашем каталоге, свяжитесь с нами и мы незамедлительно удалим её. Файлы для обмена на трекере предоставлены пользователями сайта, и администрация не несёт ответственности за их содержание. Просьба не заливать файлы, защищенные авторскими правами, а также файлы нелегального содержания!