Частотные списки и словари
"Частость" - число появлений слова в пробном тексте указанной длины, иногда выраженное в процентах. Ниже приведен один из многочисленных более-менее схожих вариантов таблицы слов, покрывающих примерно 50% словарного состава обычных текстов. Здесь их 135. В правой колонке указана с накоплением их суммарная "частость" с шагом 5%.
Слова | % |
---|
the | 6,8 | of | 10 | and, to | 15 | a, in | 20 | is, that, was, it, for | 25 | on, with, he, be, I, by, as, at | 30 | you, are, his, had, not, this, have, from, but, which | 35 | she, they, or, an, her, were, there, we, their, been, has, will, one, all, would | 40 | can, if, who, more, when, said, do, what, about, its, so, up, into, no, him, some, could, them, only, time, out, my, two, other, then, may, over | 45 | also, new, like, these, me, after, first, your, did, now, any, people, than, should, very, most, see, where, just, make, between, back, way, many, year, being, our, how, work, us, get, come, think, go, take, tell, use, sir, thing, shall, same, such, much, find, here, each, again, still, old, little, state, present, against, know, under, before, above, place, part, through, across, although, upon, though | 50 |
Вот несколько списков наиболее употребительных слов разного объёма из разных источников, которые можно скачать:135 300 850 1000 Как видите, в них слова могут группироваться по разным критериям: по частости, по алфавиту или по функциональным группам и пр. Разные словари наиболее употребительных слов составлены на основе этих списков. Иногда за алфавитной словарной статьёй приведена цифра 1, 2, ... Она указывает, что слово принадлежит к первой, второй и т.д. тысяче самых частотных. Наиболее интересны и информативны частотные списки, упорядоченые именно по "частости слов" и включающие индивидуальную частость. Вот пара списков разного объёма из разных источников, которые можно скачать: 2284 7059 Это распределение (в полулогарифмическом масштабе) слов с накоплением частости получено из таблицы "7059". Во-первых, как и ожидалось, видно, что мало слов имеют большой вес (заметьте, например, 50%-й уровень и сравните с таблицей на 135 слов). Во-вторых, из графика следует, что чуть не с самого начала, чтобы увеличить распознавание текста на очередные 5-10%, требуется примерно удвоить количество изученных слов. Будьте готовы к работе. В-третьих, в таблицу не вошли слова с частостью меньше, чем 10 на 1 000 000 (0.001%.). Вероятность встретить в случайном тексте конкретное опущенное слово ничтожно мала. Однако для кого-то именно оно может составлять суть и самое точное отображение предмета высказывания.
В частотных словарях частость может указываться числом за словарной статьёй. Или после обычного алфавитного словаря приводится частотный список, на основе которого составлен словарь. Впрочем, сейчас, когда компьютерные версии словарей доступны в различной форме и в любой конфигурации и порядке, есть только одна проблема - проблема времени, необходимого для выбора наиболее Вам подходящего. Множество словарей разного типа Вы можете найти и бесплатно скачать, в частности, здесь.
|
Три источника, три составных части Вашей лексики
- Учебные курсы и частотные списки (словари)
- Художественная, общественно-политическая и специальная литература
- Живое социальное и профессиональное общение и масс-медиа.
Учебные курсы базируются на самой употребительной лексике. Но они ограничены по её объёму, кроме того, содержат неизбежные "бреши", пропуски в последовательных перечнях частотных слов. По завершении курса разумно заполнить эти пробелы и расширять свой словрь, двигаясь по списку: раньше или позже выученное обязательно пригодится, и это будет эффективно за счёт его "частости". Однако этот процесс разумно применять до достижения практически необходимых 3-5 (в зависимости от Ваших притязаний) тысяч более или менее твёрдо, активно (т.е. с возможностью не простого понимания, но достаточно свободного практического употребления) выученных слов. А плохо знакомых, лишь пассивно распозначаемых слов может быть значительно больше. Далее эффективность снижается: уменьшается "вес" нового слова и повышается его "специализация", а, значит, падает вероятность, что оно так уж нужно как раз Вам.Литература - бесценный источник лексики. Поскольку даже в учебных целях Вы выбираете интересующие Вас источники, высока вероятность, что их лексика будет полезна именно Вам. Но даже в рамках Вашего интереса стремитесь изучать не все подряд незнакомые, а только самые частотные слова в источнике (которые всетретились в тексте не раз и не два), чтобы заметно ускорять чтение и повышать его понимание. Очень сложно заставить себя сознательно контролировать скорость чтения. Надо трезво осознавать, что есть два подхода, две цели: чтение "сюжетное" ради содержательной информации и "аналитическое". Аналитическое замедленное чтение направлено на полное осознание всех лексико-грамматических и стилистических особенностей текста. Это форма прямой учёбы, освоения и закрепления состава и форм речи. Однако злоупотребление таким чтением чревато некоторым падением столь ценного интереса к процессу, как при долгом просмотре фильма в замедленном темпе. Но более опасно другое: выработка привычки постоянно читать с низкой скоростью во вред желанию эмоционально-образно воспринимать "развлекательные" и захватывающие сюжетные тексты или быстро просматривать специальные тексты в поиске ценного материала. Старинный пример: почтальон, освобождённый от тяжёлой сумки, которую он носил много лет, уже не может изменить выработанный темп движений. Вы знаете об опасностях и предупреждаете их, разумно, по своему вкусу и контролируемым ощущениям сочетаете оба способа. Живое общение - надежда многих. Однако способность схватывать и впечатывать новое на лету высока у детей - и для них это эффективно и первостепенно, а для взрослых - проблематично. Разумеется, есть некоторые частотные формы, которые сразу "ложатся на ухо". К сожалению, некоторые довольствуются вульгаризмами вроде упоминания всуе "Ah, my God!" и тошнотворными "Big deal!", "Shit!", "Wow!". Ваша проблема - что знать и воспринимать, а что употреблять в своей речи. Вы идёте от элементарного умения объясниться для выживания до уровня, соответствующего Вашей общей образованности и кругу общения. Литература позволяет закрепить выученные формы, расширить их и совершенствовать их распознавание в тексте. В общении и профессиональной деятельности Вы осваиваете важнейшую именно для Вас социальную и специальную лексику. Таким образом, нет единственного и достаточного источника эффективного изучения английской лексики. Зная возможности и подходы, Вы пробуете и находите наиболее приемлемый для Вас "коктейль", чтобы получить максимальное удовольствие и результат. |
|