Когда говорят о языке. Теория знаковой природы языка

На нашей планете существует великое множество языков. Некоторые языки похожи так, что, зная один язык, можно практически без труда понять все или почти все из того, что сказано или написано на другом языке. Есть языки непохожие настолько, что на первый взгляд между ними нет ничего общего. Разнообразие человеческих языков - это их самое удивительное свойство.

В настоящее время лингвистическая ситуация на планете Земля такова: насчитывается от 3 до 6 тысяч различных языков. Причин такого значительного расхождения в подсчетах несколько. Во-первых, некоторые языки до сих пор практически не изучены и не подсчитаны. Во-вторых, до сих пор не существует четко сформулированных критериев разделения языка и диалекта, и часто трудно сказать, имеем ли мы дело с двумя разными языками или перед нами язык и один из его диалектов. Очевидное разнообразие существующих языков побудило лингвистов к сравнению языковых систем. Лингвистический компаративизм возник в результате поисков ответа на целый ряд вопросов: есть ли какие-то черты, присущие всем языкам? Чем определяется уникальность каждого языка? Какие структурные свойства возможны или невозможны в языке?

Если мы сравним два языка и обнаружим в них определенные сходства, мы можем попытаться объяснить это одной из четырех причин. Во-первых, сходства могут оказаться случайными совпадениями, хотя такие случаи достаточно редки. Во-вторых, сходство может объясняться генетическим родством языков, наличием общего языка-предка. В-третьих, носители двух языков могут контактировать друг с другом в течение долгого времени в силу своего соседства, и в результате языки соседей приобретают какие-то общие черты. Наконец, наличие сходств может объясняться языковыми универсалиями. Поскольку языковые сходства могут иметь различную природу, в лингвистике существует несколько разновидностей межъязыкового сопоставления.

При генетическом сопоставлении элементы одной языковой системы представляются как результат развития другой языковой системы. Генетическая классификация языков традиционно представляется в виде дерева, каждая точка которого указывает на общий язык-предок. Все языки, восходящие к этому языку-предку, образуют генетически родственную группу.

Значение генетической классификации в современной лингвистике настолько велико, что очень часто, когда говорят о классификации языков, имеют в виду именно генетическую классификацию. Однако это не единственно возможный способ классифицировать языки.

Генетическим исследованиям традиционно противопоставляют

Не генетические, т.е. такие, в ходе которых сопоставляются языки, не обязательно являющиеся родственными. Все попытки сравнения неродственных языков можно разделить на две группы: лингвогеографические, когда изучается материал географически смежных языков, и нелокализованные.

Лингвогеографическая классификация языков также называется ареальной. Этот способ классификации основывается на мнении, что в результате постоянных контактов носителей языки-соседи приобретают общие черты, которые отличают эти языки от языков других ареалов. Если мы сравним генеалогические и ареальные классификации, то обнаружим, что в их основе лежит различное отношение к фактору времени: черты сходства языков, возникшие вследствие контактов, имеют гораздо более позднее происхождение по сравнению с чертами сходства, обусловленными генетическим родством.

При нелокализованных сопоставительных исследованиях не налагаются никакие ограничения на характер изучаемого языкового материала. Лингвистическая типология - это раздел общего языкознания, который занимается сравнительным изучением структурных и функциональных свойств языков независимо от характера генетических и географических отношений между ними. Следовательно, типологическое сопоставление языков является негенетическим и нелокализованным. Смысл типологических классификаций состоит в том, чтобы на их основе делать обобщения относительно свойств не только конкретных языков, но и человеческого языка вообще.

Исходное предположение типологических исследований таково: структурные характеристики языков, их повторяемость не являются случайными или произвольными. Эти структурные характеристики могут быть описаны в терминах языковых универсалий. Значительно обобщая ситуацию, можно сказать, что типология преследует двоякую цель: определить языковые универсалии и установить диапазон варьирования между существующими языками.

Лингвистическая типология и сравнительно-историческое языкознание близки в своем интересе к сопоставлению языков, однако основное различие генетического и типологического сопоставления языков состоит в полной произвольности типологической классификации. В принципе возможно построить столько классификаций, сколько найдется критериев, которые исследователь сочтет пригодными для разделения языков на группы и классы.

Кроме того, в типологии понятие соответствия не является обязательно двуплановым и может ограничиваться только формой или только значением сопоставляемых языковых явлений. В рамках типологических исследований создаются различные классификации языков мира, и, поскольку в основание классификаций кладутся различные признаки, говорят о существовании различных типологий. Наиболее часто термином типология обозначают структурную классификацию языков. Предметом структурной типологии является внутренняя организация языковых систем. Другой вид типологической классификации языков - это функциональная типология. Предметом функциональной типологии является язык как коммуникативное средство, и здесь особый интерес для исследователей представляют сходства и различия языковых систем, связанные с особенностями их употребления.

Основной целью типологических исследований является создание классификаций языков по определенным типам. Под типом языка принято понимать либо тип как классификационную характеристику системы языка в целом, либо тип как способ выражения грамматических или других отношений в языке, как способ формальной организации единиц языка.

Посмотрим на примерах, что именно имеют в виду, когда разделяют две трактовки понятия «тип» в лингвистической типологии. Обратимся к двум уровням языковой системы - уровню структуры слова и уровню структуры предложения. В русском языке в большинстве случаев слово можно расчленить на корень, основу, словообразовательные морфемы и словоизменительные морфемы. При этом часто мы сталкиваемся с ситуацией, когда корень не существует в виде отдельного слова, и такая ситуация характерна для большинства самостоятельных частей речи. Если мы посмотрим, как обстоит дело в турецком языке, то увидим, что там корень всегда равен основе. Если далее мы обратимся к анализу словообразовательных морфем, то обнаружим, что в русском языке сочетание «корень + словообразовательная морфема» также зачастую не существует в виде самостоятельного слова - завершенность слова во многих случаях определяется наличием словоизменительной морфемы.

Таким образом, каждый язык обладает какими-то свойственными ему чертами, которые отличают его от других языков, причем набор этих признаков не является случайным. Можно говорить о том, что в каждом конкретном случае данный набор признаков составляет определенную устойчивую систему. Таким образом, устойчивая совокупность ведущих признаков языка, находящихся между собой в определенных отношениях, является типом языка. Наличие или отсутствие какого-нибудь одного признака определяет наличие или отсутствие другого признака или ряда признаков.

Иными словами, тип языка - это модель, одна из возможных идеальных схем устройства языковой системы. Обратимся к понятию тип в языке. Здесь мы должны обратить внимание на наличие в предыдущем определении словосочетания ведущие признаки языка. Если есть ведущие, т.е. доминирующие признаки, значит, в языке должны быть и такие признаки, которые не являются ведущими, но сохранились в языке исторически и существуют в виде устойчивой системы. Например, известно, что английский язык в его сегодняшнем состоянии отличается отсутствием согласования. Тем не менее, мы обнаруживаем отдельные случаи необходимости согласования, например, указательные местоимения должны быть согласованы в числе с теми существительными, к которым они относятся, например, this car - these cars. Оказывается, что в одной языковой системе может реализовываться несколько языковых типов организации структуры.

Типологические исследования обязательно проводятся на материале нескольких языков. Однако различия в грамматической организации не позволяют использовать только структурный критерий, ориентированный исключительно на языковую форму. Если мы ограничимся только структурным критерием, то упустим из виду все те грамматические явления, которые не укладываются в заранее разработанную схему. Поэтому в типологических исследованиях роль этого важного критерия, делающего типологические исследования в принципе возможными, играет семантический критерий. Анализируя проблему возможности типологического сопоставления, У. Крофт пишет, что семантический критерий необходимо понимать по возможности широко, включая в него прагматическую и дискурсивную составляющую, которые также влияют на отбор грамматических средств. Тогда алгоритм типологического сопоставления языковых явлений выглядит так:

2) в сопоставляемых языках обнаруживаются средства для выражения этих семантических отношений;

3) изучается соотношение между этими языковыми средствами и другими языковыми явлениями: в частности, нас будут интересовать структурные особенности языковых средств, которые выражают данное семантическое отношение, а также возможность передачи других значений с помощью выделенных нами языковых средств. Такой алгоритм исследования предполагает тесную взаимосвязь между формой языковых средств и теми функциями, которые они выполняют (Croft, 2003).

Во многих случаях основные грамматические категории в сопоставляемых языках выделяются легко, на основе интуиции исследователя. Часто сведения о способах выражения определенных семантических отношений черпаются из перевода, что также является семантическим методом исследования. Есть еще один способ выявления языковых сходств и различий - ввести в исследование язык-эталон.

(грамматики классифицируются по виду их правил вывода)

ТИП 0:

грамматикой типа 0 , если на правила вывода не накладывается никаких ограничений (кроме тех, которые указаны в определении грамматики).

ТИП 1:

Грамматика G = (VT, VN, P, S) называется неукорачивающей грамматикой , если каждое правило из P имеет вид a ® b, где a Î (VT È VN) + , b Î (VT È VN) + и
| a | <= | b |.

Грамматика G = (VT, VN, P, S) называется контекстно-зависимой (КЗ) , если каждое правило из P имеет вид a ® b, где a = x 1 Ax 2 ; b = x 1 gx 2 ; A Î VN;
g Î (VT È VN) + ; x 1 ,x 2 Î (VT È VN) * .

Грамматику типа 1 можно определить как неукорачивающую либо как контекстно-зависимую.

Выбор определения не влияет на множество языков, порождаемых грамматиками этого класса, поскольку доказано, что множество языков, порождаемых неукорачивающими грамматиками, совпадает с множеством языков, порождаемых КЗ-грамматиками.

ТИП 2:

Грамматика G = (VT, VN, P, S) называется контекстно-свободной (КС) , если каждое правило из Р имеет вид A ® b, где A Î VN, b Î (VT È VN) + .

Грамматика G = (VT, VN, P, S) называется укорачивающей контекстно-свободной (УКС) , если каждое правило из Р имеет вид A ® b, где A Î VN,
b Î (VT È VN) * .

Грамматику типа 2 можно определить как контекстно-свободную либо как укорачивающую контекстно-свободную.

Возможность выбора обусловлена тем, что для каждой УКС-грамматики существует почти эквивалентная КС-грамматика.

ТИП 3:

Грамматика G = (VT, VN, P, S) называется праволинейной , если каждое правило из Р имеет вид A ® tB либо A ® t, где A Î VN, B Î VN, t Î VT.

Грамматика G = (VT, VN, P, S) называется леволинейной

Грамматику типа 3 (регулярную, Р-грамматику) можно определить как праволинейную либо как леволинейную.

Выбор определения не влияет на множество языков, порождаемых грамматиками этого класса, поскольку доказано, что множество языков, порождаемых праволинейными грамматиками, совпадает с множеством языков, порождаемых леволинейными грамматиками.

Соотношения между типами грамматик:

(1) любая регулярная грамматика является КС-грамматикой;

(2) любая регулярная грамматика является УКС-грамматикой;

(3) любая КС- грамматика является УКС-грамматикой;

(4) любая КС-грамматика является КЗ-грамматикой;

(5) любая КС-грамматика является неукорачивающей грамматикой;

(6) любая КЗ-грамматика является грамматикой типа 0.

(7) любая неукорачивающая грамматика является грамматикой типа 0.

(8) любая УКС-грамматика является грамматикой типа 0.

Замечание: УКС-грамматика, содержащая правила вида A ® e, не является КЗ-грамматикой и не является неукорачивающей грамматикой.

Определение: язык L(G) является языком типа k , если его можно описать грамматикой типа k.

Соотношения между типами языков:

(1) каждый регулярный язык является КС-языком, но существуют КС-языки, которые не являются регулярными (например, L = {a n b n | n>0}).

(2) каждый КС-язык является КЗ-языком, но существуют КЗ-языки, которые не являются КС-языками (например, L = {a n b n c n | n>0}).

(3) каждый КЗ-язык является языком типа 0.

Замечание: УКС-язык, содержащий пустую цепочку, не является КЗ-языком.

Замечание: следует подчеркнуть, что если язык задан грамматикой типа k, то это не значит, что не существует грамматики типа k’ (k’>k), описывающей тот же язык. Поэтому, когда говорят о языке типа k, обычно имеют в виду максимально возможный номер k.

Например, грамматика типа 0 G1 = ({0,1}, {A,S}, P1, S) и

КС-грамматика G2 = ({0,1}, {S}, P2, S), где

P1: S ® 0A1 P2: S ® 0S1 | 01

описывают один и тот же язык L = L(G1) = L(G2) = { 0 n 1 n | n>0}. Язык L называют КС-языком, т.к. существует КС-грамматика, его описывающая. Но он не является регулярным языком, т.к. не существует регулярной грамматики, описывающей этот язык .

Примеры грамматик и языков.

Замечание: если при описании грамматики указаны только правила вывода Р, то будем считать, что большие латинские буквы обозначают нетерминальные символы, S - цель грамматики, все остальные символы - терминальные.

1) Язык типа 0: L(G) = {a 2 | n >= 1}

2) Язык типа 1: L(G) = { a n b n c n , n >= 1}

G: S ® aSBC | abC

3) Язык типа 2: L(G) = {(ac) n (cb) n | n > 0}

G: S ® aQb | accb

4) Язык типа 3: L(G) = {w ^ | w Î {a,b} + , где нет двух рядом стоящих а}

B ® b | Bb | Ab

Разбор цепочек

Цепочка принадлежит языку, порождаемому грамматикой, только в том случае, если существует ее вывод из цели этой грамматики. Процесс построения такого вывода (а, следовательно, и определения принадлежности цепочки языку) называется разбором .

С практической точки зрения наибольший интерес представляет разбор поконтекстно-свободным (КС и УКС) грамматикам. Их порождающей мощности достаточно для описания большей части синтаксической структуры языков программирования, для различных подклассов КС-грамматик имеются хорошо разработанные практически приемлемые способы решения задачи разбора.

Рассмотрим основные понятия и определения, связанные с разбором по КС-грамматике.

Определение:
левым (левосторонним) , если в этом выводе каждая очередная сентенциальная форма получается из предыдущей заменой самого левого нетерминала.

Определение: вывод цепочки b Î (VT) * из S Î VN в КС-грамматике
G = (VT, VN, P, S), называется правым (правосторонним) , если в этом выводе каждая очередная сентенциальная форма получается из предыдущей заменой самого правого нетерминала.

В грамматике для одной и той же цепочки может быть несколько выводов, эквивалентных в том смысле, что в них в одних и тех же местах применяются одни и те же правила вывода, но в различном порядке.

Например, для цепочки a+b+a в грамматике

G = ({a,b,+}, {S,T}, {S ® T | T+S; T ® a | b}, S)

можно построить выводы:

(1) S®T+S®T+T+S®T+T+T®a+T+T®a+b+T®a+b+a

(2) S®T+S®a+S®a+T+S®a+b+S®a+b+T®a+b+a

(3) S®T+S®T+T+S®T+T+T®T+T+a®T+b+a®a+b+a

Здесь (2) - левосторонний вывод, (3) - правосторонний, а (1) не является ни левосторонним, ни правосторонним, но все эти выводы являются эквивалентными в указанном выше смысле.

Для КС-грамматик можно ввести удобное графическое представление вывода, называемое деревом вывода, причем для всех эквивалентных выводов деревья вывода совпадают.

Определение: дерево называется деревом вывода (или деревом разбора) в КС-грамматике G = {VT, VN, P, S), если выполнены следующие условия:

(1) каждая вершина дерева помечена символом из множества (VN È VT È e) , при этом корень дерева помечен символом S; листья - символами из (VT È e);

(2) если вершина дерева помечена символом A Î VN, а ее непосредственные потомки - символами a 1 , a 2 , ... , a n , где каждое a i Î (VT È VN), то A ® a 1 a 2 ...a n - правило вывода в этой грамматике;

(3) если вершина дерева помечена символом A Î VN, а ее единственный непосредственный потомок помечен символом e, то A ® e - правило вывода в этой грамматике.

Пример дерева вывода для цепочки a+b+a в грамматике G:

Определение: КС-грамматика G называется неоднозначной , если существует хотя бы одна цепочка a Î L(G), для которой может быть построено два или более различных деревьев вывода.

Это утверждение эквивалентно тому, что цепочка a имеет два или более разных левосторонних (или правосторонних) выводов.

Определение: в противном случае грамматика называется однозначной .

Определение: язык, порождаемый грамматикой, называется неоднозначным , если он не может быть порожден никакой однозначной грамматикой.

Пример неоднозначной грамматики:

G = ({if, then, else, a, b}, {S}, P, S),

где P = {S ® if b then S else S | if b then S | a}.

В этой грамматике для цепочки if b then if b then a else a можно построить два различных дерева вывода.

Однако это не означает, что язык L(G) обязательно неоднозначный. Определенная нами неоднозначность - это свойство грамматики, а не языка , т.е. для некоторых неоднозначных грамматик существуют эквивалентные им однозначные грамматики.

Если грамматика используется для определения языка программирования, то она должна быть однозначной.

В приведенном выше примере разные деревья вывода предполагают соответствие else разным then. Если договориться, что else должно соответствовать ближайшему к нему then, и подправить грамматику G, то неоднозначность будет устранена:

S ® if b then S | if b then S’ else S | a

S’ ® if b then S’ else S’ | a

Проблема, порождает ли данная КС-грамматика однозначный язык (т.е. существует ли эквивалентная ей однозначная грамматика), является алгоритмически неразрешимой.

Однако можно указать некоторые виды правил вывода, которые приводят к неоднозначности:

(2) A ® AaA | b

(3) A ® aA | Ab | g

(4) A ® aA | aAbA | g

Пример неоднозначного КС-языка:

L = {a i b j c k | i = j или j = k}.

Интуитивно это объясняется тем, что цепочки с i = j должны порождаться группой правил вывода, отличных от правил, порождающих цепочки с j = k. Но тогда, по крайней мере, некоторые из цепочек с i = j = k будут порождаться обеими группами правил и, следовательно, будут иметь по два разных дерева вывода. Доказательство того, что КС-язык L неоднозначный, приведен в .

Одна из грамматик, порождающих L, такова:

Очевидно, что она неоднозначна.

Дерево вывода можно строить нисходящим либо восходящим способом.

При нисходящем разборе дерево вывода формируется от корня к листьям; на каждом шаге для вершины, помеченной нетерминальным символом, пытаются найти такое правило вывода, чтобы имеющиеся в нем терминальные символы “проектировались” на символы исходной цепочки.

Метод восходящего разбора заключается в том, что исходную цепочку пытаются “свернуть” к начальному символу S; на каждом шаге ищут подцепочку, которая совпадает с правой частью какого-либо правила вывода; если такая подцепочка находится, то она заменяется нетерминалом из левой части этого правила.

Если грамматика однозначная, то при любом способе построения будет получено одно и то же дерево разбора.

Преобразования грамматик

В некоторых случаях КС-грамматика может содержать недостижимые и бесплодные символы, которые не участвуют в порождении цепочек языка и поэтому могут быть удалены из грамматики.

Определение: символ x Î (VT È VN) называется недостижимым в грамматике G = (VT, VN, P, S), если он не появляется ни в одной сентенциальной форме этой грамматики.

Алгоритм удаления недостижимых символов:

Вход: КС-грамматика G = (VT, VN, P, S)

Выход: КС-грамматика G’ = (VT’, VN’, P’, S), не содержащая недостижимых символов, для которой L(G) = L(G’).

1. V 0 = {S}; i = 1.

2. V i = {x | x Î (VT È VN), в P есть A®axb и AÎV i-1 , a,bÎ(VTÈVN) * } È V i-1 .

3. Если V i ¹ V i -1 , то i = i + 1 и переходим к шагу 2, иначе VN’ = V i Ç VN;
VT’ = V i Ç VT; P’ состоит из правил множества P, содержащих только символы из Vi; G’ = (VT’, VN’, P’, S).

Определение: символ A Î VN называется бесплодным в грамматике
G = (VT, VN, P, S), если множество { a Î VT * | A Þ a} пусто.

Алгоритм удаления бесплодных символов:

Вход: КС-грамматика G = (VT, VN, P, S).

Выход: КС-грамматика G’ = (VT, VN’, P’, S), не содержащая бесплодных символов, для которой L(G) = L(G’).

Рекурсивно строим множества N 0 , N 1 , ...

1. N 0 = Æ, i = 1.

2. N i = {A | (A ® a) Î P и a Î (N i-1 È VT) * } È N i-1 .

3. Если N i ¹ N i -1 , то i = i + 1 и переходим к шагу 2, иначе VN’ = N i ; P’ состоит из правил множества P, содержащих только символы из VN’ È VT; G’ = (VT, VN’, P’, S).

Определение: КС-грамматика G называется приведенной, если в ней нет недостижимых и бесплодных символов.

Алгоритм приведения грамматики :

(1) обнаруживаются и удаляются все бесплодные нетерминалы.

(2) обнаруживаются и удаляются все недостижимые символы.

Удаление символов сопровождается удалением правил вывода, содержащих эти символы.

Замечание: е сли в этом алгоритме переставить шаги (1) и (2), то не всегда результатом будет приведенная грамматика.

Для описания синтаксиса языков программирования стараются использовать однозначные приведенные КС-грамматики.

Задачи.

1. Дана грамматика. Построить вывод заданной цепочки.

a) S ® T | T+S | T-S b) S ® aSBC | abC

T ® F | F*T CB ® BC

F ® a | b bB ® bb

Цепочка a-b*a+b bC ® bc

Цепочка aaabbbccc

2. Построить все сентенциальные формы для грамматики с правилами:

3. К какому типу по Хомскому относится данная грамматика? Какой язык она порождает? Каков тип языка?

a) S ® APA b) S ® aQb | e

P ® + | - Q ® cSc

c) S ® 1B d) S ® A | SA | SB

B ® B0 | 1 A ® a

4. Построить грамматику, порождающую язык:

a) L = { a n b m | n, m >= 1}

b) L = { acbcgc | a, b, g - любые цепочки из a и b}

c) L = { a 1 a 2 ... a n a n ... a 2 a 1 | a i = 0 или 1, n >= 1}

d) L = { a n b m | n ¹ m ; n, m >= 0}

e) L = { цепочки из 0 и 1 с неравным числом 0 и 1}

f) L = { aa | a Î {a,b} + }

g) L = { w | w Î {0,1} + и содержит равное количество 0 и 1, причем любая подцепочка, взятая с левого конца, содержит единиц не меньше, чем нулей}.

h) L = { (a 2m b m) n | m >= 1, n >= 0}

i) L = { ^ | n >= 1}

j) L = { | n >= 1}

k) L = { | n >= 1}

5. К какому типу по Хомскому относится данная грамматика? Какой язык она порождает? Каков тип языка?

a) S ® a | Ba b) S ® Ab

B ® Bb | b A ® Aa | ba

c) S ® 0A1 | 01 d) S ® AB

0A ® 00A1 AB ® BA

*e) S ® A | B *f) S ® 0A | 1S

A ® aAb | 0 A ® 0A | 1B

B ® aBbb | 1 B ® 0B | 1B | ^

*g) S ® 0S | S0 | D *h) S ® 0A | 1S | e

D ® DD | 1A | e A ® 1A | 0B

A ® 0B | e B ® 0S | 1B

*i) S ® SS | A *j) S ® AB^

A ® a | bb A ® a | cA

*k) S ® aBA | e *l) S ® Ab | c

B ® bSA A ® Ba

6. Эквивалентны ли грамматики с правилами:

а) S ® AB и S ® AS | SB | AB

A ® a | Aa A ® a

B ® b | Bb B ® b

b) S ® aSL | aL и S ® aSBc | abc

L ® Kc cB ® Bc

cK ® Kc bB ® bb

7. Построить КС-грамматику, эквивалентную грамматике с правилами:

а) S ® aAb b) S ® AB | ABS

aA ® aaAb AB ® BA

8. Построить регулярную грамматику, эквивалентную грамматике с правилами:

а) S ® A | AS b) S ® A. A

A ® a | bb A ® B | BA

9. Доказать, что грамматика с правилами:

порождает язык L = {a n b n c n | n >= 1}. Для этого показать, что в данной грамматике

1) выводится любая цепочка вида a n b n c n (n >= 1) и

2) не выводятся никакие другие цепочки.

10. Дана грамматика с правилами:

a) S ® S0 | S1 | D0 | D1 b) S ® if B then S | B = E

D ® H. E ® B | B + E

H ® 0 | 1 | H0 | H1 B ® a | b

Построить восходящим и нисходящим методами дерево вывода для цепочки:

a) 10.1001 b) if a then b = a+b+b

11. Определить тип грамматики. Описать язык, порождаемый этой грамматикой. Написать для этого языка КС-грамматику.

P ® 1P1 | 0P0 | T

12. Построить регулярную грамматику, порождающую цепочки в алфавите
{a, b}, в которых символ a не встречается два раза подряд.

13. Написать КС-грамматику для языка L, построить дерево вывода и левосторонний вывод для цепочки aabbbcccc.

L = {a 2 n b m c 2 k | m=n+k, m>1}.

14. Построить грамматику, порождающую сбалансированные относительно круглых скобок цепочки в алфавите { a, (,), ^ }. Сбалансированную цепочку a определим рекуррентно: цепочка a сбалансирована, если

a) a не содержит скобок,

b) a = (a 1) или a= a 1 a 2 , где a 1 и a 2 сбалансированы.

15. Написать КС-грамматику, порождающую язык L, и вывод для цепочки aacbbbcaa в этой грамматике.

L = {a n cb m ca n | n, m>0}.

16. Написать КС-грамматику, порождающую язык L, и вывод для цепочки 110000111 в этой грамматике.

L = {1 n 0 m 1 p | n+p>m; n, p, m>0}.

17. Дана грамматика G. Определить ее тип; язык, порождаемый этой грамматикой; тип языка.

18. Дан язык L = {1 3n+2 0 n | n>=0}. Определить его тип, написать грамматику, порождающую L. Построить левосторонний и правосторонний выводы, дерево разбора для цепочки 1111111100.

19. Привести пример грамматики, все правила которой имеют вид
A ® Bt, либо A ® tB, либо A ® t, для которой не существует эквивалентной регулярной грамматики.

20. Написать общие алгоритмы построения по данным КС-грамматикам G1 и G2, порождающим языки L1 и L2, КС-грамматики для

Замечание: L =L1 * L2 - это конкатенация языков L1 и L2, т.е.L = { ab | a Î L1, b Î L2}; L = L1 * - это итерация языка L1, т.е. объединение {e} È L1 È L1*L1 È L1*L1*L1 È ...

21. Написать КС-грамматику для L={w i 2 w i+1 R | i Î N, w i =(i) 2 - двоичное представление числа i, w R - обращение цепочки w}. Написать КС-грамматику для языка L * (см. задачу 20).

22. Показать, что грамматика

E ® E+E | E*E | (E) | i

неоднозначна. Как описать этот же язык с помощью однозначной грамматики?

23. Показать, что наличие в КС-грамматике правил вида

c) A ® aA | Ab | g

где a, b, g Î (VTÈVN) * , A Î VN, делает ее неоднозначной. Можно ли преобразовать эти правила таким образом, чтобы полученная эквивалентная грамматика была однозначной?

*24. Показать, что грамматика G неоднозначна. Какой язык она порождает? Является ли этот язык однозначным?

G: S ® aAc | aB

25. Дана КС-грамматика G={VT, VN, P, S}. Предложить алгоритм построения множества

X={A Î VN | A Þ e}.

26. Для произвольной КС-грамматики G предложить алгоритм, определяющий, пуст ли язык L(G).

27. Написать приведенную грамматику, эквивалентную данной.

a) S ® aABS | bCACd b) S ® aAB | E

A ® bAB | cSA | cCC A ® dDA | e

B ® bAB | cSB B ® bE | f

C ® cS | c C ® cAB | dSD | a

28. Язык называется распознаваемым, если существует алгоритм, который за конечное число шагов позволяет получить ответ о принадлежности любой цепочки языку. Если число шагов зависит от длины цепочки и может быть оценено до выполнения алгоритма, язык называется легко распознаваемым. Доказать, что язык, порождаемый неукорачивающей грамматикой, легко распознаваем.

29. Доказать, что любой конечный язык, в который не входит пустая цепочка, является регулярным языком.

30. Доказать, что нециклическая КС-грамматика порождает конечный язык.

Замечание: Нетерминальный символ A Î VN - циклический, если в грамматике существует вывод A Þ x 1 Ax 2 . КС-грамматика называется циклической, если в ней имеется хотя бы один циклический символ.

31. Показать, что условие цикличности грамматики (см. задачу 30) не является достаточным условием бесконечности порождаемого ею языка.

32. Доказать, что язык, порождаемый циклической приведенной КС-грамматикой, содержащей хотя бы один эффективный циклический символ, бесконечен.

Замечание: Циклический символ называется эффективным, если A Þ aAb, где |aAb| > 1; иначе циклический символ называется фиктивным.

ЭЛЕМЕНТЫ ТЕОРИИ ТРАНСЛЯЦИИ

Введение.

В этом разделе будут рассмотрены некоторые алгоритмы и технические приемы, применяемые при построении трансляторов. Практически во всех трансляторах (и в компиляторах, и в интерпретаторах) в том или ином виде присутствует большая часть перечисленных ниже процессов:

à лексический анализ

à синтаксический анализ

à семантический анализ

à генерация внутреннего представления программы

à оптимизация

à генерация объектной программы.

В конкретных компиляторах порядок этих процессов может быть несколько иным, некоторые из них могут объединяться в одну фазу, другие могут выполнятся в течение всего процесса компиляции. В интерпретаторах и при смешанной стратегии трансляции некоторые этапы могут вообще отсутствовать.

В этом разделе мы рассмотрим некоторые методы, используемые для построения анализаторов (лексического, синтаксического и семантического), язык промежуточного представления программы, способ генерации промежуточной программы, ее интерпретации. Излагаемые алгоритмы и методы иллюстрируются на примере модельного паскалеподобного языка (М-языка). Все алгоритмы записаны на Си.

Информацию о других методах, алгоритмах и приемах, используемых при создании трансляторов, можно найти в .

Описание модельного языка

P ® program D1; B^

D1 ® var D {,D}

D ® I {,I}: [ int | bool ]

B ® begin S {;S} end

E ® E1 [ = | < | > | != ] E1 | E1

E1 ® T {[ + | - | or ] T}

T ® F {[ * | / | and ] F}

F ® I | N | L | not F | (E)

L ® true | false

I ® C | IC | IR

C ® a | b | ... | z | A | B | ... |Z

R ® 0 | 1 | 2 | ... | 9

Замечание:

a) запись вида {a} означает итерацию цепочки a, т.е. в порождаемой цепочке в этом месте может находиться либо e, либо a, либо aa, либо aaa и т.д.

b) запись вида [ a | b ] означает, что в порождаемой цепочке в этом месте может находиться либо a, либо b.

c) P - цель грамматики; символ ^ - маркер конца текста программы.

Контекстные условия:

1. Любое имя, используемое в программе, должно быть описано и только один раз.

2. В операторе присваивания типы переменной и выражения должны совпадать.

3. В условном операторе и в операторе цикла в качестве условия возможно только логическое выражение.

4. Операнды операции отношения должны быть целочисленными.

5. Тип выражения и совместимость типов операндов в выражении определяются по обычным правилам; старшинство операций задано синтаксисом.

В любом месте программы, кроме идентификаторов, служебных слов и чисел, может находиться произвольное число пробелов и комментариев вида {< любые символы, кроме } и ^ >}.

True, false, read и write - служебные слова (их нельзя переопределять, как стандартные идентификаторы Паскаля).

Сохраняется паскалевское правило о разделителях между идентификаторами, числами и служебными словами.

Лексический анализ

Рассмотрим методы и средства, которые обычно используются при построении лексических анализаторов. В основе таких анализаторов лежат регулярные грамматики, поэтому рассмотрим грамматики этого класса более подробно.

Соглашение: в дальнейшем, если особо не оговорено, под регулярной грамматикой будем понимать леволинейную грамматику.

Напомним, что грамматика G = (VT, VN, P, S) называется леволинейной , если каждое правило из Р имеет вид A ® Bt либо A ® t, где A Î VN, B Î VN, t Î VT.

Соглашение: предположим, что анализируемая цепочка заканчивается специальным символом ^ - признаком конца цепочки .

Для грамматик этого типа существует алгоритм определения того, принадлежит ли анализируемая цепочка языку, порождаемому этой грамматикой (алгоритм разбора ):

(1) первый символ исходной цепочки a 1 a 2 ...a n ^ заменяем нетерминалом A, для которого в грамматике есть правило вывода A ® a 1 (другими словами, производим "свертку" терминала a 1 к нетерминалу A)

(2) затем многократно (до тех пор, пока не считаем признак конца цепочки) выполняем следующие шаги: полученный на предыдущем шаге нетерминал A и расположенный непосредственно справа от него очередной терминал a i исходной цепочки заменяем нетерминалом B, для которого в грамматике есть правило вывода B ® Aa i (i = 2, 3,.., n);

Это эквивалентно построению дерева разбора методом "снизу-вверх": на каждом шаге алгоритма строим один из уровней в дереве разбора, "поднимаясь" от листьев к корню.

При работе этого алгоритма возможны следующие ситуации:

(1) прочитана вся цепочка; на каждом шаге находилась единственная нужная "свертка"; на последнем шаге свертка произошла к символу S. Это означает, что исходная цепочка a 1 a 2 ...a n ^ Î L(G).

(2) прочитана вся цепочка; на каждом шаге находилась единственная нужная "свертка"; на последнем шаге свертка произошла к символу, отличному от S. Это означает, что исходная цепочка a 1 a 2 ...a n ^ Ï L(G).

(3) на некотором шаге не нашлось нужной свертки, т.е. для полученного на предыдущем шаге нетерминала A и расположенного непосредственно справа от него очередного терминала a i исходной цепочки не нашлось нетерминала B, для которого в грамматике было бы правило вывода B ® Aa i . Это означает, что исходная цепочка a 1 a 2 ...a n ^ Ï L(G).

(4) на некотором шаге работы алгоритма оказалось, что есть более одной подходящей свертки, т.е. в грамматике разные нетерминалы имеют правила вывода с одинаковыми правыми частями, и поэтому непонятно, к какому из них производить свертку. Это говорит о недетерминированности разбора. Анализ этой ситуации будет дан ниже.

Допустим, что разбор на каждом шаге детерминированный.

Для того, чтобы быстрее находить правило с подходящей правой частью, зафиксируем все возможные свертки (это определяется только грамматикой и не зависит от вида анализируемой цепочки).

Это можно сделать в виде таблицы, строки которой помечены нетерминальными символами грамматики, столбцы - терминальными. Значение каждого элемента таблицы - это нетерминальный символ, к которому можно свернуть пару "нетерминал-терминал", которыми помечены соответствующие строка и столбец.

Например, для грамматики G = ({a, b, ^}, {S, A, B, C}, P, S), такая таблица будет выглядеть следующим образом:

Знак "-" ставится в том случае, если для пары "терминал-нетерминал" свертки нет.

Но чаще информацию о возможных свертках представляют в виде диаграммы состояний (ДС) - неупорядоченного ориентированного помеченного графа, который строится следующим образом:

(1) строят вершины графа, помеченные нетерминалами грамматики (для каждого нетерминала - одну вершину), и еще одну вершину, помеченную символом, отличным от нетерминальных (например, H). Эти вершины будем называть состояниями . H - начальное состояние.

(2) соединяем эти состояния дугами по следующим правилам:

a) для каждого правила грамматики вида W ® t соединяем дугой состояния H и W (от H к W) и помечаем дугу символом t;

б) для каждого правила W ® Vt соединяем дугой состояния V и W (от V к W) и помечаем дугу символом t;

Диаграмма состояний для грамматики G (см. пример выше):

Алгоритм разбора по диаграмме состояний:

(1) объявляем текущим состояние H;

(2) затем многократно (до тех пор, пока не считаем признак конца цепочки) выполняем следующие шаги: считываем очередной символ исходной цепочки и переходим из текущего состояния в другое состояние по дуге, помеченной этим символом. Состояние, в которое мы при этом попадаем, становится текущим.

При работе этого алгоритма возможны следующие ситуации (аналогичные ситуациям, которые возникают при разборе непосредственно по регулярной грамматике):

(1) прочитана вся цепочка; на каждом шаге находилась единственная дуга, помеченная очередным символом анализируемой цепочки; в результате последнего перехода оказались в состоянии S. Это означает, что исходная цепочка принадлежит L(G).

(2) прочитана вся цепочка; на каждом шаге находилась единственная "нужная" дуга; в результате последнего шага оказались в состоянии, отличном от S. Это означает, что исходная цепочка не принадлежит L(G).

(3) на некотором шаге не нашлось дуги, выходящей из текущего состояния и помеченной очередным анализируемым символом. Это означает, что исходная цепочка не принадлежит L(G).

(4) на некотором шаге работы алгоритма оказалось, что есть несколько дуг, выходящих из текущего состояния, помеченных очередным анализируемым символом, но ведущих в разные состояния. Это говорит о недетерминированности разбора . Анализ этой ситуации будет приведен ниже.

Диаграмма состояний определяет конечный автомат, построенный по регулярной грамматике, который допускает множество цепочек, составляющих язык, определяемый этой грамматикой. Состояния и дуги ДС - это графическое изображение функции переходов конечного автомата из состояния в состояние при условии, что очередной анализируемый символ совпадает с символом-меткой дуги. Среди всех состояний выделяется начальное (считается, что в начальный момент своей работы автомат находится в этом состоянии) и конечное (если автомат завершает работу переходом в это состояние, то анализируемая цепочка им допускается).

Определение: конечный автомат (КА)

F - отображение множества K ´ VT ® K, определяющее поведение автомата; отображение F часто называют функцией переходов;

H Î K - начальное состояние;

S Î K - заключительное состояние (либо конечное множество заключительных состояний).

F(A, t) = B означает, что из состояния A по входному символу t происходит переход в состояние B.

Определение: конечный автомат допускает цепочку a 1 a 2 ...a n , если F(H,a 1) = A 1 ; F(A 1 ,a 2) = A 2 ; . . . ; F(A n-2 ,a n-1) = A n-1 ; F(A n-1 ,a n) = S, где a i Î VT, A j Î K,
j = 1, 2 , ... ,n-1; i = 1, 2, ... ,n; H - начальное состояние, S - одно из заключительных состояний.

Определение: множество цепочек, допускаемых конечным автоматом, составляет определяемый им язык .

Для более удобной работы с диаграммами состояний введем несколько соглашений:

a) если из одного состояния в другое выходит несколько дуг, помеченных разными символами, то будем изображать одну дугу, помеченную всеми этими символами;

b) непомеченная дуга будет соответствовать переходу при любом символе, кроме тех, которыми помечены другие дуги, выходящие из этого состояния.

c) введем состояние ошибки (ER); переход в это состояние будет означать, что исходная цепочка языку не принадлежит.

По диаграмме состояний легко написать анализатор для регулярной грамматики.

Например, для грамматики G = ({a,b, ^}, {S,A,B,C}, P, S), где

анализатор будет таким:

#include

enum state {H, A, B, C, S, ER}; /* множество состояний */

enum state CS; /* CS - текущее состояние */

FILE *fp;/*указатель на файл, в котором находится анализируемая цепочка */

fp = fopen ("data","r");

do {switch (CS) {

case H: if (c == "a") {c = fgetc(fp); CS = A;}

case A: if (c == "b") {c = fgetc(fp); CS = C;}

case B: if (c == "a") {c = fgetc(fp); CS = C;}

case C: if (c =="a") {c = fgetc(fp); CS = A;}

else if (c == "b") {c = fgetc(fp); CS = B;}

else if (c == "^") CS = S;

} while (CS != S && CS != ER);

if (CS == ER) return -1; else return 0;

О недетерминированном разборе

При анализе по регулярной грамматике может оказаться, что несколько нетерминалов имеют одинаковые правые части, и поэтому неясно, к какому из них делать свертку (см. ситуацию 4 в описании алгоритма). В терминах диаграммы состояний это означает, что из одного состояния выходит несколько дуг, ведущих в разные состояния, но помеченных одним и тем же символом.

Например , для грамматики G = ({a,b, ^}, {S,A,B}, P, S), где

разбор будет недетерминированным (т.к. у нетерминалов A и B есть одинаковые правые части - Bb).

Такой грамматике будет соответствовать недетерминированный конечный автомат.

Определение: недетерминированный конечный автомат (НКА) - это пятерка (K, VT, F, H, S), где

K - конечное множество состояний;

VT - конечное множество допустимых входных символов;

F - отображение множества K ´ VT в множество подмножеств K;

H Ì K - конечное множество начальных состояний;

S Ì K - конечное множество заключительных состояний.

F(A,t) = {B 1 ,B 2 ,...,B n } означает, что из состояния A по входному символу t можно осуществить переход в любое из состояний B i , i = 1, 2, ... ,n.

В этом случае можно предложить алгоритм, который будет перебирать все возможные варианты сверток (переходов) один за другим; если цепочка принадлежит языку, то будет найден путь, ведущий к успеху; если будут просмотрены все варианты, и каждый из них будет завершаться неудачей, то цепочка языку не принадлежит. Однако такой алгоритм практически неприемлем, поскольку при переборе вариантов мы, скорее всего, снова окажемся перед проблемой выбора и, следовательно, будем иметь "дерево отложенных вариантов".

Один из наиболее важных результатов теории конечных автоматов состоит в том, что класс языков, определяемых недетерминированными конечными автоматами, совпадает с классом языков, определяемых детерминированными конечными автоматами.

Это означает, что для любого НКА всегда можно построить детерминированный КА, определяющий тот же язык.

Министерство образования и науки

Российской Федерации

МОУ «Давыдовская СОШ с углубленным изучением отдельных предметов»

ВНИМАНИЕ К СЛОВУ

(реферат)

Выполнила:

ученица IX класса «А»

МОУ « Давыдовской СОШ с УИОП»

Шаталова Юлия

Научный руководитель:

ВВЕДЕНИЕ…………………………………………………………………………2

ПРОИСХОЖДЕНИЕ И УПОТРЕБЛЕНИЕ СЛОВ СОВРЕМЕННОГО

РУССКОГО ЯЗЫКА………………………………………………………………..3

ПРЕДСТАВЛЕНИЕ О СЛОВЕ…………………………………………...3-4

НАУКА О ПРОИСХОЖДЕНИИ СЛОВ…………………………………4-6

ИСКОННО РУССКИЕ СЛОВА…………………………………………..7-8

ИНОЯЗЫЧНЫЕ СЛОВА В РУССКОМ ЛИТЕРАТУРНОМ ЯЗЫКЕ….8-10

ИНТЕРНАЦИОНАЛЬНАЯ ЛЕКСИКА В СОВРЕМЕННОМ РУССКОМ

ЛИТЕРАТУРНОМ ЯЗЫКЕ……………………………………………….10-11

ЗАКЛЮЧЕНИЕ……………………………………………………………………….12

ЛИТЕРАТУРА………………………………………………………………………...13

ВВЕДЕНИЕ.

С самого раннего детства и до глубокой старости вся жизнь человека неразрывно связана с языком.

Ребенок еще не научился как следует говорить, а его чистый слух уже ловит журчание бабушкиных сказок, материнской колыбельной песенки. Но ведь сказки и прибаутки - это язык.

Подросток идет в школу. Юноша шагает в институт или в университет. Целое море слов, шумный океан речи подхватывает его там, за широкими дверями. Сквозь живые беседы учителей, сквозь страницы сотен книг впервые видится ему отраженная в слове необъятно-сложная Вселенная. Через слово он впервые узнает о том, чего еще не видели его глаза. В звучном слове развертываются перед ним льяносы Ориноко, сверкают айсберги Арктики, шумят водопады Африки и Америки. Раскрывается огромный мир звездных пространств; зримыми становятся микроскопические космосы молекул и атомов.

Новый человек роднится с древними мыслями, с теми, что сложились в головах людей за тысячелетия до его рождения. Сам он обретает возможность обращаться к правнукам, которые будут жить спустя века после его кончины. И все это только благодаря языку.

Все, что люди совершают в мире действительно человеческого, совершается при помощи языка. Нельзя без него работать согласованно, совместно с другими. Без его посредства немыслимо ни на шаг двинуть вперед науку, технику, ремёсла, искусство - жизнь.

«Если бы каждый член человеческого рода не мог изъяснить своих понятий другому, - говорил когда-то великий помор Ломоносов, - то бы не токмо лишены мы были согласного общих дел течения, которое соединением разных мыслей управляется, но и едва бы не хуже ли были мы диких зверей, рассыпанных по лесам и по пустыням!»

Когда мы говорим «язык», мы думаем: «слова». Это естественно: язык состоит из слов, тут спорить не о чем.

Но мало кто представляет себе по-настоящему, каково оно, самое простое и обычное человеческое слово, каким неописуемо тонким и сложным творением человека оно является, какой своеобразной (и во многом еще загадочной) жизнью живет, какую неизмеримо огромную роль играет в судьбах своего творца - человека.

Если в мире есть вещи, достойные названия «чуда», то слово, бесспорно, первая и самая чудесная из них.

Услышав, что оно устроено сложнее и хитроумнее, чем наиболее усовершенствованный механизм, что оно «ведет себя» иной раз причудливее и непонятнее любого живого существа, вы, пожалуй, сочтете это поэтическим преувеличением. А на деле все сказанное во много раз бледнее действительности. Чтобы убедиться в этом, начнем с самого простого и вместе с тем, может быть, самого сложного - с «многозначности» слова.

ПРОИСХОЖДЕНИЕ И УПОТРЕБЛЕНИЕ СЛОВ СОВРЕМЕННОГО РУССКОГО ЯЗЫКА.

ПРЕДСТАВЛЕНИЕ О СЛОВЕ.

Наука о языке привыкла оперировать понятием «слово». Однако швейцарский языковед первой половины XX в. Шарль Балли (1865-1947) справедливо писал: «Понятие слова обычно считается ясным; на деле же это одно из наиболее двусмысленных понятий, которые встречаются в языкознании ». Попытки дать строгое определение слова в науке последнего столетия наталкивались на очень большие препятствия. Любое более или менее чёткое определение слова в чём-то расходилось с традицией или языковой интуицией носителей языка. Некоторые лингвисты, особенно в США, пытались обойтись вообще без понятия «слово», но этот подход ещё больше противоречит нашей интуиции. Любой носитель языка, даже неграмотный, имеет некоторое осознанное или неосознанное представление о слове. Такие представления отразились и в лингвистических традициях.

При этом в разных традициях представление о слове не вполне одинаково. В европейской традиции отражено представление о слове как о достаточно сложной структуре. Наука последних трёх-четырёх исков выработала представление о том, что слово членится на значимые части: корни, приставки, суффиксы, окончания. Однако античная традиция эти части не выделяла, слово (кроме составного вроде благоговении) считалось нечленимой единицей (за исключением членения на звуки, моры и слоги).

У арабов и индийцев слово также выступало как сложная единица. Однако жёсткая структура арабского корня требовала выделить корень как особую единицу, отличную от слова: слово состоит из корня, его огласовки (подобной словоизменению у греков) и «добавок» - прежде всего суффиксов. Поэтому в арабской традиции выделялись две главные единицы: слово и корень. Особо выделялся корень и у индийцев. Иногда даже считают, что понятия «корень», «суффикс» и т. д. пришли в европейскую науку в XVI-XVII ив. с Востока.

Иначе представляли себе слово в дальневосточных традициях. Несколько упрощая, можно считать, что в японском языке окончания (суффиксы словоизменения) не отграничиваются от служебных слов. В качестве знаменательного слова понимается то, что в русском языке называется основой слова (корень или корень вместе с суффиксами). Если бы по-японски описывался русский язык, то считалось бы, что в последовательности на столиках слов не два, а три: на, столик, ах. Но член предложения здесь всего один. С точки зрения японцев, предложение состоит не из слов, а из более сложных единиц.

Наконец, в Китае «цзы» - это не только иероглиф и слог, но и слово. Именно «цзы» заносилось в словари. Конечно, «цзы» как словарная единица обладала значением. В современном языке помимо значительно большего количества многосложных заимствований есть и сложные слова, состоящие из нескольких корней. Однако, как показывают психологические опыты, для языкового сознания даже современного китайца эти сложные слова скорее воспринимаются как нечто вроде русских фразеологизмов (железная дорога, детский сад). Чисто грамматические элементы трактуются как служебные («пустые») слова, поэтому в китайской традиции не было необходимости различать слово и корень.

Итак, во всех традициях было понятие «слово», но свойства этой единицы могли не совпадать. Вероятно, и сходства, и различия традиций здесь отражают некоторую объективную реальность, которую невозможно прямо наблюдать. Понятие «слово» по своей природе психологично. В мозгу человека хранятся готовые «блоки», из которых по определённым правилам строится речь. Эти «блоки» не должны быть ни слишком краткими (тогда бы усложнились правила построения речи), ни слишком длинными (иначе перегружалась бы память). Можно предположить, что оптимальная «средняя» единица хранения - слово.

Помимо нашей интуиции и анализа традиций на это заключение наталкивает и анализ речевых расстройств, в частности вызванных травмами, связанными с повреждениями отдельных участков мозга. Во время Великой Отечественной войны такие травмы изучал выдающийся психолог Александр Романович Лурия (1902-1977). Вот попытка одного из раненых передать содержание фильма: «Одесса! Жулик! Туда... учиться... море... во... во-до-лаз! Арме-на... па-роход... пошло... ох! Батуми ! Барышня... Эх! Ми-ли-ци-о-нер... Эх!.. Знаю!.. Кас-са! Денег. Эх!.. Папиросы». Очевидно, у этого человека не повреждён участок мозга, где хранятся слова, но нарушен механизм построения предложения. Лурия описал и другое расстройство речи, при котором, наоборот, предложения строятся правильно, но повреждён участок мозга, связанный с хранением слов, из-за чего словарь очень обеднён, слова заменяются междометиями или словами с самым общим значением. Таким образом, разные элементы языка существуют в мозгу раздельно. Поэтому реальная речь неизмеримо сложнее, чем просто комбинация слов.

Итак, слово - это прежде всего единица, хранящаяся в памяти человека. Собственно лингвистические свойства слова могут быть и не во всем одинаковыми, что отражается в разных традициях.

НАУКА О ПРОИСХОЖДЕНИИ СЛОВ

Происхождение слов изучает наука которая называют этимологией. Это один из древнейших и один из интереснейших отделов языкознания. Основателями его были древнегреческие философы, в трудах которых появился и сам термин этимология, составленный из двух греческих слов: etumon, что значит «истина», и 1оgos, что значит «слово, учение». То есть сначала этимологией называли учение об истине, об истинном значении слов.

С развитием науки о языке менялись цели и методы этимологических исследований. В современном языкознании перед ученым, который занимается этимологическим анализом, стоят такие задачи:

во-первых, он находит, когда и где (в каком именно языке и диалекте) появилось слово;

во-вторых, устанавливает, из каких частей, по какому образцу оно создано;

в-третьих, определяет древнейшее значение слова.

Например, установлено, что слово копейка появилось в русском языке в XVI в. Оно было образовано от прилагательного копейный и обозначало имевшую хождение тогда серебряную монету с изображением царя, сидевшего на коне с копьем в руке - копейную деньгу.

Этимология, например, объясняет родство таких слов, как огород - изгородь и город. Городом первоначально называли только укрепление, крепостную городскую стену (ср. московский Китай-город др.). Оказывается, что эти слова родственны английскому garden, которые обозначают «сад».

Этимология слова уводит исследователя буквально в глубь веков, когда не было еще письменности; она рассказывает о жизни народов, давно исчезнувших, о древних культурных связях между народами.

Чтобы показать разнообразие методов этимологического анализа и материалов, с которыми приходится иметь дело специалистам-этимологам, приведем для примера несколько этимологии старых и сравнительно новых cлов.

Луна и месяц. Оба этих слова очень древние, общеславянские. Слово месяц с давних пор применялось для обозначения не только небесного светила, но и отрезка времени, который определялся в соответствии с фазами этого небесного светила. У слова месяц, как показывают этимологические исследования,- тот же корень, что и в глаголе мерить, в существительном мера.

По поводу происхождения слова луна высказываются различные мнения. Некоторые ученые считают, например, что луна имеет общий корень со словом луч.

В современном русском языке слова луна и месяц, хотя и являются синонимами, однако различаются по своему употреблению. Так, в литературном языке небесное светило принято называть луной (особенно если речь идет о Луне как об объекте наблюдения или исследования) : «Обратная сторона Луны», «Полет к Луне» и т. д. Слово месяц в этом значении употребляется преимущественно в народно-разговорной и поэтической речи (вспомните название песни - «Светит месяц», поговорку «Как молодой месяц»).

Одно из ранних стихотворений Пушкина называется «Месяц». Любопытно, что начинается оно так:

Зачем из облака выходишь,

Уединенная луна,

И на подушки, сквозь окна,

Сиянье тусклое наводишь?

А заканчивается то же самое стихотворение такими строками:

Зачем ты, месяц, укатился

И в небе светлом утонул?

Зачем луч утренний блеснул?

Зачем я с милою простился?

Месяц, кроме того, имеет значение отрезка времени в 30 дней. Слово луна, как известно, в этом смысле не употребляется.

Разграничиваются по употреблению синонимы луна и месяц в устойчивых, образных выражениях. Например , мы говорим с луны свалился - о человеке, который проявляет неосведомленность, не знает чего-либо, известного всем. Мы говорим также под луной, что значит «в этом мире», «на земле». Заменить слово луна на слово месяц в этих выражениях невозможно.

Этимология - сложная наука. Хорошим этимологом стать трудно. Но и люди, далёкие от науки, любят искать истоки слова, правда, обычно их интересуют связи семантические, смысловые. Под воздействием такой народной этимологии нередка сближаются далёкие друг от друга слова. Например, учёные знают, что предок слова оплеуха - глагол плевать (когда-то бойцы перед кулачным боем имели привычку плевать на руки). А может показаться, что оно связано со словом ухо. Такое толкование - народная этимология.

Народная этимология может пересилить реальную историю слова. Так, слово свидетель мы связываем с видеть, понимая его в значении "очевидец" (тот, кто видел своими глазами). Первоначально же оно было образовано от глагола ведети "знать" (сравните: украинское слово сведка или белорусское сведок в том же значении).

О происхождении слов можно узнать в этимологических словарях, где кратко сообщается их этимология - происхождение и история в языке. Существует ряд этимологических словарей, например: «Этимологический словарь русского языка» А. Преображенского «Этимологический словарь русского языка» М. Фасмера, «Краткий этимологический словарь русского языка» и др.

ИСКОННО РУССКИЕ И ИНОЯЗЫЧНЫЕ СЛОВА

На всем протяжении своего развития русский язык существенно изменялся. Перестроились его фонетическая система, морфологический и синтаксический строй. Лексический состав языка пополнялся новыми словами, а некоторые слова перестали употребляться. Изменения в лексике происходили и происходят в связи с изменениями в обществе. Из века в век развивалась общественная, экономическая и культурная жизнь русского народа, появлялись новые орудия труда, машины, средства связи и передвижения, материалы, улучшался быт людей, появлялись новые предметы домашнего обихода, новые виды одежды и обуви, предметы культуры и т. д. Для называния предметов сохранялись древние русские слова и создавались новые русские слова на базе уже имеющихся слов в результате разных способов русского словообразования . Эти слова составляют пласт исконно русской лексики современного русского языка.

В результате политических, торгово-экономических и культурных контактов происходил и происходит торговый, культурный, научный взаимообмен, а следовательно, и проникновение иноязычных слов, которые пополняли и пополняют словарный состав русского языка. Например, в памятниках письменности встречаются с XIV в. заимствованные слова караул (из тюркского), грош (из польского), ковыль (из тюркского); с XV в.- сельдь (из древне-исландского), барсук (из тюркского); с XVI в.- аптека (из польского), аршин (из татарского); с XVII в.- гавань (из голландского), грунт (из польского); с XVIII в.-акация (из немецкого), газета (из итальянского), крендель (из немецкого); с XIX в.- бублик (из украинского), бинт (из немецкого), анкета (из французского), керосин (из английского); в XX в.- радар (из английского), робот (из чешского), акваланг (из английского) и мн. др. Названные слова составляют иноязычный по происхождению пласт лексики современного русского языка.

Процесс пополнения новых слов в языке двумя путями - на базе уже имеющихся слов и путем заимствования из других языков - закономерное явление во всех языках, в том числе в русском.

ИСКОННО РУССКИЕ СЛОВА

Русский язык относится к славянской группе языков. Родственными ему являются живые восточнославянские языки - украинский и белорусский; западнославянские - польский, кашубский, чешский, словацкий, лужицкий; южнославянские - болгарский, македонский, сербскохорватский, словенский; мертвые- старославянский (южнославянский), полабский и поморский (западнославянские).

Задолго до нашей эры на территории между Днепром и Вислой обособились племена славян, у которых сложился свой общеславянский язык.

К V-VI вв. в среде славян, к тому времени значительно расширивших свою территорию, обособились три группы: южная, западная и восточная. Обособление групп славянских племен сопровождалось распадом общеславянского языка на самостоятельные языки.

Восточнославянский (древнерусский) язык - это язык обособившейся восточной группы славянских племен.

С VII по IX в. складывалось, а с IX до начала XII в. существовало восточнославянское (древнерусское) государство - Киевская Русь. Население Киевской Руси говорило на близких друг другу говорах восточнославянского (древнерусского) языка.

В XII-XIII вв. Киевская Русь расчленилась на отдельные княжества. Восточнославянский (древнерусский) язык дал начало трем языкам - русскому, украинскому и белорусскому. (В основном они обособились уже к XIV в.)

На северо-восточных окраинах Киевской Руси в XIV в. начало создаваться государство Московская Русь, население которого говорило на складывающемся русском языке, В эпоху Московского государства и в последующие эпохи русский язык - это язык только одной из трех восточнославянских народностей.

Исконно русские слова делятся на: 1) общеславянские, 2) восточнославянские (древнерусские) и 3) собственно русские.

Общеславянские (борода, бровь, бедро, голова, губа, горло и др.) и восточнославянские (древнерусские) слова (багор, вдосталь, веревка, ежевика и др.) русский язык унаследовал из общеславянского и восточнославянского (древнерусского) языка. С XIV в. в русском языке стали появляться собственно русские слова (беседка, заблудиться, кочегар, ополчение и др.). В настоящее время собственно русские слова составляют значительный пласт лексики современного русского языка.

Собственно русские слова создавались на базе общеславянских, восточнославянских (древнерусских) слов и заимствованных слов. Например, в XVI в. из польского языка было заимствовано слово аптека. На основе этого слова в русском языке возникло прилагательное аптечный по правилам русского словопроизводства. Этого слова нет в польском языке. Слово аптечный является собственно русским словом.

Ученые, определяя происхождение исконно русских слов, сравнивают во всех славянских языках значение и произношение слов, обозначающих одни и те же предметы, явления, признаки, действия. Общеславянскими будут те слова, которые окажутся во всех или в большинстве славянских языков, причем среди этих языков обязательно должны быть если не все, то хотя бы часть каждой из трех групп славянских языков (восточной, южной, западной). Если окажется, что слова имеются, например, только в болгарском, сербскохорватском, македонском и словенском языках , то это южнославянские слова; если в русском, украинском и белорусском, то это восточнославянские (древнерусские) слова. Если слова имеются только в одном из языков, то это уже собственные образования того или иного славянского языка, например русского.

ИНОЯЗЫЧНЫЕ СЛОВА В РУССКОМ ЛИТЕРАТУРНОМ ЯЗЫКЕ

Иноязычные слова появляются в русском языке как под влиянием внешних (неязыковых), так и внутренних (языковых) причин.

Внешние причины - это различные связи между народами. Так, в X в. Киевская Русь приняла христианство от греков. В связи с этим в древнерусский язык вместе с заимствованными культовыми идеями вошло много греческих слов. Были заимствованы и научные термины, названия предметов греческой культуры, названия растений, месяцев и т. д., например: идея, комедия, трагедия, история, магнит, алфавит , синтаксис, грамматика, планета, климат, физика, музей, театр, сцена, кукла, вишня , мята, мак, огурец, свекла, кедр, январь, февраль, декабрь и др.

В этот же период на востоке и юго-востоке наши предки вступали в контакты с тюркскими племенами - печенегами, половцами. С XIII по XV в. Древняя Русь находилась под ордынским игом. В результате этого в русском языке, по подсчетам ученых, укоренилось около 250 тюркских слов. К ним. относятся, например, такие слова: колчан, юрта, арба, сундук, кабан, аркан, тарантас, башмак, войлок, армяк, колпак, кушак, тулуп, шаровары, каблук, лапша, хан, ярлык, топчан.

Особенно интенсивно проникали в русский язык иноязычные слова в XVIII в. Административные и военные преобразования, проведенные Петром I в России, сблизили ее с западноевропейскими государствами. Появилось много административных, военных (особенно морских), музыкальных терминов, терминов изобразительного, театрального искусства, названий новых предметов быта, одежды, например: лагерь, мундир, ефрейтор, орден, солдат, офицер, рота, штурм, штык, штаб, кухня, бутерброд, вафля, фарш, галстук, картуз (из немецкого языка); капитан, сержант, авангард , артиллерия, марш, манеж, атака, брешь, батальон, салют, гарнизон, блиндаж , сапер, десант, эскадра, кашне, костюм, жилет, пальто, браслет, мебель, комод, кабинет, буфет , люстра, абажур , гардина, мармелад, крем (из французского языка); гавань, фарватер, бухта , киль, койка, флаг, верфь , док, кабель, рея, трал, вымпел, каюта, матрос, руль, шлюпка, рейд (из голландского языка); док, яхта, мичман (из английского языка); мольберт, флейта, гастроль (из немецкого языка); партер, пьеса, актер, суфлер, антракт, сюжет, балет, жанр (из французского языка); бас, мандолина, тенор, ария, браво, ложа, опера (из итальянского языка).

Внутренние причины - это потребности развития лексической системы языка, которые заключаются в следующем:

1. Устранение многозначности исконно русского слова, упрощение его смысловой структуры. Так появились слова импорт, экспорт вместо многозначных исконно русских ввоз, вывоз. Слова импорт, экспорт стали обозначать «ввоз», «вывоз», связанные с международной торговлей .

2. Уточнение или детализация соответствующего понятия. Например, в русском языке было слово варенье, которым называлось и жидкое, и густое варенье. Чтобы отличить густое варенье из фруктов или ягод, представляющее собой однородную массу, от жидкого варенья, в котором могли сохраниться целые ягоды, густое варенье стали называть английским словом джем. Так же возникли слова репортаж (при исконно русском рассказ), тотальный (при исконно русском всеобщий), хобби (при исконно русском увлечение), комфорт (при исконно русском удобство), сервис (при исконно русском обслуживание) и др.

3. Замена наименований, выраженных словосочетаниями, одним словом. Таким путем появились многие исконно русские слова, например: столовая комната - столовая; мостовая улица - мостовая; электрический поезд -электричка и т. д. Но в ряде случаев исконно русских слов для замены словосочетаний одним словом не оказывалось. Например, для замены словосочетания меткий стрелок более всего подошло заимствованное слово снайпер. Так появились, например, слова мотель - «гостиница для автотуристов», спринтер - «бегун на короткие дистанции».

В современном русском языке различают три типа иноязычных слов: 1) заимствованные слова; 2) экзотические слова (экзотизмы); 3) иноязычные вкрапления.

Заимствованные слова.- это такие иноязычные слова, которые полностью вошли в лексическую систему русского языка. Они приобрели лексическое значение, фонетическое оформление, грамматические признаки, свойственные русскому языку, употребляются в различных стилях, пишутся буквами русского алфавита.

Экзотические слова также усвоили грамматические свойства русского языка и пишутся буквами русского языка. Однако экзотизмы отражают особенности жизни какого-либо народа (не русского) и употребляются в специфических контекстах, когда речь идет о своеобразии его быта, местности, этнографических особенностях. Экзотизмами являются, например, слова аксакал - «уважаемый человек, старшина», арык - «канал», мэр - «глава городского управления», прерия - «обширная степь в Северной Америке» и т. п.

Если заимствуется предмет, идея, экзотизмы могут перейти в разряд заимствованных слов и стать общеупотребительными. Например, экзотизмом было слово хоккей, но когда эта игра у нас широко распространилась, слово хоккей стало общеупотребительным.

Иноязычные вкрапления отличаются от двух первых групп тем, что передаются на письме в том же написании, которое им свойственно в передающем языке. В устной речи иноязычные вкрапления передаются в том же фонетическом и морфологическом оформлении, в каком они были в передающем языке.

Иноязычные вкрапления ни в толковые, ни в этимологические словари не включаются. Отдельные из них помещены в приложении к «Словарю иностранных слов». Наиболее полно иноязычные вкрапления собраны и в специальном «Словаре иноязычных выражений и слов, употребляющихся в русском языке без перевода» .

Иноязычные слова пополняют лексику языка. В этом их большая положительная роль. Однако обильное и без надобности употребление иностранных слов затрудняет общение. Нужно осторожно использовать иностранные слова, не употреблять их без надобности и пользоваться прежде всего русскими словами, если - они обозначают то же, что и иностранные.

О происхождении заимствованных слов в русском языке краткие сведения сообщаются в толковых словарях с помощью указания на язык-источник. В словарях иностранных слов указывается язык-источник и раскрывается лексическое значение этого слова в передающем языке, а более подробные сведения о заимствованных словах даются в этимологических словарях: в них, помимо языка-источника или языка-посредника, указывается время заимствования, смысловые и грамматические изменения, происшедшие на почве русского языка, например:

Краткий этимологический словарь русского языка

Абзац.

Школьный словарь иностранных слов

Абзац.

В русском языке преобладают славянские слова. Но так же, как и в других языках, славянский язык соединился с иностранными элементами. Это слова греческие, татарские, латинские, немецкие, французские. Некоторые из них, испытав легкие изменения, стали совершенно русскими, и их невозможно отбросить.

ИНТЕРНАЦИОНАЛЬНАЯ ЛЕКСИКА В СОВРЕМЕННОМ РУССКОМ ЛИТЕРАТУРНОМ ЯЗЫКЕ

Культурные контакты с другими народами обогатили наш язык большим количеством слов и словообразовательных элементов. Многие из этих элементов достались нам в наследство от. древних греков и римлян и используются в основном в сфере науки, искусства, техники и политики. Желательно знать эти элементы «в лицо»: при таком знании даже новые для читателя слова могут быть освоены гораздо легче. Например: планета, магнит, театр, климат, демократия, деспот, автономия (из древнегреческого); авторитет , арена, глобус, депутат, доктор, циркуль, демонстрация, агитация, агрессия (из латинского).

Эти и подобные слова вошли в другие европейские языки, будучи оформленными в соответствии с фонетическими и морфологическими нормами этих языков. Так, слово революция по-немецки будет (ди революцион), по-английски (э рeволюшн), по-французски (ла револьсьон), по-чешски (революцэ).

Слова, заимствованные из греческого и латинского языков, существующие в ряде неродственных языков (в трех и более), называются интернациональными словами или и нтернационализмами. Такие слова во всех языках имеют общность в значении.

Основную массу интернациональных слов составляют специальные слова науки, техники, литературы, искусства, а также общественно-политическая лексика, например: атом, идея, космос, биология, трактор, шасси, культура, литература, трагедия, музыка.

В настоящее время в связи с бурным развитием ряда наук идет процесс создания новых специальных слов (терминов) как в русском, так и в других языках. Для их образования широко используются греческие и латинские основы и словообразующие элементы, например: авто (греч.), авиа (лат.), био (греч.), ген (греч.), фон (греч.). Практика создания терминов на базе мертвых древнегреческого и латинского языков стала международной. Например, слова телефон, телеграф, аэростат и др. не имеют живого источника заимствования.

Интернациональные слова могут создаваться не только на основе лексики одного из указанных языков. Нередко берется основа одного языка, а словообразующий элемент другого языка или используются обе основы из разных языков. Так образовано, например, слово автомобиль: первая часть авто - «сам» из греческого языка, вторая мобиль - «движение» из латинского.

Приобщать школьников к этимологии могут не только учителя-словесники, но и преподаватели всех предметов. Обогатить лексический запас, пробудить интерес к значению и происхождению терминов помогает совместное составление терминологических словариков с кратким толкованием слов, включающих международные словообразовательные элементы.

Приведем пример такого словарика:

дем (греческое демос - «народ») - демократия, демократический; демагогия;

крат (греческое кратос - «власть») - демократия,

аристократия, технократия;

косм (греческое космос - «вселенная») - космонавт,

космический;

лог (греческое логос - «слово, понятие, учение») - геология, биология, филология, физиология;

метр (греческое метрон - «мера») - сантиметр, геометрия, планиметрия;

микро (греческое микрос - «маленький») - микроскоп, микроэлемент, микрофон;

моно (греческое монос - «один») - монополия, моно-дог;

оним (греческой оннма - «имя») - синоним, антоним, омоним , псевдоним, топоним;

скоп (греческое снопео - «смотрю») - микроскоп, телескоп, калейдоскоп, стереоскоп;

теле (греческое теле - «далеко») - телефон, телеграф, телевидение, телескоп;

цирк (латинское циркулюс-«круг») - циркуль,-циркуляция, циркулировать.

Этот маленький словарь, конечно, не исчерпывает того круга иноязычных словообразовательных элементов, которые должны входить в активный лексический багаж школьников.

Активное владение русскими и интернациональными морфемами дает возможность понимать многие слова, пришедшие в наш словарь из других языков, и глубже, полнее и точнее понимать слова родного языка.

ЗАКЛЮЧЕНИЕ

Когда говорят о языке, имеют в виду прежде всего слова. Без знания слов, притом большого их количества, нельзя знать язык, пользоваться им. Это особенно ясно видно при изучении иностранных языков . Если вы изучили звуковой состав чужого языка и его грамматику, но у вас бедный словарный запас, вы знаете мало слов, вы никогда не сможете понимать этот язык, читать и тем более говорить на нем. Конечно, одни слова без знания звукового состава и грамматического строя языка также не обеспечивают владения языком, так как только сочетание этих трех элементов составляет язык. Однако именно знание большого количества слов и умение ими пользоваться определяет степень владения языком. Вот почему слово является важнейшим элементом языка.

Знание большого количества слов, правильное их употребление важно не только при изучении иностранных языков. Оно необходимо и в родном языке, в языке, на котором мы говорим с детства. Неверно было бы думать, что
все люди, говорящие по-русски, для которых русский язык родной, говорят одинаково, пользуются одними и теми же словами. Запас слов у разных людей различен. В известной мере он характеризует степень культуры человека.
Учеными подсчитано, что запас слов среднего человека, говорящего по-русски, 3 - 4 тысячи слов, запас слов большого писателя, например Пушкина, 21 тысяча слов. Вспомните «высказывания» одного из персонажей романа Ильфа и Петрова «Двенадцать стульев» - «людоедки Эллочки»,которая изъяснялась всего 30 словами! Чем же объясняется такая разница? Различием в образовании, в условиях жизни, но, кроме этого, и разным отношением к языку. Усвоение слов родного языка отчасти происходит чисто механически, бессознательно. Человек, как губка, впитывает слова родного языка, так как он с детства окружен людьми, говорящими на этом языке.

Мы с детства усваиваем вместе со словами родного языка действующие в языке законы построения (образования) слов. Это дает нам возможность вместо механического запоминания тысяч и тысяч слов сознательно подойти к языку, постичь его тайны и научиться им пользоваться как умным и удобным орудием.

ЛИТЕРАТУРА

, Беседы о русском слове Изд.»Знание», Москва 1976

Как делаются слова Изд. академия наук, Москва 1963

Хрестоматия Русские писатели о языке ГУПизд. Ленинград 1955

Л. Успенский Слово о словах Изд. «Детская литература» 1982

Русское слово Изд. «Просвещение» Москва 1991

Энциклопедия для детей Языкознание. Русский язык. Т10 Аванта Москва 2002

Поскольку мы знаем, что язык невозможен вне общества, то становится очевидным, что именно общество и заставляет язык изменяться.

А если точнее, то изменения, происходящие в обществе, затрагивают и язык, заставляя его изменяться.
А если рассуждать более обобщёнными категориями, то можно сказать, что заставляет язык изменяться время.

Язык – развивающееся явление

«Язык – это история народа. Язык – это путь цивилизации и культуры...
Поэтому-то изучение и сбережение русского языка является не праздным занятием от нечего делать, но насущной необходимостью» .
(Александр Иванович Куприн)

Н.В. Гоголь сказал о языке, что он «живой, как жизнь». Сказал он это о русском языке, но сказанное можно отнести к любому языку. Кроме, конечно, мёртвых языков. О том, почему они стали мёртвыми – немного позже.
Изменения в языке очевидны. Достаточно прочитать произведения писателей XVIII в., и мы увидим, как сильно изменился наш язык за прошедшее время.
Русская письменность, которая была разработана в середине IX в. братьями-просветителями Кириллом и Мефодием, началась с кириллицы.
И только в XVIII в. она претерпела сильное изменение.

Петровская реформа языка

«Обращаться с языком кое-как – значит, и мыслить кое-как: приблизительно, неточно, неверно».
(Алексей Николаевич Толстой)

Поль Деларош «Портрет Петра I»

Пётр I начал преобразования в государстве, целью которых было не только создание новых армии, флота, государственного управления, промышленности, но и создание новой культуры. В 1710 г. Пётр I утвердил новый алфавит с упрощённым начертанием букв, а церковнославянский шрифт остался для печатания церковной литературы. Были упразднены «кси» и «пси» и другие буквы. Эти сугубо греческие буквы даже стояли не на своём исходном месте, они при создании алфавита были вынесены в конец, т.к. были не характерны для русского языка.
Разделение алфавита на церковный и гражданский говорило о том, что отныне в обществе противопоставлено светское и духовное: церковнославянский язык и церковный шрифт обслуживают старую культуру, а русский язык и гражданский шрифт обслуживают новую светскую культуру.
Инициатива введения гражданского шрифта принадлежала Петру, а вся подготовка языковой реформы проходила под непосредственным его наблюдением. На первом издании Азбуки 29 января 1710 г. рукою Петра написано: «Сими литеры печатать исторические и манифактурныя книги. А которыя подчернены [зачёркнутые Петром кириллические буквы], тех [в] вышеписанных книгах не употреблять».
Отрицая греческие формы в языке, Пётр I ориентировался на латинский шрифт, как и вообще на западную культуру.
В это время в русский язык вошли 4,5 тысячи новых слов, заимствованных из европейских языков.

Гражданский шрифт

«Славяно-российский язык, по свидетельствам самих иностранцев-эстетов, не уступает латинскому ни в мужестве, греческому ни в плавности, превосходит все европейские языки: итальянский, испанский и французский, не говоря уже о немецком».
(Гавриил Романович Державин)

Итак, гражданский шрифт был введён в России Петром I в 1708 г. для печати светских изданий.
«... Петр поручил кому-то составить образец гражданской азбуки и отправить его в Амстердам для вылития там нового шрифта. В 1707 г. прибывший из Голландии словолитец Антон Демей привез с собой «новоизобретенных русских литер 8 азбуки с пунсонами, матрицами и формами...». Шрифт, введенный Петром Великим, разнился от славянского тем, что в нем вовсе исключены буквы откинуты надсточные знаки.

Надстрочные знаки - в церковнославянском языке специальные знаки, заимствованые из греческого, которые ставились над строкой для обозначения разных типов ударения ́ ̀ ̑ и придыхания ̛ , а также титло ҃ - знак над сокращенно написанным словом или буквой, употребленной в числовом значении.

Написание с использованием титла слова «Господь»

А вот так выглядело кириллическое числительное «один»

Остальные буквы получили начертание, какое они имеют ныне, с следующими исключениями: буква д сначала походила на латинскую g, прописная же сохранила прежнюю форму; вместо введен был латинский s; вместо - одна буква I без всякого вверху знака; - как латинские m, n; буквы ц, ф, ъ и ь, а также р, щ и ы имели в очертании некоторые отличия от нынешних. Этим-то шрифтом напечатаны были в 1708 г. в Москве три книги: «Геометрiа славенскi землемерiе иѕдадеся новотiпографским тiсненiем», «Прiклады како пiшутся комплементы» и «Кнiга о способах творящiх водохожденiе рекъ свободное». Но, вероятно, опыт убедил, что шрифт этот не совсем удобен, а потому в «Побеждающей крепости к счастлïвому поздравлению славноï победы над Азовымъ ï к счастлïвому въезд в Москву» (соч. инженера Боргсдорфа), напечатанном в том же 1708 г., сделаны уже уступки, напоминающие прежнюю азбуку: в книге являются славянские над ï стоят везде точки – начертание, которое сохранилось в нашей печати чуть ли не до начала текущего столетия, тогда же введены над словами силы (ударения). В 1709 г. последовали дальнейшие изменения. Появились Э и И, восстановлена; И употреблялось в трех случаях: в сочетании двух и (ïи), в начале русских слов и в конце слов. Тогда же з (земля) стала употребляться во всех случаях, вместо отмененного ѕ (зело); д получило современное начертание; ь, ц, ф, т, п получили очертания, более подходящие к нынешним». Были и другие изменения.

«При преобразовании кириллицы обращено было внимание только на форму букв. Преобразование церковной азбуки для гражданской печати ограничилось почти единственно упрощением и округлением начертаний букв, сближением их с латинскими буквами. Но звуковые особенности языка, к которому их применяли, совершенно упущены были из виду. Вследствие этого наше правописание приняло преобладающий исторический или этимологический характер.
Культурное значение гражданской азбуки чрезвычайно велико: введение ее составляло первый шаг к созданию народно-русского письменного языка» (из Энциклопедического словаря Брокгауза и Эфрона).

М.В. Ломоносов: Реформы русского литературного языка

«По отношению каждого человека к своему языку можно совершенно точно судить не только о его культурном уровне, но и о его гражданской ценности».
(Константин Георгиевич Паустовский)

Наиболее важные реформы русского литературного языка и системы стихосложения XVIII в. были сделаны Михаилом Васильевичем Ломоносовым. В 1739 г. он написал «Письмо о правилах российского стихотворства», в котором сформулировал принципы нового стихосложения на русском языке. Он утверждал, что вместо того, чтобы культивировать стихи, написанные по заимствованным из других языков схемам, необходимо использовать возможности русского языка. Ломоносов полагал, что можно писать стихи многими видами стоп: двусложными (ямб и хорей) и трёхсложными (дактиль, анапест и амфибрахий). Новаторство Ломоносова вызвало дискуссию, в которой активно участвовали Тредиаковский и Сумароков. В 1744 г. были изданы три переложения 143-го псалма, выполненные этими авторами, и читателям было предложено высказаться, который из текстов они считают лучшим.
И хотя В. Белинский назвал Ломоносова «Петром Великим нашей литературы», отношение к реформам Ломоносова не было однозначным. Их не одобрял и Пушкин.
Но, кроме вклада в поэтический язык, Ломоносов был также автором научной русской грамматики. В этой книге он описал богатства и возможности русского языка: «Карл пятый, римский император, говаривал, что ишпанским с богом, французским – с друзьями, немецким – с неприятельми, итальянским – с женским полом говорить прилично. Но если бы он российскому языку был искусен, то, конечно, к тому присовокупил бы, что им со всеми оными говорить пристойно, ибо нашел бы в нем великолепие ишпанского, живость французского, крепость немецкого, нежность италиянского, сверх того богатство и сильную в изображениях краткость греческого и латинского языка». Более подробно познакомиться с учением о трёх штилях Ломоносова можно . О вкладе Ломоносова в русскую литературу – .

Создателем современного литературного языка считается Александр Сергеевич Пушкин, произведения которого являются вершиной русской литературы, хотя со времени создания его крупнейших произведений прошло уже более 200 лет. В языке за это время произошло много существенных изменений. Если сравнить язык Пушкина и язык современных писателей, то здесь мы увидим много стилистических и иных различий. Сам же Пушкин считал, что в формировании русского литературного языка первостепенную роль сыграл Н.М. Карамзин: он «освободил язык от чуждого ига и возвратил ему свободу, обратив его к живым источникам народного слова».

Реформы идут за языком или язык подчиняется реформам?

«Нет в русском языке ничего осадочного или кристаллического; всё волнует, дышит, живет».
(Алексей Степанович Хомяков)

На этот вопрос можно уверенно ответить: реформы идут за языком. Создаётся такая языковая ситуация, когда становится очевидным: надо законодательно что-то менять. Чаще всего реформы опаздывают и не успевают за языком.
Например, до начала XIII в. буквы Ь и Ъ обозначали звуки: [Ь] произносился примерно как [Э], а [Ъ] – как [O]. Затем эти звуки исчезли, и буквы не обозначают звуков, а играют лишь грамматическую роль.

Орфографическая реформа языка 1918 года

«Как материал словесности, язык славяно-русский имеет неоспоримое превосходство перед всеми европейскими».
(Александр Сергеевич Пушкин)

К началу XX в. назрела новая реформа языка – орфографическая. Она долго обсуждалась и готовилась под председательством А. А. Шахматова. Основная её задача была в упрощении правописания.
В соответствии с реформой:
из алфавита исключались буквы Ѣ (ять), Ѳ (фита), І («и десятеричное»); вместо них должны употребляться, соответственно, Е, Ф, И;
исключался твёрдый знак (Ъ) на конце слов и частей сложных слов, но сохранялся в качестве разделительного знака (подъём, адъютант);
изменялось правило написания приставок на з/с: теперь все они (кроме собственно с-) кончались на с перед любой глухой согласной и на з перед звонкими согласными и перед гласными (разбить, разораться, разступиться → разбить, разораться, но расступиться);
в родительном и винительном падежах прилагательных и причастий окончание -аго после шипящих заменялось на -его (лучшаго → лучшего), во всех остальных случаях -агозаменялось на -ого, а -яго на -его (например, новаго → нового, ранняго → раннего), в именительном и винительном падежах множественного числа женского и среднего родов -ыя, -ія - на -ые, -ие (новыя (книги, изданія) → новые);
словоформы женского рода множественного числа онѣ, однѣ, однѣхъ, однѣмъ, однѣми заменялись на они, одни, одних, одним, одними;
словоформа родительного падежа единственного числа ея (нея) - на её (неё) (из Википедии).
В последних пунктах реформа затрагивала не только орфографию, но и орфоэпию и грамматику. В документах орфографической реформы 1917-1918 гг. ничего не говорилось о судьбе редкой и выходившей из практического употребления ещё до 1917 года буквы Ѵ (ижицы); на практике после реформы она окончательно исчезла из алфавита.
Реформа сократила количество орфографических правил, привела к некоторой экономии при письме и типографском наборе, исключив Ъ на конце слов, устранила из русского алфавита пары полностью омофоничных графем (Ѣ и Е; Ѳ и Ф; І, Ѵ и И), приблизив алфавит к реальной фонологической системе русского языка.
Но время шло, и появились новые проблемы несоответствия проблем графики и написания. Да и реформа 1918 г. не устранила полностью уже существовавшие проблемы.
Периодически в жизнь языка вторгались и что-то в нём изменяли. Вот например:
в 1918 г. наряду с «ъ» стали употреблять апостроф ("). На практике употребление апострофа было повсеместным.

В 1932-1933 гг. были отменены точки в конце заголовков.

В 1934 г. было отменено употребление дефиса в союзе «то есть».
В 1935 г. отменяются точки в написании аббревиатур из заглавных букв.
В 1938 г. отменено употребление апострофа.
В 1942 г. введено обязательное употребление буквы «ё».
В 1956 г. употребление буквы «ё» (уже по новым правилам) стало факультативным, для уточнения правильного произношения («вёдро»).
Но всё-таки самые большие изменения затрагивают словарный состав языка.

Изменения словарного состава

«Дивишься драгоценности нашего языка: что ни звук, то и подарок: все зернисто, крупно, как сам жемчуг, и, право, иное названье еще драгоценней самой вещи».
(Николай Васильевич Гоголь)

Причины изменения словарного состава любого языка те же, что и причины изменения языка вообще.
Состав языка пополняется за счёт новых слов. В каждый исторический период приходят новые слова. Сначала они являются неологизмами, но постепенно становятся общеупотребительными, а затем могут и устареть – всё течёт, всё меняется. Например, когда-то слово «электростанция» было неологизмом, но прошло несколько десятков лет – и слово стало общеупотребительным.
Неологизмы (новообразованные и заимствованные) бывают как общеязыковые, так и авторские.
Вот пример авторских неологизмов: М. В. Ломоносов обогатил русский литературный язык словами «атмосфера», «вещество», «градусник», «равновесие», «диаметр», «огнедышащие» (горы), «удельный» (вес) и др.
А слова «промышленность», «трогательный», «занимательный» ввёл в русский язык Н. М. Карамзин. «Головотяп, головотяпство» – неологизмы М. Е. Салтыкова-Щедрина и т.д.
Другие слова, наоборот, устаревают. И здесь тоже разные причины: исчезает явление – исчезает из повседневного употребления слово. И хотя в словаре оно существует, но становится историзмом. К примеру, слово «кафтан». Бывает и по-другому: предмет или явление само по себе не исчезло, но его название устарело – это архаизм: длань (ладонь), вечор (вчера), лепота (красота) и др.
Иногда уже исчезнувшее из обихода слово вдруг выплывает на поверхность и становится снова общеупотребительным, например, слово «господа́».
А иногда старое слово получает новое значение, как, например, слово «перестройка».

Заимствования

«Я не считаю хорошим и пригодным иностранные слова, если только их можно заменить чисто русскими или более обруселыми. Надо беречь наш богатый и прекрасный язык от порчи».
(Николай Семенович Лесков)

В разные периоды нашей истории заимствования происходили из разных языков: в эпоху Наполеона всё светское русское общество предпочитало общаться на французском языке.
Очень много говорят и спорят о неоправданных сейчас заимствованиях с английского языка. Впрочем, и о заимствованиях из французского говорили так же.
Вот у Пушкина читаем:

Она казалась верный снимок
Du comme il faut... Шишков, прости:
Не знаю, как перевести.

Дело, конечно, не в переводе, а в том, что французский язык стал для аристократов того времени гораздо родней, чем родной.
Сторонники английских заимствований считают, что этими самыми заимствованиями наш язык обогащается. В каком-то смысле да, но есть и отрицательные стороны заимствований, особенно бездумных. Ведь часто человек употребляет новое для него слово просто потому, что вокруг все так говорят. А что оно означает – понимает не совсем или совсем не понимает. Много заимствований «офисных»: менеджер, маркетинг, мерчендайзер, клининг и т.д.
Иногда эти «обогащения» просто уродуют наш язык, они не соответствуют внутренним закономерностям русского языка.
Да, язык – это живое явление. А всё живое меняется и развивается. Неизбежно меняется и язык. Но во всём надо знать меру. И если в русском языке есть синонимы иностранного слова, то лучше всё-таки пользоваться родным словом, а не чужим, отбрасывать весь языковой «мусор». Например, зачем нам это непонятное слово «клининг»? Ведь в переводе с английского это слово означает «уборка». Всего лишь! Для чего же нужны такие слова в нашем языке? Если только для вычурности или чтобы щегольнуть иностранным словом...
Наш язык настолько богат и гибок, что всему у него найдётся своё название.
«Как ни говори, а родной язык всегда останется родным. Когда хочешь говорить по душе, ни одного французского слова в голову нейдёт, а ежели хочешь блеснуть, тогда другое дело».
(Лев Николаевич Толстой)

Мёртвый язык. Почему он таким становится?

Мёртвый язы́к – это язык, не существующий в живом употреблении. Часто он известен только по письменным памятникам.
Почему язык становится мёртвым? По разным причинам. Например, один язык заменяется другим или вытесняется другим в результате завоевания страны колонизаторами. Например, наиболее популярным иностранным языком в Алжире, Тунисе и Марокко является французский язык, а в Египте и странах Персидского залива (ОАЭ, Кувейт, Оман) таковым является английский язык. Многие исконные американские языки были вытеснены английским, французским, испанским и португальским языками.
Иногда мёртвые языки, перестав служить средством живого общения, сохраняются в письменной форме и используются для нужд науки, культуры, религии. Например, латинский язык является мёртвым, но именно он считается предком современных романских языков. И в настоящее время он используется наукой (медициной и др.) и католической церковью.
Древнерусский язык – тоже мёртвый язык, но от него получили развитие современные восточнославянские языки.
Иногда мёртвый язык вдруг оживает. Так случилось, например, с ивритом. Он возрождён и адаптирован как разговорный и официальный язык государства Израиль в XX в.

Иногда представители немногочисленных народов сами отказываются от изучения национальных языков, отдавая предпочтение государственному языку страны, в которой они живут. По некоторым источникам, около половины малых национальных языков в России находится на грани исчезновения. А в Непале большинство населения изучает и использует не свой родной язык, а английский.