Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Корпус: инструмент или идеология?




Вопрос о роли корпусных данных в лингвистических исследованиях получил продолжение в статье В.А. Плунгяна [2008], в которой обсуждается общее состояние современной лингвистики (в первую очередь — русистики) и влияние на нее современных электронных корпусов (в первую очередь — НКРЯ). Следует сразу сказать, что во многих отношениях акценты в этой статье расставлены значительно более четко, нежели в статье Н.В. Перцова. Автор прекрасно отдает себе отчет в том, что внимание к реальным текстам (т. е. фактически к корпусу) всегда являлось неотъемлемой частью «традиционной» лингвистики (он упоминает в связи с этим описания «мертвых языков», в частности классическую филологию, исследования в области «языка писателя» и «виноградовскую школу» в отечественном языкознании [Плунгян 2008: 13]). Впрочем, некоторым преувеличением (или, может быть, чрезмерным обобщением) является его утверждение касательно сложившейся практики преподавания лингвистических дисциплин: «Лингвистам со студенческой скамьи объясняли, что, конечно, они видят перед собой тексты, но не тексты являются для них по-настоящему важными: минуя их, они должны перейти к более значимому объекту — к системе правил, по которым эти тексты строятся, — и рассуждать об этой системе, а не о текстах, “реконструируя” ее на основе текстов» [Плунгян 2008: 9]. Вспомним, что в отечественной практике преподавания всегда были сильны позиции «виноградовской школы», в рамках которой призыв «миновать тексты» никак не мог встретить сочувствия. Да и сама идея, что можно каким-то образом «миновать тексты», плохо вяжется с идеей, что правила «реконструируются» именно на основе текстов. Можно добавить, что в течение некоторого времени весьма распространенной претензией, высказываемой «традиционными» лингвистами по адресу ряда структуралистских работ или исследований в духе генеративной грамматики, было именно указание на то, что их авторы оперируют немногочисленными искусственными примерами, игнорируя все богатство языкового материала, который представлен в реальных текстах; очевидно, что необходимость опираться на тексты воспринималась как данность. И, скажем, отечественная академическая лексикография строилась на основе картотеки примеров, которая извлекалась методом сплошной выборки из довольно представительной совокупности текстов. Кроме того, преимущественное внимание к корпусу текстов было не чуждо и некоторым направлениям структурализма. Так, одним из основных методов американской дескриптивной лингвистики был дистрибутивный анализ, для которого характерен так называемый «дешифровочный» подход к языку (см., напр., статью Ю.Д. Апресяна в «Лингвистическом энциклопедическом словаре» [Апресян 1990]). Сущность же «дешифровочного» подхода как раз и заключается в том, что предполагается, что в распоряжении лингвиста нет ничего, кроме корпуса текстов и набора универсальных процедур (играющих роль лингвистической теории), позволяющих автоматически получить описание данного языка (как он представлен в корпусе). Именно в работах представителей этого подхода и стало активно использоваться слово «корпус» по отношению к массиву текстов.

Все сказанное иллюстрирует мысль, что постановка корпуса в фокус лингвистического исследования отнюдь не является новацией последнего времени. Собственно, и В.А. Плунгян это признает и говорит, что корпусно-ориентированный подход «в некоторых чертах сближается с традиционной “доструктуралистской” филологией» и что современная лингвистика «во многом вернулась к тому, что декларировалось в XIX веке, а потом было забыто или отброшено» [Плунгян 2008: 13]. Правда, в связи с этим он поминает классическую филологию и предложенное А.А. Зализняком описание языка древненовгородских берестяных грамот, а также разнообразные исследования «языка писателя» и «виноградовскую» школу — то, что едва ли может быть причислено к филологии XIX в., впоследствии «забытой и отброшенной». Более того, перечисляя «идеологические предпочтения», которые, как он считает, характерны «для нового взгляда на задачи теоретической лингвистики», он не скрывает, что эти предпочтения выявились несколько десятков лет назад. Список таких «идеологических предпочтений» включает в его изложении следующие пять пунктов:

(1) «Внимание не к слову или к предложению, а к тексту, или, как теперь чаще говорят, к дискурсу — то есть к реальному инструменту коммуникации в целом, а не к его отдельным фрагментам» [Плунгян 2008: 9]. В.А. Плунгян признает, что эта тенденция «обозначилась еще в 1970‑е гг.», но настаивает на том, что в последнее время она «проявляется более интенсивно» [Плунгян 2008: 9]. Здесь можно было бы заметить, что «лингвистика текста» начала складываться еще в 1960‑е гг., что само слово «дискурс» как раз в самое последнее время стало несколько выходить из моды, что исследование текста (или дискурса) не противоречит вниманию к отдельным его фрагментам, напр. «дискурсивным словам» или средствам, обеспечивающим связность текста. Но, кроме того, говорить об утрате интереса к слову как единице языка и связывать это с широким распространением корпусно-ориентированных исследований весьма странно, учитывая, что большинство корпусов (и, в частности, НКРЯ) в высокой степени «словоцентрично»: в центре поиска находится именно слово, обладающее теми или иными характеристиками. Что же касается до внимания к целостному тексту, то как раз такие проблемы, как, скажем, описание языковых средств, организующих композицию текста, решать, обращаясь к корпусу, довольно затруднительно.

(2) «Внимание к квантитативному аспекту языка» [Плунгян 2008: 9]. Здесь В.А. Плунгян говорит, что этот подход характерен для школы Дж. Байби, хотя его элементы «мы находим еще у Гринберга в 1960‑е гг.» [Плунгян 2008: 9] и даже приводит в сноске цитату из Н.С. Трубецкого, в которой указывается на необходимость изучения статистических закономерностей в морфологии и морфонологии. Можно было бы добавить, что идея изучения статистических закономерностей в лингвистике получила распространение с конца 1940‑х гг.; классический закон Ципфа был сформулирован в 1949 г. и вскоре вошел в большинство учебников по общему языкознанию (см., напр., знаменитый учебник Дж. Лайонза «Введение в теоретическую лингвистику» [Lyons 1969]); в 1960‑е гг. стали публиковаться частотные словари, и с тех пор внимание «к квантитативному аспекту языка» устойчиво присутствует в лингвистике, хотя, как кажется, не составляет mainstream.

(3) «Внимание к синхронной вариативности языка» [Плунгян 2008: 10]. В.А. Плунгян сам пишет, что эта тенденция «обозначилась еще в середине XX в. с возникновением социолингвистики и других дисциплин этого круга» [Плунгян 2008: 10]. Можно добавить, что представление о синхронной вариативности языка всегда было очевидно, скажем, для диалектологов; но и при описании литературного стандарта учитывалось региональное варьирование (так, для русского языка с давних пор говорилось о различии петербургского и московского произношения). А в качестве некоторой крайности иногда указывалось, что каждый носитель языка обладает собственным идиолектом (сам термин «идиолект» вытекает из признания этого факта), так что лингвист, являющийся одновременно носителем языка, может ограничиться описанием собственного идиолекта; при таком подходе контрпримеры, в том числе почерпнутые из корпуса, могут отвергаться со словами «а в моем идиолекте это невозможно». Как бы то ни было, признание синхронной вариативности языка никак не вытекает из ориентированности на корпусные данные.

(4) «Внимание к диахронической вариативности языка, т. е. признание того факта, что язык постоянно изменяется во времени и полностью отвлечься от этой нестабильности невозможно» [Плунгян 2008: 10]. Вообще говоря, внимание к диахронической вариативности языка никак не является новацией последнего времени: работы по историческому языкознанию всегда составляли важную часть лингвистических исследований. Правда, из текста ясно, что речь идет о необходимости учета диахронии в синхронном описании; В.А. Плунгян даже пишет, что «“строго синхронное описание” языка является иллюзией» [2008: 10]. Действительно, представление о необходимости учитывать историческую изменчивость языка в синхронном описании пока не стала общим местом; однако она нередко декларировалась, и притом независимо от апелляции к корпусным данным. В.А. Плунгян сам упоминает [2008: 10] статью Поля Гарда, в которой предлагалось использовать métode bisynchronique для описания на первый взгляд противоречивых фактов языка. Сущность данного метода заключается в том, что такие факты описываются не в терминах «правил» и «исключений», а в терминах сосуществования в рамках единого синхронного среза двух систем: старой и новой. Можно добавить, что признание сосуществования «старшей» и «младшей» нормы стало почти общепринятым при описании норм русского литературного произношения — во всяком случае, именно этот прием используется в работах М.В. Панова и его последователей. Примечательно, что сам М.В. Панов видел в этом приеме как раз одно из средств строго разграничения синхронии и диахронии (см., в частности, его классическую книгу [Панов 1990]).

(5) «Изменение отношения к понятию языковой нормы и языковой правильности… более толерантное отношение к этим понятиям» [Плунгян 2008: 10]. В.А. Плунгян пишет, что граница «между “ошибкой” и “маргинальным вариантом”, а также между маргинальным вариантом и полноценным… признается гораздо более подвижной и зыбкой» [2008: 10]. Здесь некоторая неясность может быть связана с неоднозначностью понятия «нормы». В языкознании с давних пор утвердилось представление о лингвистике как дескриптивной (а не прескриптивной) науке (характерно название одного из разделов знаменитого «Введения в теоретическую лингвистику» Дж. Лайонза [Lyons 1969]: «Лингвистика — наука описательная, а не нормативная»). Это не отменяет понятия языковой ошибки, а также различия между ошибкой и «маргинальным вариантом». Так, если носители некоторого диалекта так реально говорят, пусть и относительно редко, мы имеем дело с «правильным» (для данного диалекта) языковым выражением; если же человек, не вполне овладевший данным диалектом, употребит форму, которую носители данного диалекта нормально не используют, имеет место ошибка.

Сказанное касается и понятия «литературной нормы». Скажем, если то или иное языковое выражение характеризуется в лингвистическом описании (напр., в словаре) как просторечное, это само по себе не делает описание прескриптивным. Такая характеристика может представлять собою констатацию того факта, что образованные носители языка (воспринимаемые как носители «литературной нормы») этого выражения не употребляют и ощущают его принадлежащим речи менее образованных носителей языка (воспринимаемых как носители «просторечия»). Тем самым наличие в описании «нормативных» характеристик вполне совместимо с дескриптивным характером описания.

Здесь мы подошли к моменту, который можно считать ключевым с точки зрения обсуждаемой в статье В.А. Плунгяна «корпусной идеологии». Если бы дело было только в том, чем являются отмеченные В.А. Плунгяном «идеологические предпочтения»: чем-то совсем новым, возникшим лишь в конце XX в., или же возвратом к традиции, или же (как представляется мне) никогда не прерывавшейся традицией, не стоило бы и вести дискуссию. Более важны вопросы о том, что является подлинным объектом изучения в лингвистике и каковы непосредственные данные, могущие служить материалом, на котором лингвист может делать свои выводы. И здесь, как кажется, В.А. Плунгян представляет позицию «докорпусной» лингвистики несколько неточно: в центр обсуждения ставится противопоставление «системы» и «узуса», и может создаться впечатление, что для «докорпусной» лингвистики объектом исследования является «система», реконструируемая на основе анализа материала, в роли которого выступает «узус». Разумеется, взгляды разных лингвистов на столь общие вопросы могут не совпадать, однако мне представляется, что значительно более распространенным является совсем другое представление, согласно которому непосредственную данность (которую и следует изучать) для описательной лингвистики составляет языковая компетенция носителей языка, т. е. их способность отличать правильные высказывания на данном языке от неправильных. Здесь нужны разного рода оговорки: следует принимать во внимание социальную изменчивость языка, индивидуальные различия между носителями, а главное — недискретность самого противопоставления правильных и неправильных высказываний. Именно для того, чтобы отразить эту недискретность, иногда вводится «шкала правильности» с промежуточными характеристиками (такими, как «сомнительно»). Однако именно понятие «правильных» (приемлемых с точки зрения носителя языка) высказываний находится в центре описательной лингвистики и делает возможным лингвистический эксперимент. Что касается корпусных данных, то они служат важным свидетельством того, что является «правильным» с точки зрения носителей языка: если некоторое языковое выражение устойчиво встречается в корпусе, то, скорее всего, носители языка воспринимают его как «правильное». В некоторых случаях это свидетельство приобретает особую важность: напр., при изучении разговорной речи (некоторые конструкции, не вызывающие возражений у носителей языка, когда они сталкиваются с такими выражениями в повседневной коммуникации, вызывают удивление у тех же самых носителей, будучи предъявленными в отрыве от контекста), или «мертвых языков», когда нет возможности непосредственно проверять языковую компетенцию носителя языка. Однако, как я уже отмечал в ответе Н.В. Перцову, даже исследуя «мертвые языки» или разговорную речь, лингвисты обычно сознают, что в материале могут встретиться и аномальные высказывания: случайные ляпсусы, приемы языковой игры, ошибки, связанные с недостаточным владением языком.

Вообще говоря, В.А. Плунгян учитывает возможность аномалий, появляющихся в реальных текстах. Он пишет [Плунгян 2008: ]: «…в корпусе могут встретиться окказиональные явления, да и просто ошибки, которые будут отвергнуты говорящими на данном языке при предъявлении им соответствующих образцов для оценки правильности / коммуникативной уместности», — но полагает: «…частотность таких явлений — если они окказиональные — будет крайне мала. Вместе с тем, “ошибка” (и, шире, любое отступление от того, что принято считать “нормой”), систематически фиксируемая в корпусе, — возможно, уже не ошибка и требует более внимательного к себе отношения». Собственно, презумпция, что ошибки не могут быть частотны (так что понятие «распространенной ошибки» попросту лишается смысла), является необходимой предпосылкой дешифровочного подхода и вынужденным образом принимается в тех случаях, когда у нас нет непосредственных сведений о языковых нормах. Однако в тех случаях, когда есть возможность обратиться к непосредственной компетенции носителя «нормы», желание отказаться от этого и ограничиться данными, представленными в корпусе, представляется несколько искусственным, своего рода интеллектуальной игрой. В этом случае мимо нашего внимания пройдет расхождение между языковой практикой и языковым сознанием — случаи, когда некоторое явление регулярно встречается в речи носителей литературного языка, однако неизменно воспринимается и характеризуется ими как отклонение от нормы, когда они оценивают подобные высказывания при специальном опросе (многочисленные примеры такого рода проанализированы в статье М.Я. Гловинской [1996]). Подход, не допускающий возможности частотных аномалий в корпусе, затрудняет и выявление случаев языковой игры, т. е. намеренно включаемых в речь языковых выражений, отклоняющихся от нормы. Языковая игра — явление довольно распространенное, и, кстати, именно языковой игрой я склонен объяснить отмеченную В.А. Плунгяном [2008: 19] частотность в корпусе ненормативных норм деепричастий на ‑мши (типа выпимши, соврамши, не спамши)[4].

Другой стороной подхода, ориентированного исключительно на корпусные данные, является отношение к языковым выражениям, отсутствующим или чрезвычайно редким в корпусе, как к не существующим в языке. Здесь В.А. Плунгян опять-таки признает [2008: 14], что в языке «могут существовать потенциально возможные явления, не отраженные в конкретном корпусе текстов», хотя полагает, что в случае «большого представительного корпуса сам факт отсутствия некоторого явления (пусть и потенциально возможного) всё равно значим» [Плунгян 2008: 15]. Однако далее он занимает гораздо более «крайнюю» позицию и, напр., говорит, что «морфология, отражающая данные корпуса, …исключает надежно прописанные в стандартной грамматике “потенциальные” (т. е. возможные лишь теоретически) формы» [Плунгян 2008: 18]. Однако отсутствие в корпусе может быть вызвано разными причинами. Сколь бы ни был представителен корпус, в нем неизбежно встретятся языковые единицы, имеющие лишь единичные вхождения (напр., редкие фамилии): при расширении корпуса число вхождений этих единиц может увеличиться, но появятся новые единицы, характеризующиеся лишь единичными вхождениями. В результате может оказаться, что, скажем, некоторая склоняемая фамилия представлена в корпусе лишь несколькими падежными формами; однако весьма странно было бы постулировать на этом основании неполноту парадигмы данной фамилии: «недостающие» формы при необходимости легко будут образованы носителем языка. Среди порядковых числовых сочетаний с последующим словом год в одном из падежей (такие сочетания чаще всего записываются не буквами, а иероглифами, т. е. цифрами), некоторые встречаются в НКРЯ сотни раз (напр., 1917, 1956, 1984, 2007), некоторые — десятки раз (по состоянию на осень 2009 г. к ним относились, напр., 2009 и 2011). В то же время некоторые сочетания не встретились вовсе (напр., 2079). Едва ли это что-то говорит нам о свойствах порядковых числовых сочетаний в современном русском языке.

Заметим, что предложение «отождествить понятия “существующего в языке” и “надежно засвидетельствованного в корпусе”», пусть и сделанное с некоторыми оговорками [Плунгян 2008: 16], остается не вполне проясненным. Что имеется в виду под выражением «надежно засвидетельствованное в корпусе»? Если некоторое языковое выражение или конструкция встретились в корпусе всего лишь несколько раз, является ли это достаточно «надежным» свидетельством? Как будто бы да, если учесть, что единичные примеры сочетаний тот он, который… и этот он, который… приведены в статье В.А. Плунгяна в качестве опровержения мнения синтаксистов, согласно которому такие сочетания невозможны. С другой стороны, призыв ориентироваться «на явления, лучше представленные в корпусе» [Плунгян 2008: 16], как будто предполагает, что явления, представленные в корпусе лишь единичными примерами, не очень-то показательны.

Мне представляется, что неясность во многом связана с тем, что, как уже говорилось, в статье В.А. Плунгяна излишнее внимание уделяется дихотомии системы и узуса, причем утверждается, что «именно узус — т. е. тексты — и является единственной подлинной реальностью науки о языке, т. е. объектом, доступным непосредственному наблюдению» [Плунгян 2008: 16]. Для мертвых языков это так. Что же касается живых языков, то, вообще говоря, ответы информантов на вопрос «Можно ли так сказать?» или «Что вы скажете в такой-то ситуации?» также доступны непосредственному наблюдению; другое дело, что они далеко не всегда дают ясную и непротиворечивую картину (так же, как, впрочем, и данные, которые можно почерпнуть их корпуса). Если же исследователь сам является носителем исследуемого языка, то его непосредственному наблюдению доступна его собственная языковая компетенция (такое наблюдение и называется интроспекцией). Ненадежность данных, полученных путем интроспекции, часто преувеличивается. Между тем «опасности» интроспекции не столь уж велики и при желании могут быть сведены к нулю.

Я надеюсь, что можно отвлечься от случаев прямой недобросовестности исследователя, когда он в угоду своим априорным представлениям об устройстве исследуемого фрагмента языковой системы объявляет неправильным некоторые реально используемые и (воспринимаемые остальными носителями языка как правильные) языковые выражения или, наоборот, включает в число правильных выражения, которые не будут приняты остальными носителями языка. Помимо того, что возможная недобросовестность вообще едва ли релевантна для общеметодологических рассуждений, можно заметить, что неадекватность полученного таким образом описания будет сразу очевидна. Конечно, исследователь может отвести контрпримеры указанием на то, что описывает лишь собственный идиолект, который в данном пункте не совпадает с идиолектами прочих носителей языка, но это в большинстве случаев будет восприниматься как слишком дешевый прием.

От такой недобросовестности следует отличать сознательную настройку собственного узуса (а вместе с ним и собственной языковой компетенции) на то, что данному человеку представляется «нормой». Такая настройка свойственна не только лингвистам, а даже в большей степени рядовым носителям языка, стремящимся «говорить правильно». В этом случае действительно может иметь место расхождение между представлениями о «правильном», получаемыми посредством интроспекции, и тем, как реально используется язык в корпусе. Однако случаи такого рода совершенно не подходят под описание ситуации, когда лингвист, вместо того чтобы изучать узус, описывает собственные априорные представления о «системе». Во-первых, стремление «говорить правильно» все же находит определенное отражение в узусе и тем самым составляет некоторую реальность, которая должна учитываться описанием. Во-вторых, даже если понимать «узус» статистически (как говорит большинство), в рассматриваемом случае мы имеем дело не с противопоставлением «системы» и «узуса», а с противопоставлением «нормы» и «узуса». Между тем эти противопоставления не только не совпадают, но даже не параллельны. Более того, в целом узус, пожалуй, более «системен», нежели норма: в качестве нормы часто в силу традиции закрепляется несистемное явление, тогда как узус подчиняется аналогии. Примеров, когда, напротив того, «норма» устанавливается из соображений системности весьма немного. Так, в качестве сравнительной степени прилагательного свежий грамматики указывают форму свежейший, поскольку, в соответствии с законами русской морфонологии, суффикс ‑айш- должен использоваться только после основ, оканчивающихся на заднеязычный, который при этом чередуется с шипящим (крепчайший, строжайший, величайший, тишайший и т. д.). При этом в живой речи активно используется «неправильная» форма свежайший. Однако примечательно, что в случаях такого рода нормативные пособия обычно стремятся учесть и «несистемный» распространенный вариант, если он не является исключительной принадлежностью просторечия (в частности, «Орфоэпический словарь русского языка» [Аванесов 1983] признает допустимым свежайший наряду с предпочтительной формой свежейший).

Что же касается до «системности», то я никак не вижу, чтобы в современной науке о языке наблюдался отход от нее в направлении узуса. На иной взгляд, самые впечатляющие результаты были достигнуты именно на путях системности (ср., напр., разрабатываемую в Московской семантической школе под руководством Ю.Д. Апресяна «системную лексикографию»). При этом «система» вовсе не понимается как некоторый особый объект исследования, противопоставленный узусу (или языковой компетенции носителей языка). Скорее это инструмент исследования или его результат — то, что предстоит выявить в результате скрупулезного анализа языковых данных. Некоторой карикатурой представляется описание «сторонников системного подхода», для которых «характерно недоверие к “экспериментальным” и “объективным” методам исследования материала, которые, с их точки зрения, мешают увидеть столь любимые ими “обобщения” (как правило, сформулированные уже до начала всякого исследования), затемняя их ненужными эмпирическими случайностями» [Плунгян 2088: 11]. По-видимому, надо понимать так, что «обобщение» сформулировано «до начала всякого исследования» в качестве гипотезы, подлежащей эмпирической проверке (иначе зачем вообще нужно исследование?), — но тогда откуда взяться «недоверию» к эмпирическим данным? Дальше о сторонниках «системного» подхода говорится: «Таким исследователям, как правило, вполне достаточно собственной интуиции…» [Плунгян 2008: 11].

Здесь мы, как кажется, попадаем в ловушку неоднозначности слова «интуиция». С одной стороны, интуиция — это один из способов познания мира, наряду с тремя другими: анализом эмпирических данных, логическими умозаключениями и божественным откровением. При этом божественное откровение обыкновенно не включается в число средств научного познания (хотя само по себе может быть объектом научного изучения — напр., в богословских науках). В науке обычно сочетается получение эмпирических данных (наблюдение и эксперимент), интуитивные предположения и логические рассуждения; но едва ли кто-то станет настаивать на интуиции как на единственном методе научного познания: нет никакой гарантии достоверности результатов, полученных исключительно посредством интуитивного прозрения. Здесь кажется уместно вспомнить замечание А.А. Зализняка [2004: 23] по поводу заявлений о том, что подлинность (или, напротив, поддельность) «Слова о полку Игореве» интуитивно ощущается «с первого же мгновения»: «…при всей ценности интуиции как инструмента познания, приходится признать, что в данном случае она открывает одним одно решение с такой же ясностью, как другим противоположное». С другой стороны, под «языковой интуицией» (или «языковым чутьем») часто понимают непосредственное знание языка, которым обладают его носители, т. е. языковую компетенцию. «Языковая интуиция» в таком понимании может рассматриваться как непосредственная данность при изучении живых языков. Когда Плунгян противопоставляет апелляции к интуиции опору на факты, почерпнутые из «узуса» [2008: 11], кажется, что он имеет в виду именно интуицию как языковую компетенцию и речь идет о двух типах языковых данных, на которые может ориентироваться лингвист: языковую компетенцию носителей языка (умение оценить правильность высказываний на данном языке) и сами высказывания, произведенные носителями языка. Однако при таком понимании «интуиция» не предполагает «обобщений», поскольку касается непосредственной оценки конкретных высказываний. Кроме того, непонятно, как опору на «интуицию» (в таком понимании) можно совместить с недоверием к эксперименту: трудно представить себе иные пути исследования такой «интуиции», нежели экспериментальные. Существуют различные способы получения доступа к «интуиции» носителей языка, и все они носят экспериментальный характер. Можно, добавляя или устраняя какие-то единицы из уже имеющихся высказываний, переставляя в них слова, заменяя какие-то языковые выражения на синонимичные и т. п., получить искусственно конструированные высказывания, предъявить их носителям языка и предложить оценить их правильность. Другой способ состоит в том, чтобы задать некоторую коммуникативную ситуацию и выяснить, какое высказывание могло бы быть в ней произведено. Те же самые методы применимы и в том случае, когда лингвист прибегает к интроспекции, т. е. сам становится собственным информантом. Заметим, что как раз опора на узус, если она становится единственным методом исследования, никак не предполагает экспериментальной проверки: в самом деле, зачем экспериментирование, если все необходимые данные уже содержатся в узусе и все исследование может быть сведено к обработке этих данных? Впрочем, само противопоставление представляется излишне жестким: едва ли не все действующие специалисты по живым языкам, действительно занимающиеся языком, а не предающиеся ни на чем не основанному теоретизированию, стремятся сочетать наблюдение над узусом и эксперимент, включающий работу с информантами и/или интроспекцию.

Все рассматриваемые общеметодологические вопросы могут обсуждаться (и действительно с давних пор обсуждались) независимо от существования корпусов текстов в электронной форме. Это наводит на мысль, что появление электронных корпусов ничего не изменило в методологии лингвистики, а роль электронных корпусов чисто количественная и сводится к облегчению поиска примеров, большей полноте охвата материала, появлению базы для более детального анализа статистических закономерностей. Все это составляет несомненное удобство для лингвистов, которое, однако, как уже говорилось, сопряжено с определенными соблазнами, поскольку может подталкивать к легковесным описаниям, замаскированным видимой основательностью иллюстративного материала. Можно также полагать, что доступность корпусных данных может привести к ориентации лингвистической моды на те исследования, которые могут опираться на материал корпуса.

Однако хотелось бы обратить внимание на некоторую особенность электронных корпусов, о которой упоминается в статье В.А. Плунгяна, но которая, как кажется, не попадает в ней в фокус внимания. Существенно, что все названные удобства, доставляемые использованием корпуса, обеспечиваются тем, что корпус снабжен системой поиска, которая включает разметку корпуса. Такая разметка (которая при большом объеме корпуса осуществляется автоматически с последующей ручной корректировкой) неизбежно ориентирована на существующие лингвистические описания, и тем самым поиск оказывается зависим от существующих представлений и концепций. В этом смысле как раз подход, ориентированный исключительно на поиск в корпусе, в большей степени подвержен риску подменить языковую реальность априорными представлениями о том, как должен быть устроен язык, нежели подход, использующий интроспекцию и языковую компетенцию носителей языка.

Однако здесь же таится и едва ли не самое значительное преимущество, которое может дать нам использование корпуса. Если обнаружится, что автоматическая разметка корпуса в каких-то случаях привела к контринтуитивным результатам, то можно допустить, что дело не в «обманчивости» интуиции, а в том, что представления, которые были положены в основу разметки, оказались неадекватными. Это открывает возможности корректировать существующие описания.

Для иллюстрации сказанного вспомню некоторую историю pro domo mea. Начиная с 1979 г. я преподавал различные лингвистические курсы из цикла «современный русский язык» в педагогическом институте и считал необходимым проверять все изучаемые утверждения на представительных массивах текстов (и давать эти тексты для анализа студентам). В какой-то момент, наткнувшись на фразу Я вам стольким обязан, я осознал, что форма стольким в этом высказывании не предусмотрена существующими грамматическими описаниями русского языка. Все они, включая «Грамматический словарь русского языка» А.А. Зализняка, в качестве единственно возможной формы творительного падежа для слова столько давали столькими (и никакая иная лексема столько, которая имела бы другой набор падежных форм, грамматиками не предусматривалась). Несложный мысленный эксперимент показал, что столько «в единственном числе» имеет полный набор падежных форм (хотя соответствующие примеры в текстах мне тогда не встретились, так что пришлось их конструировать: столького не хватает; столькому научился; о стольком надо поговорить и т. д.). Кроме того, этот же эксперимент показал, что теми же свойствами обладает местоимение сколько в «восклицательном» значении (Скольким я ему обязан!; Сколького я еще вам не рассказал! и т. д.). Указанное наблюдение нашло отражение в нашей статье [Булыгина, Шмелев 2000]; кроме того, я тогда же рассказал о нем А.А. Зализняку, и в новое издание «Грамматического словаря» была внесена соответствующая поправка (правда, только в отношении местоимения столько).

При осуществлении автоматической разметки корпуса, ориентированной на прежнее издание «Грамматического словаря», шансов обнаружить «нестандартное» прочтение формы стольким не очень много: форма будет автоматически помечаться как дательный падеж. Однако формы столького, столькому, (о) стольком не получат «стандартной» характеристики, и могла бы быть надежда, что они будут замечены лингвистами, производящими ручную корректировку автоматической разметки. Отчасти даже удивительно, что этого пока не произошло (по данным на осень 2009) и что автоматическая разметка НКРЯ, очевидно, ориентирована на старое издание «Грамматического словаря»: формы столького, столькому, (о) стольком помечены как «несловарные», а форма стольким во всех вхождениях — как нормальная форма дательного падежа, в том числе в таких примерах:

  • Теперь он давно уже не сопровождает государя в путешествиях и вместе с милостью царской потерял почти и весь вес у Чернышева, который стольким ему обязан. [М. А. Корф. Из дневника (1838-1839)]
  • Да сбудется пламенное мое желание: воздать этими листами хотя малейшую лепту благоговейной благодарности тому, которому я стольким, которому я всем был обязан, тому, которому некогда история и потомство воздвигнут один из блистательнейших памятников, сужденных человеку и монарху! [М. А. Корф. Записки (1838-1852)]
  • Пьер, стольким обязанный ему [Л. Н. Толстой. Война и мир. Том первый (1867-1869)]
  • дай Бог каждому истинно русскому патриоту стольким пожертвовать. [Борис Васильев. Были и небыли. Книга 2 (1988)]
  • Понимаешь, я тебе стольким обязан... [Андрей Лазарчук. Все, способные держать оружие... (1995)]
  • Не могу подписать против человека, которому стольким обязана... [Эдвард Радзинский. Княжна Тараканова (1999)]
  • Правда, приходилось рисковать слишком многим ― никогда прежде он стольким не рисковал. [Андрей Волос. Сирийские розы // «Новый Мир», 1999]
  • Люди, прошедшие такой путь, столько испытавшие вместе, стольким рисковавшие, не могут обойтись друг без друга. [Александр Проханов. Господин Гексоген (2001)]
  • Вот, говорил их вид, столько пережито, стольким пожертвовано, столько сделано... и где она, человеческая благодарность? [Валерий Попов. Очаровательное захолустье (2001)]
  • Может быть, если бы его попросил Блохин, которому он стольким обязан? [Лев Дурнов. Жизнь врача. Записки обыкновенного человека (2001)]

Можно заметить также, что в НКРЯ содержатся десятки примеров, в которых используются формы столького, столькому, (о) стольком. Немало также и примеров с формами сколького и сколькому. Остается удивляться, почему они в течение столь долгого времени не были замечены грамматиками. В то же время любопытно отметить, что данные НКРЯ позволяют корректировать утверждение, касающееся тех же местоимений, которое мы сделали в статье [Булыгина, Шмелев 1992]. Мы говорили, что слова сколько и столько сочетаются с существительными в единственном числе только в позиции именительного или винительного падежа (существительное при этом, разумеется, стоит в родительном падеже: сколько блаженства). Однако выяснилось, что есть и примеры сочетаний такого рода в других падежах, хотя они, действительно, не очень частотны и иногда производят ощущение некоторой шероховатости[5]. Напр.:

  • стольким расстоянием друг от друга отдаленные [В. Н. Татищев. История Российская. Гл. 13-18 (1739-1750)]
  • зачем оставить это дело, стольким трудом приобретенное? [Н. В. Гоголь. Мертвые души (1842)]
  • Ты, стольким покаяньем, раскаяньем и мукой искупивший свои грехи! [Владлен Давыдов. Театр моей мечты (2004)]
  • Мы не обладаем стольким временем. [Анатолий Эпштейн. Лекция в рамках проекта «Культурная столица» (2004-2006)]

Мораль этой истории заключается в том, что использование корпуса может оказаться более всего плодотворным, когда исследователь критически оценивает данные, получаемые при помощи корпуса. В этом случае, обращаясь к собственной языковой компетенции, он имеет шанс обнаружить лакуны или неточности в существующих описаниях языка, в том числе тех, которые были использованы в системе поиска по корпусу. При таком подходе становится ясным, что ориентация на данные корпуса и на собственную языковую интуицию не противоречат друг другу, а скорее дополняют друг друга.

Литература

Аванесов 1983 — Орфоэпический словарь русского языка / под редакцией Р.И. Аванесова. М., 1983.

Апресян 1990 — Ю.Д. Апресян. Дистрибутивный анализ // Лингвистический энциклопедический словарь. М., 1990. С. 137–138.

Апресян 2005 — Ю.Д. Апресян. Правила взаимодействия значений и словарь // Русский язык в научном освещении. 2005. № 1 (9). С. 7-45.

Булыгина, Шмелев 1992 — Т.В. Булыгина, А.Д. Шмелев. Семантические и морфологические особенности местоимений: структура парадигм // Linguistique et slavistique. Mélanges offerts à Paule Garde. Aix-en-Provence 1992. С. 425–436.

Булыгина, Шмелев 2000 — Т.В. Булыгина, А.Д. Шмелев. Числительные в русском языке; лексикографические лакуны // Слово в тексте и слово в словаре: Сб. статей к семидесятилетию акад. Ю. Д. Апресяна. М., 2000. С. 389–306.

Гловинская 1996 — М.Я. Гловинская. Активные процессы в грамматике (на материале инноваций и массовых языковых ошибок) // Русский язык конца XX столетия. М., 1996 С. 237–304.

Зализняк 2004 — А.А. Зализняк. «Слово о полку Игореве»: Взгляд лингвиста. — М., 2004.

Зализняк, Левонтина, Шмелев 2005 — Анна А. Зализняк, И.Б. Левонтина, А.Д. Шмелев. Ключевые идеи русской языковой картины мира. М., 2005.

Панов 1990 — М.В. Панов История русского литературного произношения XVIII–XX вв. М., 1990.

Перцов 2006 — Н.В. Перцов. К суждениям о фактах русского языка в свете корпусных данных // Русский язык в научном освещении. 2006. № 1 (11). С. 227–245.

Плунгян 2008 — В.А. Плунгян. Корпус как инструмент и как идеология: о некоторых уроках современной корпусной лингвистики // Русский язык в научном освещении. 2008. № 2 (16). С. 7–20.

Шмелев 1997 — А.Д. Шмелев. Дух, душа и тело в свете данных русского языка // Т.В. Булыгина, А.Д. Шмелев. Языковая концептуализация мира (на материале русской грамматики). М., 1997. С. 523–539.

Шмелев 1973 — Д.Н. Шмелев. Проблемы семантического анализа лексики (на материале русского языка). – М., 1973.

Lyons 1969 — J. Lyons. Introduction to Theoretical Linguistics. London etc., 1969.


[1] Здесь можно вспомнить замечания одного из персонажей романа Грэма Грина Burn-out case: When you have been in Africa a little longer, you will learn not to ask an African a question which may be answered by Yes. It is their form of courtesy to agree. It means nothing at all.

[2] Относительно недавний пример. В статье [Апресян 2005] анализируются различия в поведении между глаголами решить и решать, которые объясняются семантическими различиями: решать значит ‘обдумывать вопрос’, а решить — ‘в результате обдумывания получить ответ на вопрос’. Этот анализ представляется справедливым, но можно было бы оговорить, что сказанное не относится к употреблениям глагола решать в роли «тривиального» видового коррелята к глаголу решить, когда решать значит как раз ‘получать ответ’ (напр., Стоило ему хорошо подумать, он сразу же решал любую задачу).

[3] Можно заметить, что инфинитивные употребления нередко проходят мимо внимания лингвистов. Так, я помню, что глагол спаться (с отрицанием — не спаться) казался странным многим коллегам, так что они готовы были даже в явном виде утверждать, что для оборота не спится <кому-л.> нет инфинитивного варианта. Однако несложный эксперимент показывает, что оборот не спаться вполне может появиться в контексте модальных или фазовых глаголов; и, действительно, он встречается в реальных текстах, напр.: …не вам одним плохо спится, а и мне тоже стало не спаться ― и в этом виноваты вы (Николай Лесков).

[4] Заметим, что В.А. Плунгян [2008: 18] указывает на языковую игру как на один из источников русского «морфологического расширения», а также упоминает (в сноске) разнообразные приемы орфографической игры. Однако очевидно, что адекватное описание языковой игры предполагает, что используемые в ней языковые выражения мы будем отличать от «стандартных» выражений и описывать иначе, а осознание того факта, что мы имеем дело с языковой игрой, предполагает апелляцию к компетенции носителей языка.

[5] В силу отмеченной особенности разметки НКРЯ поиск приходилось вести «непрямым» образом, напр. искать сочетания слова сколько в дательном (!) падеже и существительного в творительном падеже.




Поделиться с друзьями:


Дата добавления: 2015-06-27; Просмотров: 484; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.049 сек.