Практические занятия по курсам, связанным с обработкой и анализом текста на естественном языке, организация которых опирается на хорошо известные постановки задач, решаемых в свое время средствами традиционной лингвистики, становятся содержательными не только в конкретно-методическом отношении, но и являются источником новых гипотез и концепций, обеспечивающих актуализацию интерпретации результатов обработки данных. В согласии с высказыванием Б. Мандельброта в его получившей широкую известность книге, популяризирующей некоторые основные идеи прикладной теории фракталов: «Для языкового инженера самым многообещающим материалом является не грамматика, но статистические свойства языка» [1, с. 213], уже простейшие процедуры статистической обработки текста с установкой на стилометрические методики дают результаты, существенные при работе с корпусом текстов, семантическая структура которого не полностью определена. Следует отметить благоприятную ситуацию локальных условий высшей школы Ставрополя, где активно ведется разработка когнитивистской и лингво-философской проблематики [2; 3].
В качестве модельной задачи для такого рода проектов мы обратились к предложенной А. Ф. Лосевым идее повторного анализа диалогов Платона вслед за его собственным основополагающим анализом, проведенным в первой трети двадцатого столетия, в котором прослеживается взаимосвязь ключевых терминов «эйдос» и «идея»: « … необходимо, чтобы Платона пересмотрел еще раз кто-нибудь из исследователей, чтобы Платон, со всеми своими многочисленными текстами, содержащими указанные два термина, еще раз прошел через чей-нибудь исследовательский ум, который был бы свободен и от гипноза Риттера, и от гипноза моего» [4, с. 138]. Актуальность задачи подтверждает формулировка тематики секции: «Современные стратегии прочтения Платона» в программе XXI всероссийской конференции «Универсум Платоновской мысли: Корпус текстов Платона в истории его интерпретаций», проводимой Санкт-Петербургским Платоновским философского обществом в июне 2013 г.; надлежащая же объективность, требуемая А. Ф. Лосевым, обеспечена тем «инженерным» подходом, о котором говорит Б. Мандельброт.
Диалоги Платона сегодня доступны в сети с самым детальным лексико-грамматическим обеспечением в оперативном режиме запросов к базе данных. Так работает, например, проект «Perseus under PhiloLogic» на сайте Чикагского университета (http://perseus.uchicago.edu/index.html). Поэтому исходный материал для узкого с точки зрения грамматики задания легко собирается в режиме разового индивидуального задания, а последующая обработка набором модулей прикладной статистики с успехом может быть проведена именно в режиме иллюстрации их методики и возможностей.
Результаты первичного сбора статистик по корпусу текстов Платона, в которых встречаются термины пары «эйдос – идея» («εἶδος – ἰδέα»), всего 16 названий (как и у Лосева), были сведены в локальную базу данных, (представленную здесь в виде Табл. 1 ниже) содержащую следующие значения для каждого диалога:
- Op — название диалога
- W — общее количество слов в тексте
- U — количество различных словоформ в тексте
- gfI — количество разных грамматических форм термина ἰδέα в тексте
- LosI — общее количество термина ἰδέα в тексте согласно А.Ф. Лосеву
- prI — общее количество термина ἰδέα в тексте по редакции Perseus
- prqI — частота термина ἰδέα в тексте на 10000 слов (Perseus)
- nIo — общее количество вхождений термина ἰδέα в предложения с оптативом
- prqIo — частота вхождений термина ἰδέα в предложения с оптативом
- (на 10000 слов)
- nIs — общее количество вхождений термина ἰδέα в предложения с субъюнктивом
- prqIs — частота вхождений термина ἰδέα в предложения с субъюнктивом (на 10000 слов)
- sIos — суммарное количество вхождений термина ἰδέα в предложения с оптативом или субъюнктивом
- prqsIos — суммарная частота вхождений термина ἰδέα в предложения с оптативом или субъюнктивом (на 10000 слов).
Другая половина базы данных содержит значения подобных переменных для термина εἶδος; названия их аналогичны вышеприведенным, с заменой литеры «I» на «E» соответственно.
В процедурах обработки использовались вторичные переменные, локально порождаемые из основных посредством а) стандартизации значений наблюдаемых, б) факторного представления, в) кластеризации и расчета матрицы расстояний по различным методикам, и т. п.
Во всех группировках оказывается достаточно устойчивой кластерная структура, в целом «расплывчато» соответствующая принятой в наши дни группировке диалогов по совокупности количественных параметров [ср. с. 5]. Это подтверждает репрезентативность динамики связи пары «эйдос — идея» для всей системы стилометрических характеристик. Обращает на себя внимание комплекс Timaeus — Sophist — Parmenides — Statesman («Тимей» — «Софист» — «Парменид» — «Политик»), почти всюду остающийся связным. Здесь можно предположить по крайней мере некоторое функциональное соответствие в общей тематической структуре корпуса диалогов отсутствующего «Философа» и «Парменида», что помогает предложить некоторые варианты ответов на известные вопроы, связанные во статусом этого последнего.
Табл. 1. Основные статистики корпуса 16 диалогов по отношению к паре терминов «εἶδος — ἰδέα»
Текст | W | U | gfI | LosI | prI | prqI | nIo | prqIo | nIs | prqIs | sIos | prqsIos |
Charmides | 0,85 | 0,21 | 4 | 3 | 3 | 3,54 | 0 | 0 | 1 | 1,18 | 1 | 1,18 |
Cratylus | 1,85 | 0,40 | 3 | 3 | 3 | 1,61 | 2 | 1,07 | 2 | 1,07 | 4 | 2,14 |
Euthyphro | 0,53 | 0,15 | 3 | 3 | 3 | 5,7 | 0 | 0 | 5 | 9,5 | 5 | 9,5 |
HippMaj | 0,86 | 0,22 | 2 | 1 | 1 | 1,16 | 1 | 1,16 | 0 | 0 | 1 | 1,16 |
Laws | 10,43 | 1,75 | 2 | 2 | 2 | 0,19 | 1 | 0,09 | 0 | 0 | 1 | 0,09 |
Parmenides | 1,55 | 0,20 | 5 | 7 | 7 | 4,52 | 2 | 1,29 | 0 | 0 | 2 | 1,29 |
Phaedo | 2,27 | 0,49 | 3 | 8 | 8 | 3,52 | 2 | 0,88 | 4 | 1,76 | 6 | 2,64 |
Phaedrus | 1,69 | 0,51 | 5 | 7 | 7 | 4,13 | 2 | 1,18 | 7 | 4,13 | 9 | 5,31 |
Philebus | 1,79 | 0,41 | 4 | 7 | 7 | 3,91 | 6 | 3,35 | 7 | 3,91 | 13 | 7,26 |
Protagoras | 1,80 | 0,42 | 1 | 1 | 1 | 0,55 | 0 | 0 | 0 | 0 | 0 | 0 |
Republic | 8,94 | 1,52 | 6 | 21 | 21 | 2,34 | 2 | 0,22 | 6 | 0,67 | 8 | 0,89 |
Sophist | 1,62 | 0,39 | 4 | 4 | 4 | 2,46 | 0 | 0 | 0 | 0 | 0 | 0 |
Statesman | 1,72 | 0,47 | 4 | 6 | 6 | 3,49 | 1 | 0,58 | 2 | 1,16 | 3 | 1,74 |
Symposium | 1,77 | 0,47 | 2 | 2 | 2 | 1,13 | 0 | 0 | 0 | 0 | 0 | 0 |
Theaetetus | 2,28 | 0,52 | 3 | 6 | 7 | 3,06 | 1 | 0,43 | 2 | 0,87 | 3 | 1,3 |
Timaeus | 2,40 | 0,64 | 4 | 14 | 14 | 5,82 | 16 | 6,66 | 7 | 2,91 | 23 | 9,57 |
Текст | W | U | gfE | LosE | prE | prqE | nEo | prqEo | nEs | prqEs | sEos | prqsEos |
Charmides | 0,85 | 0,21 | 2 | 2 | 2 | 2,36 | 1 | 1,18 | 0 | 0 | 1 | 1,18 |
Cratylus | 1,85 | 0,40 | 3 | 14 | 14 | 7,54 | 9 | 4,85 | 8 | 4,31 | 17 | 9,16 |
Euthyphro | 0,53 | 0,15 | 1 | 1 | 1 | 1,9 | 0 | 0 | 0 | 0 | 0 | 0 |
HippMaj | 0,86 | 0,22 | 1 | 2 | 2 | 2,32 | 0 | 0 | 1 | 1,16 | 1 | 1,16 |
Laws | 10,43 | 1,75 | 4 | 30 | 30 | 2,87 | 6 | 0,57 | 12 | 1,15 | 18 | 1,72 |
Parmenides | 1,55 | 0,20 | 6 | 55 | 56 | 36,22 | 30 | 19,4 | 23 | 14,87 | 53 | 34,3 |
Phaedo | 2,27 | 0,49 | 4 | 16 | 17 | 7,49 | 4 | 1,76 | 8 | 3,52 | 12 | 5,28 |
Phaedrus | 1,69 | 0,51 | 6 | 26 | 26 | 15,37 | 3 | 1,77 | 20 | 11,82 | 23 | 13,6 |
Philebus | 1,79 | 0,41 | 5 | 15 | 15 | 8,38 | 3 | 1,67 | 7 | 3,91 | 10 | 5,58 |
Protagoras | 1,80 | 0,42 | 2 | 2 | 2 | 1,11 | 1 | 0,55 | 3 | 1,67 | 4 | 2,22 |
Republic | 8,94 | 1,52 | 7 | 73 | 75 | 8,38 | 32 | 3,57 | 25 | 2,79 | 57 | 6,36 |
Sophist | 1,62 | 0,39 | 7 | 49 | 48 | 29,6 | 9 | 5,55 | 13 | 8,01 | 22 | 13,6 |
Statesman | 1,72 | 0,47 | 6 | 29 | 29 | 16,9 | 10 | 5,82 | 19 | 11,07 | 29 | 16,9 |
Symposium | 1,77 | 0,47 | 2 | 7 | 7 | 3,95 | 2 | 1,13 | 8 | 4,52 | 10 | 5,65 |
Theaetetus | 2,28 | 0,52 | 4 | 15 | 14 | 6,12 | 3 | 1,31 | 7 | 3,06 | 10 | 4,37 |
Timaeus | 2,40 | 0,64 | 7 | 60 | 59 | 24,56 | 15 | 6,24 | 22 | 9,16 | 37 | 15,4 |
Результирующее распределение текстов оказывается следующим универсальному виду закона Ципфа-Мандельброта:
freq(WI) = A*Exp(-B*Log(RI)) (1)
где freq(WI) – частота класса слов (индексированных значением указателя I) в тексте, и RI – его ранг, то есть номер, получаемый при последовательной нумерации групп слов с одинаковой частотой в прядке ее убывания. Согласно подсчетам, в описываемом корпусе А = 0,7695 и В = — 0,0936.
Так возникает возможность рассматривать отдельный текст (диалог) как ранговое множество с вполне определенной (имплицитно) и специфической нагрузкой его составляющих — лексем. Такая интерпретация позиции «Парменида» относительно диалогов, рассматривающих проблемы специфики определенной области профессиональной специализации, подкрепляет сделанное предположение о том, что по крайней мере имплицитно и de facto этот текст иллюстрирует узус терминов «εἶδος – ἰδέα» в их взаимной динамике с бóльшей отчетливостью, чем прочие диалоги сопоставимого размера – то есть все, кроме «Республики».
Вопрос об основном принципе этой динамики был рассмотрен А. Ф. Лосевым в его обследовании текстов Платона в плане рецептивной феноменологии, методом конкретно-субъективной (экспертной) семантизации с редукцией к бинарному инварианту «дифференциальный аспект (εἶδος) – интегральный аспект (ἰδέα)» предмета речи, объекта высказывания. Как специалист-философ, Лосев настаивает на принятии интенционально-содержательного локального значения термина за исходную единицу соответствующей редукции, поскольку известные ему в те годы чисто лингвистические («грамматические») категоризации (учение Ф. де Соссюра, структурализм) в конечном итоге оказываются вполне «бессодержательными» и даже прямо видят свою основную задачу в достижении полной формализации («схоластичности») описания своего предмета. При издании своего труда Лосев делает примечание, что «времена изменились и здесь», и на смену филологии, на которую он «нападает», пришли учения К. Фосслера, О. Вальцеля и др. [7, c. 141] от которых он мог ожидать бόльшего внимания к значению; некоторая несогласованность их методов и наличного инструментария привели, однако, к тому, что господствующей идеологией они были отнесены к формализму же, но не позитивистскому, а идеалистическому. Сегодня, располагая новейшими методиками содержательного анализа дискурса, с одной стороны, и адекватными средствами его детального описания, можно вернуться к поиску именно формально-лингвистического дифференциального признака, действенного в заданном контексте. Подготовительными работами по отношению к корпусу диалогов как раз и были проверки гипотез о встречаемости каждого из пары терминов в некоторых формально-грамматических контекстах, связанных, однако, с конкретными семантическими моделями содержания пары с моментом контраста.
Как обычно, сравнительный и сопоставительный материал других языков полезен в такого рода лингвистическоммоделировании; в нашем случае таковым оказались примеры из языка абазинского фольклора, любезно предоставленные проф. П. К. Чекаловым. Там сохраняется форма имени, маркируемая окончанием -С, употребляющаяся как средство передачи целевого и результативного значений:
- Атажви алыгажви гарас г1азлырхуаш г1аргырныс … абна йцат1 (Старик и старуха пошли в лес за материалом для колыбели) [6, с. 19];
- Х1ара г1взас уг1ах1ылал (Стань нам товарищем) [6, с. 76];
- Зажва к1ынх1ару айгвас дуымк1ын (Не заводи родство с тем, у кого слово дырявое (лживое) [6, с. 97];
- Абага ду ачва бжа лпа… хъылпаста йгьизынамхъат1 (Половины шкуры огромной лисы не хватило для шапки ее сына) [6, с. 98]
С точки зрения праиндоевропейской грамматики структура лексемы среднего рода (третьего склонения на —ος) «εἶδος» вполне может быть таким целевым/результативным образованием от корня *ἶδ по типу аориста, с которым это имя связывают сразу два показателя – префикс *ε— и суффикс -*ς. А тогда образованное от того же корня с помощью праиндоевропейского форманта собирательных имен -*α (ср. абазинское -гIа в нартыргIа «нарты») существительное ἰδέα передает, в согласии с конструкцией А.Ф Лосева, цельность и интегральность, но в первую очередь потенциальную, совокупность виртуальных реализаций в контрасте с имевшим место фактом (аорист) или четко намеченным в будущем состоянием (суффикс -*ς как фомант будущего времени в индоевопейских языках). И естественно ожидать превалирование не-индикативных конструкций в ближайшем синтаксическом окружении такого термина. Эти соображения поясняют описанный выше состав базовых наблюдаемых.
В подсчете суммарных величин оказывается, что 96 вхождений форм лексемы ἰδέα имеют в непосредственном окружении предложения 79 форм субъюнктива и оптатива, а для лексемы εἶδος эти значения соответственно равны 397 и 304. Если образовать отношение, показывающее то, что можно назвать коэффициентом индукции не-индикативного модуса, то оно выше для первой лексемы:
79/98 = 0,814433 (ἰδέα), но
304/397= 0,765743 (εἶδος).
Это наблюдение и образует основной с точки зрения традиционной лингвистики итог проведенных запросов: гипотеза о различимости в корпусе текстов членов пары лексем средствами внешнего наблюдения, то есть формально-лингвистическими, подтверждена количественно.
С точки зрения современных концепций языка, текста и дискурса как динамических систем в наших наблюдениях есть только указание на возможности дальнейшего развития объекта наблюдения. Действительно, различие выборок точечных значений введенного отношения статистически не оказывается значимым при проверке по t-критерию. Поддержка дифференцирующего потенциала с закреплением терминологического статуса членов пары либо нивелирование его с образованием относительных синонимов в реальной истории – это предмет для дальнейших исследований; они, надо полагать, потребуют и дальнейшего расширения аппарата описания.
А. Н. Силантьев,
кандидат филологических наук, преподаватель
Ставропольской Духовной Семинарии
________________________________________________
- Мандельброт Б. Фракталы, случай и финансы. – Москва-Ижевск: «R&C Dynamics», 2004.
- Бредихин С. Н. Пролегомены к общей теории смысла философского дискурса. Введение в иерархическую ноэматику смысловых структур. — Ставрополь, 2012.
- Манаенко Г. Н. Лингвистические координаты понятия «дискурс» / Вопросы когнитивной лингвистики, 2011, № 4.
- Лосев А. Ф. Очерки античного символизма и мифологии. Издательство «Мысль», М. 1993.
- Thesleff H., Loimaranta K. Applying cluster analyysis to the platonic question / Actes du Congres international informatique et sciences humanes 1961 — L.A.S.L.A. — Univercite de Liege.
- Абаза турыхква / Йалазцлакваз: К. С. Щакърыл, Т. З. Тобыль. – Черкесск: Черкесское книж.изд., 1955. – 155 с. (Абазинские сказки / Сост. К. С. Шакрыл, Т. З. Табулов).