На cтраницу Pipopolam'a
Вопросы исторической хронологии
А.Т.Фоменко. Методы статистического анализа исторических текстов. Приложения к хронологии.
к содержанию

ПРИНЦИП КОРРЕЛЯЦИИ МАКСИМУМОВ НА МАТЕРИАЛЕ ИСТОЧНИКОВ О СМУТНОМ ВРЕМЕНИ В ИСТОРИИ РОССИИ 1584-1619 ГОДОВ.   (Н.С.Келлин, Л.Е.Морозова, А.Т.Фоменко)

Здесь мы покажем - как принцип корреляции максимумов проявляется на группе зависимых исторических текстов, относящихся к эпохе смутного времени на Руси конца XVI - начала XVII веков н.э. Мы взяли 20 текстов, каждый из них разбили на погодные фрагменты, то есть на куски, описывающие события отдельных лет. Затем Н.С.Келлин и Л.Е.Морозова подсчитали объемы всех этих "глав". А именно, было подсчитано количество слов в каждой "главе". Полученные результаты были систематизированы в виде единой таблицы, где для каждого из 20 текстов был указан объем его погодных фрагментов от 1584 до 1619 годов.

Вот список исследованных текстов:

1) Повесть о честном житии,

2) Повесть како восхити,

3) Повесть како отмсти,

4) Житие Дмитрия (Тулупова),

5) Житие Дмитрия (Малютина),

6) Сказание о Гришке,

7) Сказание о Федоре,

8) Сказание о самозванце,

9) Повесть Шаховского,

10) Житие Иова,

11) Сказание Авраамия (1-я редакция),

12) Сказание Авраамия (2-я редакция),

13) Хронограф 1617 года,

14) Временник Тимофеева,

15) Повесть Катырева (1-я редакция),

16) Повесть Катырева (2-я редакция),

17) Иное сказание,

18) Пискаревский летописец,

19) Новый летописец.

Позднее были добавлены еще три текста:

20) Извет Варлаама,

21) Бельский летописец и

22) Сказание о Скопине.

Приведем таблицу объемов погодных фрагментов для первых 19 текстов. По горизонтальной оси отложены годы, по вертикальной - номера текстов. Годы указаны сокращенно: вместо 1584, 1585, 1586 и т.д. написано 84, 85, 86 и так далее.

ТАБЛИЦА 2

 

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

1

432

288

 

200

375

376

1112

1632

           

2784

2

140

455

 

458

     

105

           

196

3

230

   

800

     

157

           

380

4

120

           

740

           

48

5

180

   

500

400

300

306

500

           

400

6

152

 

52

180

     

76

           

68

7

240

200

206

240

200

208

210

2884

     

20

22

26

756

8

20

           

93

             

9

128

           

600

     

20

26

28

360

10

240

200

100

102

106

450

 

60

56

52

51

50

50

52

 

11

44

   

42

     

108

           

306

12

54

   

42

     

347

           

112

13

312

   

172

43

42

 

132

           

324

14

900

   

120

     

4420

26

22

20

20

26

28

3000

15

150

   

120

     

300

           

500

16

152

   

86

     

300

     

10

10

12

434

17

264

   

675

     

863

92

90

 

90

92

94

1034

18

325

75

50

44

32

46

122

430

86

35

140

20

20

110

1160

19

441

99

150

152

54

54

189

1548

522

36

342

648

50

50

540

Все эти исторические тексты описываются, в основном, одни и те же события, следовательно, они зависимы, опираются на один и тот же фонд уцелевших сведений. Таблица 2 показывает, что имеется ярко выраженная корреляция между точками всплесков, то есть локальных максимумов функций объемов этих текстов. Почти все графики делают всплески практически одновременно, в частности, в годы 1584, 1587, 1591, 1598.

Приведем теперь результат второго численного эксперимента, в котором к предыдущим 19 текстам были добавлены еще три текста (см. выше), а также были расширены временные рамки - к интервалу 1584-1598 гг.н.э. были присоединены годы от 1598 до 1606. Была построена таблица, аналогичная предыдущей. Сейчас мы приведем таблицу, в которой символом Х отмечены положения локальных максимумов для всех 22 исторических текстов на интервале от 1584 года до 1606 года н.э.

ТАБЛИЦА 3

 

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

00

01

02

03

04

05

06

1

X

           

X

           

X

               

2

 

X

 

X

     

X

           

X

     

X

 

X

   

3

X

   

X

     

X

           

X

   

X

       

X

4

X

           

X

           

X

   

X

       

X

5

X

   

X

     

X

           

X

             

X

6

X

   

X

     

X

           

X

             

X

7

X

   

X

     

X

           

X

   

X

       

X

8

X

           

X

           

X

     

X

     

X

9

X

       

X

 

X

           

X

             

X

10

X

           

X

         

X

         

X

   

X

11

X

   

X

     

X

           

X

         

X

 

X

12

X

   

X

     

X

           

X

   

X

 

X

 

X

 

13

X

   

X

     

X

           

X

               

14

X

   

X

     

X

           

X

             

X

15

X

   

X

     

X

           

X

   

X

     

X

 

16

X

   

X

     

X

           

X

       

X

   

X

17

X

   

X

     

X

           

X

             

X

18

X

           

X

   

X

     

X

 

X

   

X

 

X

 

19

X

   

X

     

X

     

X

   

X

 

X

   

X

   

X

20

X

   

X

     

X

           

X

     

X

     

X

21

X

   

X

     

X

   

X

       

X

X

     

X

 

X

22

                           

X

 

X

   

X

 

X

 

Отчетливо видно, что все функции объема делают всплески практически одновременно, что объясняется зависимостью этих текстов. Следовательно, принцип корреляции точек всплесков функций объемов зависимых текстов здесь подтверждается.

Эту зависимость текстов можно выразить численно. Введем следующее "расстояние" между функциями объема vol X(t) и vol Y(t) для двух текстов X и Y, каждый из которых разбит в объединение отдельных погодных фрагментов X(t) и Y(t) соответственно. Напомним, что фрагменты X(t) и Y(t) описывают события лишь одного года t.

Пусть параметр t изменяется на отрезке времени от года A до года B. Обозначим через t(X,1), t(X,2), ... , t(X,N) - те годы, где функция график объемов vol X(t) делает всплески (то есть достигает локальных максимумов). Соответственно, через t(Y,1), t(Y,2), ... , t(Y,M) обозначим точки всплесков графика объемов vol Y(t).

Для каждой точки t(X,i) найдем БЛИЖАЙШУЮ К НЕЙ ТОЧКУ из последовательности t(Y,1), t(Y,2), ... , t(Y,M). Пусть это будет некоторая точка t(Y,k). Обозначим через p(i) - расстояние между ними, измеренное в годах, то есть - абсолютную величину разности t(X,i)-t(Y,k). Другими словами, выясняем - какой локальный максимум Y ближе всего расположен к выбранному локальному максимуму X.

Совершенно аналогично, меняя ролями X и Y, для каждой точки t(Y,j) найдем БЛИЖАЙШУЮ К НЕЙ ТОЧКУ из последовательности t(X,1), t(X,2), ... , t(X,N). Пусть это будет некоторая точка t(X,s). Обозначим через q(j) - расстояние между ними, измеренное в годах, то есть - абсолютную величину разности t(Y,j)-t(X,s).

Наконец, в качестве "расстояния между X и Y" мы возьмем следующую сумму:

R(X,Y) = p(1) + p(2) + ... + p(N) + q(1) + q(2) + ... + q(M).

Смысл расстояния R(X,Y) совершенно прозрачен. Для каждого локального максимума функции volX(t) мы находим ближайший к нему локальный максимум функции vol Y(t), определяем расстояние между ними (в годах), после чего суммируем получившиеся числа. Затем повторяем ту же операцию, поменяв местами хроники X и Y. Складывая полученные числа, получаем R(X,Y). Ясно, что R(X,Y) = R(Y,X).

Если расстояние R(X,Y) равно нулю для некоторой пары текстов X и Y, следовательно, графики их функций объемов делают всплески ОДНОВРЕМЕННО. Чем больше это расстояние, тем хуже коррелируют их точки локальных максимумов. Можно рассматривать также и несимметричное расстояние от X до Y, положив

p(X,Y) = p(1) + p(2) + ... + p(N).

Аналогично определяется и несимметричное расстояние от Y до X, а именно,

q(Y,X) = q(1) + q(2) + ... + q(M).

Оценим численно степень зависимости между собой исторических текстов 1-22, перечисленных выше. Для этого подсчитаем квадратную матрицу размера 22×22 попарных расстояний R(X,Y), где X и Y независимо друг от друга пробегают все тексты 1-22. Далее подсчитаем гистограмму частот. Для этого рассмотрим горизонтальную ось, на которой отметим целые точки: 0, 1, 2, 3, ... и построим следующий график. Подсчитаем - сколько в получившейся ранее матрице {R(X,Y)} имеется нулей. Полученное число отложим по вертикали в точке с координатой 0. Затем подсчитаем - сколько в матрице {R(X,Y)} имеется единиц. Получившееся число отложим по вертикали в точке с координатой 1. И так далее. Получается график, который и называется гистограммой частот. Что можно сказать, изучая получившуюся гистограмму?

Если выбранные для анализа хроники ЗАВИСИМЫ, то большинство попарных расстояний между хрониками должно выражаться МАЛЫМИ ЧИСЛАМИ, то есть хроники должны "быть близки". Другими словами, большинство элементов матрицы {R(X,Y)} должно быть близко к нулю ("быть мало"). Но в таком случае абсолютный максимум гистограммы частот должен смещаться ВЛЕВО, то есть должно быть много малых частот. И напротив, если среди исследуемых текстов много НЕЗАВИСИМЫХ, то максимум гистограммы частот смещается направо. См.рис.3.26. Здесь увеличивается доля "больших" и "средних" попарных расстояний между хрониками.


Рис. 3.26: Гистограммы для зависимых и независимых исторических текстов.

Это наблюдение позволяет оценивать степень зависимости или независимости группы хроник путем построения соответствующей гистограммы частот по матрице {R(X,Y)}. А именно, смещение максимума влево указывает на возможную зависимость хроник, а смещение максимума направо, указывает на возможную независимость.

Эта идея была применена для оценки степени зависимости перечисленных выше текстов 1-22. На рис.3.27 показана экспериментальная гистограмма матрицы {R(X,Y)} для текстов 1-22. В этой матрице оказалось много малых чисел, поэтому максимум гистограммы заметно смещен влево. Это указывает на зависимость текстов 1-22.


Рис. 3.27: Гистограмма для зависимых текстов 1-22.

Для сравнения построим гистограмму для независимых текстов. В качестве примера мы решили сравнить указанные ниже три хроники А,В,С, с предыдущими текстами 1-22. Три дополнительные хроники таковы:

А: Повесть временных лет, якобы 850-1110 годы н.э.,

В: Академическая летопись, якобы 1336-1446 годы н.э.,

С: Никифоровская летопись, якобы 850-1430 годы н.э.

Для каждой из них была вычислена функция объемов и найдены все ее локальные максимумы. Вычислим все попарные расстояния R(X,Y), где Х пробегает три хроники А, В, С, а Y пробегает тексты 1-22. В результате получается прямоугольная матрица {R(X,Y)} размера 3×22. Далее была подсчитана гистограмма частот. Результат показана на рис.3.28. Отчетливо виден совершенно другой характер гистограммы - ее максимум переместился направо. Что указывает на независимость двух групп текстов:

{А, В, С} и {тексты 1-22}.


Рис. 3.28: Гистограмма для независимых текстов.

Конечно, внутри каждой из этих групп могут быть зависимые тексты.

назад      дальше

Hosted by uCoz