4
4
0
313
-
1
1
2
2
312
1
-
-
1
0
322
-
2
-
2
0
211
1
-
-
1
0
сумма
96
86,3
145,9-86,3=59,6 бит
4. Суммарная защищенность, водопроводимость и тип территории
Cl |
1 |
2 |
3 |
Сумма |
Относительная информативность |
133 |
7 |
- |
- |
7 |
0 |
232 |
6 |
3 |
- |
9 |
8,3 |
222 |
3 |
3 |
- |
6 |
6 |
223 |
4 |
5 |
3 |
12 |
18,7 |
331 |
2 |
- |
- |
2 |
0 |
322 |
- |
4 |
- |
4 |
0 |
313 |
- |
- |
4 |
4 |
0 |
132 |
5 |
10 |
- |
15 |
13,8 |
323 |
- |
1 |
1 |
2 |
2 |
332 |
1 |
1 |
- |
2 |
2 |
122 |
1 |
1 |
- |
2 |
2 |
121 |
5 |
3 |
- |
8 |
7,6 |
113 |
- |
1 |
3 |
4 |
3,2 |
131 |
4 |
- |
- |
4 |
0 |
111 |
- |
3 |
- |
3 |
0 |
212 |
- |
- |
1 |
1 |
0 |
112 |
- |
1 |
2 |
3 |
2,8 |
211 |
- |
1 |
- |
1 |
0 |
231 |
1 |
- |
- |
1 |
0 |
сумма |
96 |
70,3 |
|||
145,9-70,3=75,6 бит |
В результате проведения расчетов информативности методом перебора, необходимо выбрать наиболее информативных три двоичных и один троичный признаков для того, чтобы произвести тестирование модели. Итоговые значения наиболее информативных сложных двоичных и троичных признаков сведены в таблице 6.
Таблица 6. Наиболее информативные сложные признаки
Показатели |
Информативность |
|
Бит |
% |
|
40,0 |
27,4 |
|
41,8 |
28,6 |
|
63,6 |
43,6 |
|
75,6 |
51,9 |
|
Уровень концентрации хлоридов |
145,9 |
100 |
3. Тестирование модели
После определения более информативных сложных признаков необходимо произвести тестирование сформированной модели для выяснения её пригодности для дальнейшего прогноза. Для этого используется контрольная модель, с помощью которой, с использованием матриц взаимных переходов, считается сумма голосов. В контрольной части смотрят сочетание значений признаков и по матрице взаимных переходов определяют количество попаданий этих сочетаний в 1, 2 и 3 ранг по хлору и в итоге суммируют их. Тот ранг, в который попадет наибольшее значение сочетаний, будет считаться прогнозным. Этот ранг будет сравниваться с фактическим значением ранга по хлору. Чем больше будет совпадений прогнозных значений с фактическими, тем более пригодной для прогноза окажется наша модель.
Результаты диагностирования модели приведены в таблице 7
Таблица 7. Диагностирование модели № блока |
Ранги |
Содержание хлора |
|||
1 |
2 |
3 |
фактическое |
прогнозное |
|
97 |
2 |
1 |
|||
98 |
1 |
2 |
|||
99 |
3 |
1 |
|||
100 |
2 |
3 |
|||
101 |
2 |
2 |
|||
102 |
2 |
3 |
|||
103 |
3 |
2 |
|||
104 |
2 |
2 |
|||
105 |
2 |
1 |
|||
106 |
1 |
3 |
|||
107 |
2 |
2 |
|||
108 |
1 |
3 |
|||
109 |
2 |
1 |
|||
110 |
1 |
2 |
|||
111 |
3 |
1 |
|||
112 |
2 |
3 |
|||
113 |
2 |
2 |
|||
114 |
2 |
3 |
|||
115 |
3 |
1 |
|||
116 |
2 |
2 |
|||
117 |
2 |
1 |
|||
118 |
1 |
3 |
|||
119 |
2 |
2 |
|||
120 |
1 |
3 |
Анализируя таблицу стоит обратить внимание на так называемый «отказ», который свидетельствует об недостаточности значений показателей входящих в ранг. В нашей ситуации при нашей модели, разбитой на 96 блоков, идеальным количеством значений входящих в 3 ранга составляло бы 32.. К сожалению, в нашей модели такое условие не выполняется. В некоторых случаях число значений входящих в ранг не превышает и 12. Это снижает эффективность нашей модели.
На основании составленной таблицы необходимо посчитать ошибку по формуле: , где - количество совпадений прогнозных значений и фактических.
Такая высокая ошибка свидетельствует об неэффективности сформированной нами информационной модели.
Если следовать методике диагностирования и прогноза экологического состояния ПТГГС, то после проведения тестирования имеющейся информационной модели, нам необходимо произвести прогноз состояния ПТГГС. В нашем случае, т.к. модель оказалась неэффективной, прогноз, с точки зрения здравого смысла, производить не стоит, потому что его результаты не будут корректными и достоверными. Но т.к. главной нашей целью является освоение методики проведения диагностирования и прогноза экологического состояния ПТГГС, прогноз необходимо произвести.
Результаты прогноза приведены в таблице 8.
Таблица 8. Результаты прогноза
№ блока |
Ранги |
Содержание хлора |
||
1 |
2 |
3 |
прогнозное |
|
121 |
1 |
|||
122 |
2 |
|||
123 |
1 |
|||
124 |
3 |
|||
125 |
2 |
|||
126 |
3 |
|||
127 |
1 |
|||
128 |
2 |
|||
129 |
1 |
|||
130 |
3 |
|||
131 |
2 |
|||
132 |
3 |
Как уже было сказано выше, данный прогноз является некорректным и не представляет никакой ценности.
Заключение
В процессе проведения данной работы нами были оценены гидрогеологические, геологические и техногенные условия изучаемой территории, выяснено влияния имеющихся условий на загрязнение подольско-мячковского горизонта хлором, была сформирована информационно-диагностическая модель, подвергавшаяся тестированию. Выяснилось, что имеющаяся модель не эффективна, потому как имеет большую ошибку . В таком случае необходимо повышать эффективность модели, теми или иными способами.
На мой взгляд, есть несколько способов повышения эффективности модели, а именно: - замена показателей, не полностью связанных с функцией отклика и не сильно влияющих на ее изменение. В нашем случае, такими признаками, на мой взгляд, являются защищенность и вертикальный градиент, т.к. он имеет важную роль в местах перетекания, а таких мест на карте не много, поэтому его роль незначительна; - введение дополнительного показателя, такого как минерализация вод подольско-мячковского горизонта; - разбиение имеющихся значений не на 3 ранга, а, предположим, на 2 или 4 ранга; - изменить способ разбиения на обучающую и контрольную части; - уточнение достоверности исходных данных; - разбиение на ранги
29-04-2015, 01:01