| и |X
|.
|X
| ? |X
|
– векторное произведение матрицы |X
| на транспонированную матрицу |X
|. Причем величина этого произведения пропорциональна числу совпадающих по месту в BCF-матрице единиц в |X
| и |X
|.
|X
| ? |X
|
= N, только если |X
| = |X
|;
|X
| ? |X
|
<N, если |X
| ? |X
|;
|X
| ? |X
|
= 0, если ни один пиксель этих матриц не совпадает.
Рассмотрим отношение:
Здесь CoS – Коэффициент Сходства между числовыми векторами X
и X
определяет степень близости этих векторов и описываемых этими векторами имиджей.
Примеры:
Рис. 7. Перемножение матриц для сравнения числовых массивов
Рис. 8. Сравнение десятичных числовых массивов |A| и |B|
Классические нейронные сети при распознавании только определяют, на какой класс более всего похож некоторый распознаваемый объект. При этом они не могут указать, насколько он похож. Из-за этого распознавание иногда неустойчиво – существуют известные примеры, когда изменения одного пикселя в имидже оказалось достаточным, чтобы его распознавание изменилось. Это значит, что распознавание в классических сетях сильно зависит от случайных шумов.
В PANN ситуация иная – величина коэффициента сходства очень четко показывает, насколько существенна разница между имиджами. Разница сходства в одну сотую при формате 32 ? 32 пикселя соответствует примерно изменению 10 пикселей. И этого уже достаточно для того, чтобы уверенно отличать имиджи друг от друга. А разница в одну десятую говорит уже о вполне серьезном различии и высокой устойчивости распознавания, малой зависимости распознавания от шумов.
В отличие от классических нейронных сетей, сети PANN позволяют резко повысить качество распознавания за счет:
• статистической обработки распознавания по классам и по имиджам;
• совмещения распознавания по классам и распознавания непосредственно по имиджам. Причем совмещенное распознавание по классам и по имиджам позволяет решить одну из самых неприятных проблем, ограничивающих применение нейронных сетей в медицине и ряде других приложений – проблему прозрачности и объяснимости результатов работы сети. Подробнее мы расскажем об этом в разделе «4.6. Распознавание сетью PANN».
2.4.3. Оценка достоверности и точности распознавания
Достоверность и точность распознавания имиджей нейронными сетями крайне важны для их использования.
Точность и надежность распознавания классической нейронной сети определяется путем тестирование нескольких десятков, сотен или тысяч имиджей и подсчета числа правильных и неправильных распознаваний. Это очень спорный тест. Из-за непрозрачности работы классических сетей распознавание сильно зависит от случайных особенностей обучения:
• иногда результаты обучения плохо воспроизводятся, одна и та же сеть, обученная на одних и тех же имиджах, в одних случаях будет распознавать лучше, в других хуже;
• нет способов адекватной оценки точности и надежности распознавания по каждому из имиджей;
• влияние отбора тестовых имиджей. Иногда их подбирают специально для обеспечения нужного результата.
Распознавание сетью PANN оценивается по числовому коэффициенту сходства рассматриваемого имиджа:
1. С любым набором загруженных в сеть отдельных имиджей.
2. Со всеми классами, которым обучена данная сеть.
При этом и классы, и отдельные имиджи ранжируются по степени сходства, что позволяет точно оценить величину различий между всеми сравниваемыми классами и тем самым оценить точность и надежность распознавания.
Безусловно, возможно формально (с точки зрения машины) правильное, но не устраивающее нас распознавание. Даже люди нередко распознают других людей не по главным, а по второстепенным признакам. Например, оценивая сходство не по чертам лица, а по одежде. Бывает, что при распознавании человеческих лиц особенности освещения оказываются более весомыми, чем черты лица.
Но проблемы такого рода вполне решаемы в PANN несколькими путями, в частности: