2-1. Рассматриваемый в данном разделе первой части работы метод регуляризованных расширенных систем линейных алгебраических уравнений 2 - го рода безусловно имеет определенную историю (см. работы [Альберт, 1977; Лоусон, Хенсон, 1986]), однако он до самого последнего времени находился как бы в "тени", во всяком случае он не подвергался достаточно глубокому изучению и различным обобщениям.
Отправной пункт в методе - введение вектора невязки
![]() | (79) |
и объединение уравнений (23) и (79) в одну систему*)
![]() | (80) |
Тот факт, что из (80) следует и (23) и (79), легко проверяется непосредственно.
Регуляризация системы (80) осуществляется исключительно просто - необходимо нулевой блок в правом нижнем углу матрицы S (которую не следует путать с матрицей-регуляризатором в методе М. М. Лаврентьева, см. (10)-(13)) заменить на матрицу a RT R, где R - матрица-регуляризатор, фигурирующая в методе А. Н. Тихонова, см. (21)-(22). Таким образом регуляризованная система имеет вид:
![]() | (81) |
Из вида матрицы Sa, которая представляет собой сумму симметричной и кососимметричной матриц,
![]() | (82) |
причем симметричная матрица невырожденная, следует, что при любом a>0 матрица Sa, определенная по (82), является невырожденной.
2-2. Ясно, что переход к регуляризованной расширенной системе
(81) имеет то достоинство, что не нужно находить произведение матриц
AT A ; ясно также, что в случае R = E имеем
RT R = E и второе произведение матриц находить также
не надо. Кроме того, если N
M,
то при любом
a система (81) есть система с блочно-стреловидной
матрицей
и здесь может быть эффективно использована компактная схема разложения матрицы
на треугольные множители.
2-3. Однако главные достоинства перехода к расширенной регуляризованной системе в другом:
во-первых, возникает возможность более глубокого и детального анализа свойств вариационного метода А. Н. Тихонова;
во-вторых, возникает возможность глубокого обобщения вычислительных алгоритмов на случай наличия дифференцированной информации о векторе помехи.
В данном параграфе осуществляется нахождение ряда принципиально важных соотношений, имеющих место в вариационном методе А. Н. Тихонова.
Прежде всего, если исключить из системы (81) вектор ra,
![]() | (83) |
то получим определяющее соотношение метода А. Н. Тихонова
![]() | (84) |
Далее - если, наоборот, исключать из системы (81) вектор xa, то получим следующую совокупность формул:
![]() | (85) |
![]() | (86) |
![]() | (87) |
При этом в (85)-(87) принято
![]() | (88) |
Из (85)-(88) следуют такие принципиально важные факты:
1) вектор xa выражается через ra, иначе - искомое регуляризованное решение выражается линейно через вектор невязки для регуляризованного решения;
2) вектор fa = Axa, представляющий собой приближенное описание вектора полезного сигнала f, выражается линейно через вектор невязки регуляризованного решения;
3) в выражениях xa и fa через ra фигурирует величина m, которая при d 0 стремится к бесконечности;
4) вектор невязки регуляризованного решения в методе А. Н. Тихонова удовлетворяет независимому уравнению (22);
5) в выражении fa через ra и в уравнении для ra фигурирует симметричная положительно определенная матрица
![]() | (89) |
которая в случае, когда R суть квадратная (M
M)-матрица, может быть
записана в форме
![]() | (90) |
Свойства 1) и 2) решений, получаемых в рамках вариационного метода А. Н. Тихонова, свидетельствуют о возможности возникновения в нем эффектов заглаживания; не имея возможности подробно останавливаться на этом моменте, отметим лишь необходимость проведения спектрального анализа, основанного либо на сингулярном разложении матрицы B,
![]() | (91) |
либо на сингулярном разложении пары матриц (A, R), см. [Лоусон, Хенсон, 1986].
2-4. Свойства 4) и 5) требуют более глубокого проникновения в суть конструкций (85)-(87), что в конечном итоге позволит более глубоко осознать вариационную природу нового метода (28)-(32).
Именно, пусть сначала N < M; рассмотрим условную экстремальную задачу
![]() | (92) |
Как обычно, используем стандартную процедуру редукции условной экстремальной
задачи (92) к семейству безусловных экстремальных задач с помощью множителей
Лагранжа
li,
1 i
N:
![]() | (93) |
здесь a(i) суть i -ая вектор-строка матрицы A. Используя классическое правило экстремума, найдем, что возникает соотношение для x:
![]() | (94) |
откуда, вместе с линейными условиями в (92), следует, что вектор
l = (l1,
l2, ,
lN)T удовлетворяет
уравнению
![]() | (95) |
Осуществим далее регуляризацию методом М. М. Лаврентьева уравнения (95) для вектора l:
![]() | (96) |
Соответственно введем регуляризованное решение xa, сделав очевидные замены в (94):
![]() | (97) |
Ясно далее, что если принять
![]() | (98) |
то соотношение (97) перейдет в соотношение (85), а соотношение (96) - в
соотношение (87). Ясно также, что условие N
< M не является, вообще говоря,
необходимым; конструкция, получаемая в рамках условной экстремальной задачи
(92), остается в силе и при N
M.
Из сказанного вытекают три принципиальных вывода:
во-первых, что условная экстремальная задача (92), в которой ищется минимум квадратичного функционала при линейных ограничениях, оказывается существенно отличной от условной экстремальной задачи (16), в которой фигурирует одно квадратичное ограничение-равенство; именно, во втором случае всегда возникает невырожденная система с симметричной положительно определенной матрицей, а в первом случае система хотя и имеет симметричную положительно полуопределенную матрицу, но последняя может быть и вырожденной;
во-вторых, использование "принудительной регуляризации" системы (95) по М. М. Лаврентьеву (которая, как мы видели в предыдущем разделе статьи, см. п. 1-3, представляет собой процедуру, основанную на решении некоторой условной вариационной задачи) с выбором S=E, приводит к пониманию физического смысла множителей Лагранжа li - это суть приближения к величинам li, a, которые просто равны компонентам вектора mra = raa, ra - вектор невязки для решения xa, получаемого в рамках вариационного метода А. Н. Тихонова;
в-третьих, очевидно, что обобщение конструкции "принудительной регуляризации" состоит в том, чтобы вместо (96) использовать
![]() | (99) |
где
- заданная (Q
N)-матрица; суть этого обобщения в том,
что здесь возникает конструкция регуляризованной системы с двумя
матрицами-регуляризаторами - R (которая "скрыта" в матрице W, см. (95)) и
.
2-5. Подход, основанный на введении условной экстремальной задачи (92) с линейными ограничениями, с дальнейшей "принудительной регуляризацией" системы (95), заслуживает более глубокого изучения, которое и проводится в настоящем и следующем параграфах.
Первый принципиальный факт состоит в том, что системой (95) (случай N
M)
обеспечивается мультипликативная регуляризация системы (2).
Смысл этой конструкции раскрывается, если воспользоваться
сингулярным разложением пары матриц (A,R) (о понятии сингулярного
разложения пары матриц
[см. Лоусон, Хенсон, 1986]):
![]() | (100) |
где V и U суть ортогональные по столбцам матрицы размеров (N
N)- и
(M
M)-, соответственно, а X есть невырожденная
(M
M)-матрица;
при этом
![]() | (101) |
и
SA,
SR суть диагональные матрицы
с элементами
si = si( A,
R),
i = 1, 2, , N, и
si = si( A,
R),
i = 1, 2,
, M, соответственно.
Очевидно, из (100) следует
![]() | (102) |
и поэтому
![]() | (103) |
Отсюда следует, что система (95) редуцируется к следующей:
![]() | (104) |
где
![]() | (105) |
и
![]() | (106) |
Ясно, что D есть диагональная (N
N)-матрица, с элементами
![]() | (107) |
Следовательно, поскольку без ограничения общности можно принять, что
![]() | (108) |
то отсюда вытекают неравенства
![]() | (109) |
Отсюда следует, что если матрица
AAT невырожденная, то матрица
BBT = ( AR-1)( AR-1)T
лучше обусловлена,
чем
AAT. Но если
AAT вырожденная, то
2-6. В настоящем параграфе будет рассмотрена важная сторона
классического вариационного метода регуляризации - наличие так называемых
двой- ственных соотношений.
Заметим, прежде всего, что если R - невырожденная (т.е. обратимая)
(M
откуда
Одновременно ясно, что из (85) и (88) следует
Но из линейной алгебры известно соотношение
(см. [Воеводин, Кузнецов, 1984], стр. 214, упр. 29.9),
которое в принятых обозначениях записывается так:
Поэтому получаем, что выражения (111) и (112) дают для вектора
xa одно и то же значение. В этом
и состоит факт наличия для решений
xa,
получаемых в рамках классического вариационного метода А. Н. Тихонова,
двух внешне различных, но фактически тождественных,
представлений - получаемых из решения системы (22) и из соотношений (85)
и (87), то есть, как мы убедились выше, из "принудительной регуляризации"
системы (95), возникающей при решении условной экстремальной задачи (92)
с линейными ограничениями.
2-7. В заключение данного раздела, в котором получены принципиально
новые аналитические результаты, относящиеся к классическому вариационному
методу А. Н. Тихонова, заметим следующее. В целой серии работ 70-х-80-х
годов
А. Н. Кобрунов развивал так называемый "критериальный подход" к решению
задач
гравиметрии и магнитометрии, см.
[Кобрунов, 1978, 1979, 1982,
1983,
1985].
Суть этого подхода состоит в том, чтобы находить решения любых задач,
возникающих в гравиметрии и магнитометрии, как решение следующей
условной экстремальной задачи:
Здесь
J(x) - некоторый неотрицательный функционал, определенный на
элементах
x некоторого банахова (полного линейного нормированного)
пространства X,
fd - заданный элемент некоторого
другого банахова
пространства Y, A - линейный ограниченный оператор, действующий из X в Y.
По мнению А. И. Кобрунова, использование постановки (114) в
случае, когда
J(x) - строго выпуклый функционал, обеспечивает как
единственность, так и устойчивость решения - определения
x.
Однако разобранный выше частный случай, в котором
X = RN,
Y = RM, N
M)-матрица, то система (22) может быть переписана
в такой форме:
(110) (111) (112) (113) (114) M, т.е. X и Y суть конечномерные эвклидовы
пространства,
J(x) = | Rx|2E и
R - невырожденная матрица, т.е.
J(x) есть неотрицательный строго
выпуклый функционал, и A есть (N
M)-матрица, опровергает утверждение
А. И. Кобрунова. Именно, в этом случае устойчивость решения не обеспечивается,
если матрица
This document was generated by TeXWeb
(Win32, v.1.0) on July 4, 1999.