Аппроксимационный подход к решению задач гравиметрии и магнитометрии
В. Н. Страхов, А. В. Страхов

2. Метод регуляризованных расширенных систем линейных алгебраических уравнений 2-го рода и некоторые свойства метода вариационной регуляризации

2-1. Рассматриваемый в данном разделе первой части работы метод регуляризованных расширенных систем линейных алгебраических уравнений 2 - го рода безусловно имеет определенную историю (см. работы [Альберт, 1977; Лоусон, Хенсон, 1986]), однако он до самого последнего времени находился как бы в "тени", во всяком случае он не подвергался достаточно глубокому изучению и различным обобщениям.

Отправной пункт в методе - введение вектора невязки

eqn088.gif(79)

и объединение уравнений (23) и (79) в одну систему*)

eqn089.gif(80)

Тот факт, что из (80) следует и (23) и (79), легко проверяется непосредственно.

Регуляризация системы (80) осуществляется исключительно просто - необходимо нулевой блок в правом нижнем углу матрицы S (которую не следует путать с матрицей-регуляризатором в методе М. М. Лаврентьева, см. (10)-(13)) заменить на матрицу a RT R, где R - матрица-регуляризатор, фигурирующая в методе А. Н. Тихонова, см. (21)-(22). Таким образом регуляризованная система имеет вид:

eqn090.gif(81)

Из вида матрицы Sa, которая представляет собой сумму симметричной и кососимметричной матриц,

eqn091.gif(82)

причем симметричная матрица невырожденная, следует, что при любом a>0 матрица Sa, определенная по (82), является невырожденной.

2-2. Ясно, что переход к регуляризованной расширенной системе (81) имеет то достоинство, что не нужно находить произведение матриц AT A ; ясно также, что в случае R = E имеем RT R = E и второе произведение матриц находить также не надо. Кроме того, если N gg M, то при любом a система (81) есть система с блочно-стреловидной матрицей и здесь может быть эффективно использована компактная схема разложения матрицы на треугольные множители.

2-3. Однако главные достоинства перехода к расширенной регуляризованной системе в другом:

во-первых, возникает возможность более глубокого и детального анализа свойств вариационного метода А. Н. Тихонова;

во-вторых, возникает возможность глубокого обобщения вычислительных алгоритмов на случай наличия дифференцированной информации о векторе помехи.

В данном параграфе осуществляется нахождение ряда принципиально важных соотношений, имеющих место в вариационном методе А. Н. Тихонова.

Прежде всего, если исключить из системы (81) вектор ra,

eqn092.gif(83)

то получим определяющее соотношение метода А. Н. Тихонова

eqn093.gif(84)

Далее - если, наоборот, исключать из системы (81) вектор xa, то получим следующую совокупность формул:

eqn094.gif(85)

eqn095.gif(86)

eqn096.gif(87)

При этом в (85)-(87) принято

eqn097.gif(88)

Из (85)-(88) следуют такие принципиально важные факты:

1) вектор xa выражается через ra, иначе - искомое регуляризованное решение выражается линейно через вектор невязки для регуляризованного решения;

2) вектор fa = Axa, представляющий собой приближенное описание вектора полезного сигнала f, выражается линейно через вектор невязки регуляризованного решения;

3) в выражениях xa и fa через ra фигурирует величина m, которая при d 0 стремится к бесконечности;

4) вектор невязки регуляризованного решения в методе А. Н. Тихонова удовлетворяет независимому уравнению (22);

5) в выражении fa через ra и в уравнении для ra фигурирует симметричная положительно определенная матрица

eqn098.gif(89)

которая в случае, когда R суть квадратная (M times M)-матрица, может быть записана в форме

eqn099.gif(90)

Свойства 1) и 2) решений, получаемых в рамках вариационного метода А. Н. Тихонова, свидетельствуют о возможности возникновения в нем эффектов заглаживания; не имея возможности подробно останавливаться на этом моменте, отметим лишь необходимость проведения спектрального анализа, основанного либо на сингулярном разложении матрицы B,

eqn100.gif(91)

либо на сингулярном разложении пары матриц (A, R), см. [Лоусон, Хенсон, 1986].

2-4. Свойства 4) и 5) требуют более глубокого проникновения в суть конструкций (85)-(87), что в конечном итоге позволит более глубоко осознать вариационную природу нового метода (28)-(32).

Именно, пусть сначала N < M; рассмотрим условную экстремальную задачу

eqn101.gif(92)

Как обычно, используем стандартную процедуру редукции условной экстремальной задачи (92) к семейству безусловных экстремальных задач с помощью множителей Лагранжа li, 1le ile N:

eqn103.gif(93)

здесь a(i) суть i -ая вектор-строка матрицы A. Используя классическое правило экстремума, найдем, что возникает соотношение для x:

eqn104.gif(94)

откуда, вместе с линейными условиями в (92), следует, что вектор l = (l1, l2, ldots, lN)T удовлетворяет уравнению

eqn105.gif(95)

Осуществим далее регуляризацию методом М. М. Лаврентьева уравнения (95) для вектора l:

eqn106.gif(96)

Соответственно введем регуляризованное решение xa, сделав очевидные замены в (94):

eqn107.gif(97)

Ясно далее, что если принять

eqn108.gif(98)

то соотношение (97) перейдет в соотношение (85), а соотношение (96) - в соотношение (87). Ясно также, что условие N < M не является, вообще говоря, необходимым; конструкция, получаемая в рамках условной экстремальной задачи (92), остается в силе и при N ge M.

Из сказанного вытекают три принципиальных вывода:

во-первых, что условная экстремальная задача (92), в которой ищется минимум квадратичного функционала при линейных ограничениях, оказывается существенно отличной от условной экстремальной задачи (16), в которой фигурирует одно квадратичное ограничение-равенство; именно, во втором случае всегда возникает невырожденная система с симметричной положительно определенной матрицей, а в первом случае система хотя и имеет симметричную положительно полуопределенную матрицу, но последняя может быть и вырожденной;

во-вторых, использование "принудительной регуляризации" системы (95) по М. М. Лаврентьеву (которая, как мы видели в предыдущем разделе статьи, см. п. 1-3, представляет собой процедуру, основанную на решении некоторой условной вариационной задачи) с выбором S=E, приводит к пониманию физического смысла множителей Лагранжа li - это суть приближения к величинам li, a, которые просто равны компонентам вектора mra = raa, ra - вектор невязки для решения xa, получаемого в рамках вариационного метода А. Н. Тихонова;

в-третьих, очевидно, что обобщение конструкции "принудительной регуляризации" состоит в том, чтобы вместо (96) использовать

eqn109.gif(99)

где - заданная (Q times N)-матрица; суть этого обобщения в том, что здесь возникает конструкция регуляризованной системы с двумя матрицами-регуляризаторами - R (которая "скрыта" в матрице W, см. (95)) и .

2-5. Подход, основанный на введении условной экстремальной задачи (92) с линейными ограничениями, с дальнейшей "принудительной регуляризацией" системы (95), заслуживает более глубокого изучения, которое и проводится в настоящем и следующем параграфах.

Первый принципиальный факт состоит в том, что системой (95) (случай N le M) обеспечивается мультипликативная регуляризация системы (2). Смысл этой конструкции раскрывается, если воспользоваться сингулярным разложением пары матриц (A,R) (о понятии сингулярного разложения пары матриц [см. Лоусон, Хенсон, 1986]):

eqn110.gif(100)

где V и U суть ортогональные по столбцам матрицы размеров (N times N)- и (M times M)-, соответственно, а X есть невырожденная (M times M)-матрица; при этом

eqn112.gif(101)

и SA, SR суть диагональные матрицы с элементами si = si( A, R), i = 1, 2, ldots, N, и si = si( A, R), i = 1, 2, ldots, M, соответственно.

Очевидно, из (100) следует

eqn113.gif(102)

и поэтому

eqn114.gif(103)

Отсюда следует, что система (95) редуцируется к следующей:

eqn115.gif(104)

где

eqn116.gif(105)

и

eqn117.gif(106)

Ясно, что D есть диагональная (N times N)-матрица, с элементами

eqn118.gif(107)

Следовательно, поскольку без ограничения общности можно принять, что

eqn119.gif(108)

то отсюда вытекают неравенства

eqn120.gif(109)

Отсюда следует, что если матрица AAT невырожденная, то матрица BBT = ( AR-1)( AR-1)T лучше обусловлена, чем AAT. Но если AAT вырожденная, то BBT также вырожденная. Улучшение обусловленности BBT по сравнению с AAT, достигаемое за счет умножения A на R-1, и составляет суть мультипликативной регуляризации, которая однако, полностью проблемы не решает - необходима дополнительная "принудительная регуляризация", достигаемая переходом от (95) к (96).

2-6. В настоящем параграфе будет рассмотрена важная сторона классического вариационного метода регуляризации - наличие так называемых двой- ственных соотношений.

Заметим, прежде всего, что если R - невырожденная (т.е. обратимая) (M times M)-матрица, то система (22) может быть переписана в такой форме:

eqn122.gif(110)

откуда

eqn123.gif(111)

Одновременно ясно, что из (85) и (88) следует

eqn124.gif(112)

Но из линейной алгебры известно соотношение (см. [Воеводин, Кузнецов, 1984], стр. 214, упр. 29.9), которое в принятых обозначениях записывается так:

eqn125.gif(113)

Поэтому получаем, что выражения (111) и (112) дают для вектора xa одно и то же значение. В этом и состоит факт наличия для решений xa, получаемых в рамках классического вариационного метода А. Н. Тихонова, двух внешне различных, но фактически тождественных, представлений - получаемых из решения системы (22) и из соотношений (85) и (87), то есть, как мы убедились выше, из "принудительной регуляризации" системы (95), возникающей при решении условной экстремальной задачи (92) с линейными ограничениями.

2-7. В заключение данного раздела, в котором получены принципиально новые аналитические результаты, относящиеся к классическому вариационному методу А. Н. Тихонова, заметим следующее. В целой серии работ 70-х-80-х годов А. Н. Кобрунов развивал так называемый "критериальный подход" к решению задач гравиметрии и магнитометрии, см. [Кобрунов, 1978, 1979, 1982, 1983, 1985]. Суть этого подхода состоит в том, чтобы находить решения любых задач, возникающих в гравиметрии и магнитометрии, как решение следующей условной экстремальной задачи:

eqn126.gif(114)

Здесь J(x) - некоторый неотрицательный функционал, определенный на элементах x некоторого банахова (полного линейного нормированного) пространства X, fd - заданный элемент некоторого другого банахова пространства Y, A - линейный ограниченный оператор, действующий из X в Y. По мнению А. И. Кобрунова, использование постановки (114) в случае, когда J(x) - строго выпуклый функционал, обеспечивает как единственность, так и устойчивость решения - определения x.

Однако разобранный выше частный случай, в котором X = RN, Y = RM, N le M, т.е. X и Y суть конечномерные эвклидовы пространства, J(x) = | Rx|2E и R - невырожденная матрица, т.е. J(x) есть неотрицательный строго выпуклый функционал, и A есть (N times M)-матрица, опровергает утверждение А. И. Кобрунова. Именно, в этом случае устойчивость решения не обеспечивается, если матрица AAT является вырожденной, следовательно, вырожденной является и матрица W = ( AR-1) ( AR-1)T. Таким образом, как было показано выше, даже в данном простейшем случае необходимо использовать дополнительную "принудительную регуляризацию", т.е. переход к системе (96). Система же (95) реализует специфическую "мультипликативную регуляризацию", которая в случае вырожденных систем недостаточна.


This document was generated by TeXWeb (Win32, v.1.0) on July 4, 1999.