Аппроксимационный подход к решению задач гравиметрии и магнитометрии
В. Н. Страхов, А. В. Страхов

3. Новая теория регуляризации систем линейных алгебраических уравнений с приближенными данными

3-1. Изложенные в двух предыдущих разделах статьи основные положения и конструкции классической теории регуляризации (нахождения устойчивых приближенных решений, согласованных с имеющейся априорной информацией о помехе во входных данных и искомом решении) систем линейных алгебраических уравнений, с однозначностью свидетельствуют о том, что эта теория неадекватна реальной геофизической практике. Это однозначно следует из таких фактов:

1) в классической теории рассматривается только ситуация чисто аддитивных помех (в векторе правой части и матрицы), тогда как на практике достаточно часто встречаются и ситуации более общих мультипликативно-аддитивных помех;

2) в случае чисто аддитивных помех в задании правой части классическая теория основывается на допущении, что известной является величина d2 = ||df||2E квадрата эвклидовой нормы вектора помехи; фактически же эта величина никогда не бывает известна точно, в лучшем же случае бывают известны лишь постоянные в неравенствах

eqn128.gif(115)

и неравенство

eqn129.gif(116)

3) в подавляющем большинстве реальных геофизических ситуаций при наличии чисто аддитивной помехи в векторе правой части даже знание постоянных в неравенствах (115), если только имеет место ситуация, в которой

eqn130.gif(117)

оказывается недостаточным для нахождения приближенного решения удовлетворительного качества;

4) наиболее эффективные алгоритмы, порожденные классической теорией, оказываются весьма трудоемкими и не могут быть использованы для нахождения устойчивых приближенных решений систем большой размерности;

5) приемы уменьшения трудоемкости основных алгоритмов, порождаемых классической теорией, основаны на использовании ортогональных преобразований, построенных на аннулировании основной части элементов симметричных положительно полуопределенных матриц; однако такие преобразования в случае систем большой размерности "отказывают" из-за влияния ошибок округления.

Понимание всей совокупности указанных фактов с очевидностью свидетельствует о том, что нужна новая теория регуляризации (нахождения устойчивых приближенных решений) систем линейных алгебраических уравнений с приближенными данными, существенно более адекватная реальной геофизической практике, которая порождала бы методы (алгоритмы), более эффективные - по показателям точности и быстродействия - в случае систем большой размерности.

Подобная теория была разработана на протяжении последнего десятилетия В. Н. Страховым, [см. Страхов, 1991a, 1991b, 1991c, 1992a, 1992b, 1997d, 1997e, 1997f, 1997g, 1997h; Страхов, Тетерин, 1991a, 1991b, 1991c, 1993; Strakhov et al., 1995]; в последние годы в разработке этой новой теории и ее практической реализации принял участие и А. В. Страхов [Страхов, Страхов, 1998, 1999a, 1999b, 1999c, 1999d]. Изложению основных позиций этой новой теории и посвящены настоящий и следующий разделы статьи.

3-2. В классической теории регуляризации исходной системе (1) сопоставляется ее аппроксимация (2) (чисто аддитивная помеха только в правой части) и (62)-(63), (65) (аддитивная помеха в правой части и матрице). В рамках новой теории кроме указанных рассматриваются ситуации задания аппроксимаций

eqn131.gif(118)

где фактически задан вектор fd, E, и

ADx = fd,

eqn132.gif(119)

fd = (E + e)fd, E,

где фактически заданы матрица AD, D и вектор fd, E. Здесь E - единичная (NtimesN)-матрица, а e и D - диагональные матрицы,

eqn133.gif(120)

при этом

eqn135.gif(121)

так что матрицы (E + e) и (E + D) являются невырожденными.

Ниже будет показано, что случаи аппроксимаций (118), (120) и (119), (120) при условиях (121) в определенном смысле редуцируются к случаю аппроксимации (2), т.е. наличию чисто аддитивной помехи в задании правой части системы (1). Поэтому изложение основ новой теории целесообразно начать с рассмотрения основного частного случая задания аппроксимации (2) системы линейных уравнений (1).

3-3. Основой новой теории в случае чисто аддитивной помехи в векторе правой части системы являются следующие четыре положения.

1. Основная вычислительная процедура в любом методе - алгоритме - состоит в нахождении последовательности приближенных решений x(k), k = 1, 2, ldots, и соответствующих им векторов невязок

eqn136.gif(122)

и величин

eqn137.gif(123)

При этом каждое приближение x(k) характеризуется некоторым набором (вектором) параметров счета, то есть величин, по которым находится приближенное решение; обычно размерность вектора парамет- ров счета - от одного до трех. Желательно (хотя это и не всегда может быть гарантировано), монотонное убывание величин vk:

eqn138.gif(124)

Следует подчеркнуть, что нахождение последовательности приближенных решений x(K) отнюдь не означает, что используется какой-то итерационный процесс. Например, речь может идти о нахождении решений уравнения

eqn139.gif(125)

для последовательности значений ak, k = 1, 2, ldots; в этом случае x(k) = xak и ak суть параметр счета (единственный).

2. В каждом методе (алгоритме) присутствует некоторый вектор показателей качества решения; в этом векторе выделяются основные показатели качества решения (обычно - от одного до трех), и дополнительные показатели. С помощью основных показателей качества решений выделяются, среди всех приближенных решений x(k), так называемые пробные решения, с помощью же дополнительных показателей качества решений множество пробных решений сокращается до множества допустимых ре- шений.

Ясно, что с помощью основных показателей качества решения формируется и правило останова процесса нахождения приближенных решений. Ясно также, что в процессе счета должны запоминаться все пробные решения - и далее, после сужения множества пробных решений до множества допустимых решений, все допустимые решения.

В ситуации, когда известны постоянные в неравенствах (115), используется обычно один показатель качества - величина

eqn140.gif(126)

при этом пробными являются все те приближенные решения, для которых

eqn141.gif(127)

Процесс построения приближенных решений останавливается, коль скоро оказывается

eqn142.gif(128)

Кроме основного показателя качества (126) могут использоваться и другие основные показатели, например:

eqn143.gif(129)

Здесь x(kmin) - пробное решение с наименьшим значением k; при этом используется правило останова процесса построения последовательных приближений

eqn144.gif(130)

где Crit - априорно заданная величина.

Что касается дополнительных показателей качества, то в рассматриваемом случае это могут быть различного рода числовые величины, порождаемые априорной информацией о векторе помехи df.

Принципиально важно, что если имеет место ситуация, в которой выполняется неравенство (117), то именно последняя информация должна использоваться для задания основных показателей качества решения. Эта ситуация подробнее рассматривается ниже. В ней по существу нахождение множеств пробных и допустимых решений осуществляется с помощью эвристических процедур типа распознавания образов.

3. После того, как найдено множество допустимых приближенных решений системы (2), возникает проблема нахождения искомого - или окончательного, или оптимального - устойчивого приближенного решения. Эта проблема в рамках новой теории решается на основе принципа усреднения допустимых решений:

eqn145.gif(131)

где весовые коэффициенты pk имеют свойства

eqn146.gif(132)

Здесь Jk - подмножество значений индекса k для допустимых решений.

Ясно, что здесь возникает новая проблема - задания весовых множителей pk. Эта проблема детально обсуждается ниже, но сразу же подчеркнем тот факт, что и здесь основное значение имеют различного рода эвристические процедуры, и в конечном итоге - технологии распознавания образов.

4. Все три предыдущих положения относились к так называемой нормальной ситуации, в которой:

а) в последовательности приближенных решений x(k) всегда содержатся пробные приближенные решения, а останов процедуры построения приближенных решений осуществляется по значениям основных показателей качества приближенных решений;

б) число находимых допустимых решений, усреднением которых, см. (131)-(132), находится окончательное решение, достаточно велико:

eqn147.gif(133)

где R0 - заданная величина.

Однако на практике, как это показали достаточно многочисленные расчеты (описание которых будет дано в четвертой части работы), кроме нормальной, может встречаться и аномальная ситуация, в которой:

а) либо число найденных допустимых решений меньше R0 (см. (133));

б) либо вообще не находятся пробные (тем более - допустимые) приближенные решения.

В указанных ситуациях алгоритмы должны обеспечивать:

- в случае а) (число допустимых решений меньше R0 ) нахождение дополнительных допустимых решений;

- в случае б) (отсутствие пробных или допустимых решений) нахождение некоторого - единственного! - приближенного решения, которое и принимается за окончательное.

Здесь следует сразу же акцентировать внимание читателя на том обстоятельстве, что в рамках классической теории некорректно поставленных задач (по существу не адекватной реальной геофизической практике) никакие аномальные ситуации (обусловленные погрешностями округлений) по существу не принимались во внимание и не обсуждались.

В заключение параграфа подчеркнем, что практическая реализация установок новой теории требует создания принципиально новых компьютерных технологий, в которых в некотором смысле определяющее значение имеют управляющие подпрограммы, с помощью которых формируются последовательности векторов параметров счета - для нахождения последовательных приближений, а также осуществляется анализ получаемых приближенных решений - по значениям показателей качества решения, в целях, по существу, ответа на вопрос - "что такое хорошо, и что такое плохо". Эта управляющая программа одновременно должна обеспечивать перестройку вычислительного процесса в случае аномальных ситуаций.

3-4. В рамках новой теории регуляризации систем линейных алгебраических уравнений, ориентированной на создание компьютерных технологий, полностью адекватных реальной геофизической практике, и на решений систем линейных алгебраических уравнений большой и сверхбольшой размерности, используется ряд принципиально новых математических объектов и конструктивных идей. Обсуждению конструктивных идей посвящен последний раздел настоящей статьи и вторая часть работы, поэтому здесь остановимся лишь на некоторых новых математических объектах.

Первая группа объектов связано с оценками предельной относительной погрешности любых приближенных решений систем (1), заданных аппроксимациями (2), при использовании представлений

eqn148.gif(134)

здесь \Re суть (MtimesN)-матрица, заданная либо определяемая некоторыми условиями.

Оценочный функционал в случае аппроксимации (2) имеет вид

eqn149.gif(135)

Ясно, что к числу новых объектов первой группы принадлежит и сама матрица \Re, и функционал w( A,d\Re), и другие подобного рода функционалы, и следующие из оценок предельной относительной погрешности приближенных решений новые постановки безусловных и условных экстремальных задач, и многие другие объекты.

Вторая группа объектов связана с идеей более глубокого понимания метода наименьших квадратов и соответственно - перенесения ряда важных свойств решений, получаемых в методе наименьших квадратов, на регуляризованные решения.

Здесь прежде всего следует отметить характеристическое уравнение метода наименьших квадратов (26) и тот факт, что в вариационном методе А. Н. Тихонова оно не выполняется. Но легко показать, что если x есть некоторое приближенное решение, для которого

eqn150.gif(136)

то приближенное решение

eqn151.gif(137)

в котором принято

eqn152.gif(138)

уже удовлетворяет характеристическому уравнению метода наименьших квадратов

eqn153.gif(139)

При этом

eqn154.gif(140)

Все эти факты легко получаются, если рассмотреть задачу

eqn155.gif(141)

Ясно, что соотношение

eqn156.gif(142)

где d2 - априорно заданная величина, эквивалентно соотношению

eqn157.gif(143)

Выполнение же характеристического уравнения метода наименьших квадратов имеет принципиальное значение в тех (весьма часто встречающихся на практике) случаях, когда априорно известно, что полезный сигнал f и помеха df ортогональны:

eqn158.gif(144)

Далее. Из основного уравнения в методе наименьших квадратов следует, что ( x0 - решение системы(23)):

eqn159.gif(145)

Отсюда, как нетрудно найти, следует, что имеют место равенства

eqn160.gif(146)

где a(i) суть векторы-столбцы матрицы A, т.е. что вектор невязки для решения, найденного по методу наименьших квадратов, ортогонален ко всем столбцам матрицы A. Далее естественно ввести и использовать квадратичный функционал

eqn161.gif(147)

где

eqn163.gif(148)

для которого имеет место оценка

eqn164.gif(149)

и который при x = x0 (решению, получаемому по методу наименьших квадратов) обращается в ноль.

Третья группа объектов, культивируемых в новой теории регуляризации систем линейных алгебраических уравнений, это новые ортогональные преобразования. Точнее, речь идет об ортогональных преобразованиях вида

eqn165.gif(150)

в которых V и U суть ортогональные по столбцам матрицы размеров (N times N) и (M times M), соответственно, и которые представимы в форме произведений элементарных матриц плоского вращения, либо вида

eqn166.gif(151)

в которых Vk и Uk суть ортогональные по столбцам матрицы указанного выше вида. Так вот, речь идет о том, что параметры (  cosj и sinj, где j имеет соответствующие индексы) матриц элементарных плоских вращений выбираются совсем по-иному, чем в широко используемых в настоящее время процедурах. В последних (приведение к треугольной или двухдиагональной формам, к трехдиагональной или диагональной формам) параметры вращения выбираются из условия аннулирования некоторого элемента матрицы. В новых процедурах, разработанных В. Н. Страховым и А. В. Страховым (см. [Страхов, 1997d, 1997e, 1998d; Страхов, Страхов, 1999b, 1999c, 1999d; Страхов, Тетерин, 1993; Strakhov et al., 1995]), параметры преобразований выбираются из иных условий.

Наиболее важными новыми ортогональными преобразованиями являются:

1) процедура выметания одного столбца в другой;

2) процедура выметания одной строки в другую;

3) процедура раскорреляции данного столбца с данным вектором - за счет преобразования данного столбца с некоторым третьим (опорным);

4) процедура максимизации коэффициента корреляции некоторого (опорного) столбца с заданным - за счет преобразования этого столбца с некоторым третьим,

и ряд других, которые здесь обсуждать не будем, ибо эта тема будет подробно рассмотрена во второй части работы.

Значимость для вычислительной алгебры в целом, а не только для новой теории регуляризации систем линейных алгебраических уравнений, аппарата ортогональных преобразований видна из следующего примера. Пусть ортогональное преобразование (150) при VequivE осуществлено таким образом, что выполняются условия

eqn168.gif(152)

и

eqn169.gif(153)

где b(j) - векторы-столбцы матрицы B. В этом случае получаем (для системы (2))

eqn170.gif(154)

где

eqn171.gif(155)

и матрица C = B T B имеет следующую структуру

eqn172.gif(156)

Ясно, что решение системы (154) редуцируется к одному уравнению с одним неизвестным

eqn173.gif(157)

которое элементарным образом регуляризуется

eqn174.gif(158)

где a > 0 - параметр. Далее используются соотношения

eqn175.gif(159)

Таким образом, использование подходящих ортогональных преобразований позволяет получить весьма эффективный по быстродействию алгоритм, ибо считать матрицу D C вовсе не нужно!

Далее необходимо указать, что в построении целого ряда новых ортогональных преобразований матриц центральную роль играет сформулированная В. Н. Страховым концепция выметания матриц [Страхов, 1997e]. Ее суть в следующем: пусть в множестве всех пар индексов (i, j), 1le i le N, 1le j le M; выделено некоторое подмножество J пар индексов (i, j), которое является односвязным;*) через CJ обозначается подмножество пар индексов (i, j), получаемое из полного множества удалением подмножества J (ясно, что CJ уже может не быть связным множеством).

Рассматриваются две задачи:

первая - найти ортогональные по столбцам матрицы V и U, размеров (N times N) и (M times M), соответственно, из условия

eqn176.gif(160)

где O N и O M - множества всех ортогональных по столбцам матриц размеров (N times N) и (M times M), соответственно, |cdot|2E(J) - эвклидова норма матрицы, определенная по элементам, имеющим пары индексов (i, j), принадлежащих подмножеству J;

вторая - найти те же самые ортогональные по столбцам матрицы V и U из условия

eqn177.gif(161)

Поскольку, как хорошо известно [см. Воеводин, Кузнецов, 1984; Марчук, Кузнецов, 1972; Уилкинсон, Райнш, 1976; Фаддеев, Фаддеева, 1963]);

eqn178.gif(162)

то задачи (160) и (161) эквивалентны; ими определяются такие ортогональные преобразования, которые осуществляют перераспределение эвклидовой нормы матрицы A или выметание A в J. Очевидно, наиболее важным является тот случай, когда

eqn179.gif(163)

т.е. когда осуществляется полное выметание матрицы A на подмножество J, так что если V T AU = B и bi,j суть элементы B, то

eqn180.gif(164)

Ясно, что всегда можно выбирать матрицы V и U в форме

eqn181.gif(165)

eqn182.gif(166)

где T ip, jp(jp) и T iq, jq(yq) суть элементарные матрицы плоских вращений; при этом параметры вращения у этих матриц определяются в соответствии с основной постановкой - (160) или (161).

Во второй части работы будет подробно рассмотрен ряд конкретных ортогональных преобразований подобного типа.

Четвертая группа объектов - итерационные процессы нового типа, порождаемые последовательностями ортогональных преобразований матриц. Здесь существует большое разнообразие возможностей, которые будут подробно рассмотрены во второй части работы.

Наконец, пятая группа объектов - это различного рода функционалы, определяемые:

а) на векторах невязок r(k) = fd - A x(k);

б) на приближенных решениях x(k).

3-5. Обсудим теперь более подробно один из принципиальных элементов новой теории - оценки предельной относительной погрешности приближенных решений x, получаемых по соотношению (134), в котором есть некоторая заданная матрица размера (M times N) (в общем случае N M). Предполагается при этом, что точное решение x системы (1) существует.

Элементарные выкладки, в которых сначала используется схема Лаврентьева-Джона (6), с заменой d на , и далее очевидные неравенства

|( E - A)x|Ele | E - A|cdot|x|E,

eqn183.gif(167)

eqn184.gif

приводят к следующему результату

w( A, d; )le |E - A|

eqn185.gif(168)

le 2(| E - A|2E + n2||2E)1/2,

где

eqn186.gif(169)

При этом в (167) и (168) |cdot| суть спектральные нормы матриц, а |cdot|E - эвклидовы нормы матриц.

Далее - пусть известна лишь аппроксимация (62) уравнения (1), т.е. с погрешностью заданы и правая часть, и матрица системы. В этом случае вводится оценочный функционал

eqn187.gif(170)

Очевидно, имеем

w( A, d, D; )le | E - A|+ n||

le| E - ( AD - D A )|+ nprime||

= | E - AD| + (D + nprime)||

eqn188.gif(171)

le 2 (| E - AD|2 + (nast)2||2)1/2

le2(| E - AD|2 + ( nast)2||2E)1/2,

где положено

eqn189.gif(172)

Из неравенства (171) следует, что в случае задания аппроксимации (62) системы (1) можно принять, что матрица A D есть точная матрица, но правая часть fd задана с помехой df большей нормы, а именно

eqn191.gif(173)

где

eqn192.gif(174)

и

eqn193.gif(175)

Изложенная схема редукции задач нахождения устойчивых приближенных решений систем линейных алгебраических уравнений с приближенно заданными правыми частями и матрицами (помехи чисто аддитивные) к случаю задания аддитивной помехи только в правой части системы безусловно является принципиальной частью новой теории регуляризации систем линейных алгебраических уравнений.

Отметим здесь еще одно важное следствие оценки (171). Ясно, что если матрица A - квадратная, N=M, но вырожденная или очень плохо обусловленная, то тогда разумно перейти от матрицы A к матрице AD = A + D A с помощью искусственно введенного возмущения D A, введенного таким образом, чтобы матрица D A была уже разумным образом обусловлена. В таком случае, очевидно, разумно выбрать

eqn194.gif(176)

в этом случае оценка предельной относительной погрешности примет вид

eqn195.gif(177)

где

eqn196.gif(178)

и

eqn197.gif(179)

Очевидно, в оценке (177)-(179) могут фигурировать либо спектральные, либо эвклидовы норма матриц A D и A -1D. Ясно, из общих соображений (значение которых будет подробно рассмотрено во второй части работы), что целесообразно ввести следующее условие на вариацию D A матрицы A (в тех случаях, когда вариация осуществляется в целях регуляризации):

eqn198.gif(180)

при этом наиболее важным практически будет случай, когда в (178), (180) фигурирует эвклидова норма матриц.

Далее ясно, что подобного рода оценки могут быть (и даже обязательно должны быть) использованы и в том случае, когда рассматриваются системы линейных уравнений

eqn199.gif(181)

и

eqn200.gif(182)

и т.д. Расписывание соответствующих оценок предоставляется читателю. При этом ясно, что случай систем (181), равно как и систем

eqn201.gif(183)

является с точки зрения практики особенно важным, ибо матрицы C и CO - квадратные, размеров (M times M) и (N times N), соответственно, и C = C T, CO = CTOge 0.

Ясно одновременно, что случай систем (181) вписывается в изложенную выше схему, если просто принять в (134)

eqn202.gif(184)

а случай систем (183) - если принять

eqn203.gif(185)

в (184) \ReO есть (MtimesM)-матрица, а в (185) \Re~ есть (NtimesN)-матрица.

Забегая вперед (подробно этот вопрос будет рассматриваться во второй части работы), отметим также, что полученные оценки предельной относительной погрешности позволяют ввести в рассмотрение новые постановки безусловных и условных экстремальных задач, например

eqn204.gif(186)

или

eqn205.gif(187)

где D2 - априорно заданное число (см. соотношения (62), (65), и (177)-(179)).

Введение новых постановок безусловных и условных экстремальных задач - одна из отличительных черт новой теории регуляризации систем линейных алгебраических уравнений с приближенными данными.

3-6. Переходим к рассмотрению еще одной принципиальной стороны новой теории регуляризации систем линейных алгебраических уравнений - постановок задач построения регуляризованных алгоритмов в ситуации мультипликативно-аддитивных помех, в простейшем случае - в задании правой части системы, в более общем - в задании как правой части, так и матрицы системы, см. (118), (120)-(121); в этой связи см. работы [Страхов, 1991d, 1991e, 1991f, 1991g, 1991h, 1991i].

Начнем со случая задания аппроксимации (118), (120)-(121) системы (1). Наша основная цель состоит в том, чтобы установить факт принципиальной редукции задачи к нахождению устойчивого приближенного решения системы типа (2), т.е. к случаю чисто аддитивной помехи.

Пусть, как сказано выше, ei - суть компоненты диагональной матрицы e. Рассмотрим задачу

eqn206.gif(188)

где g>0 - параметр (который, вообще говоря, не имеет смысла параметра регуляризации), а aT(i) - i -ая вектор-строка матрицы A. Выполняя элементарные дифференцирования по ei и приравнивая производные нулю, с очевидностью получаем следующие соотношения:

eqn208.gif(189)

и при этих значениях ei

eqn209.gif(190)

eqn211.gif(191)

где Pg и Qg суть диагональные матрицы с элементами pi(g) и qi(g), соответственно равными:

eqn212.gif(192)

eqn213.gif(193)

Из (189)-(191) и (192), (193) следует, что если задана аппроксимация (118) системы (1), то фактически имеет место редукция к случаю задания аппроксимации (2), но с одним важным изменением. Именно, и в случае (118) для нахождения устойчивых приближенных решений системы (1) можно использовать алгоритмы, разработанные для аппроксимации (2), но при этом:

а) необходимо иметь априорную информацию как о векторе помехи df, так и о диагональной матрице помехи e;

б) в числе основных показателей качества приближенных решений x(k) должны использоваться величины:

eqn214.gif(194)

eqn215.gif(195)

eqn216.gif(196)

при этом, если величина

eqn217.gif(197)

априорно известна, то по ней должно определяться, в соответствии с (191), значение g = gk для каждого приближения x(k). Если же величина e2 неизвестна, а известны лишь оценки для нее сверху и снизу

eqn218.gif(198)

то ситуация сложнее - здесь необходимо использовать технику распознавания образов, основанную на совокупности множества показателей качества решения.

Можно, однако, ставить задачу построения оптимальных решений и в случае, когда вообще отсутствует информация о величинах ||df||E и ||e||E.

Далее. После всего сказанного о случае мультипликативно-аддитивной помехи в задании правой части системы легко понять, что более общий случай задания и правой части, и матрицы системы с мультипликативно-аддитивной помехой редуцируется к случаю чисто аддитивных помех в задании правой части и матрицы. Это следует из простейшего преобразования аппроксимации (119) к виду

eqn219.gif(199)

где

eqn220.gif(200)

и eO есть диагональная матрица с элементами

eqn221.gif(201)

Все остальное, в свете сказанного в данном параграфе относительно редукции аппроксимации (118) к аппроксимации (2), должно быть читателю достаточно очевидно.

3-7. Остается лишь высказать некоторые дополнительные соображения по поводу использования методов (алгоритмов) распознавания образов в процессе нахождения искомого устойчивого приближенного решения системы (1), заданной какой-либо аппроксимацией. Признание того, что без использования процедур распознавания в задаче нахождения устойчивых приближенных решений систем линейных алгебраических уравнений большой (тем более - сверхбольшой) размерности обойтись нельзя - принципиально важный элемент новой теории регуляризации, адекватной реальной геофизической практике.

Выше уже по существу было сказано, что распознавание образов может быть (и практически - должно!) использоваться в трех вариантах:

а) в анализе ситуации - нормальная она или аномальная;

б) при нахождении множеств пробных и допустимых приближенных решений;

в) при нахождении искомых - окончательных - приближенных решений на основе использования "принципа усреднения" допустимых решений, в специальной процедуре нахождения весовых коэффициентов pk.

Фактически процедуры распознавания образов реализуются в двух формах:

1) в форме рангового распознавания;

2) в форме эвристических процедур проверки некоторой совокупности логических условий, обычно - типа равенств и неравенств.

Ранговое распознавание используется в процедурах назначения весов и выделения множеств допустимых решений. Его суть в следующем. Пусть задано некоторое множество приближенных решений и для него необходимо указать совокупность некоторых характеристических числовых показателей. Например, в задаче сокращения множества пробных решений до множества допустимых решений такими показателями являются числа 1 и 0, 1 - для допустимых решений, 0 - для тех, которые не включаются в число допустимых. Равным образом в задаче нахождения весовых коэффициентов в правиле усреднения (131)-(132) допустимых решений эти коэффициенты и представляют собой характеристические числовые показатели.

Процедура рангового распознавания состоит в том, что вводится так называемое "признаковое пространство"; при этом роль "признаков" выполняют значения различных функционалов на приближенных решениях; обозначим эти функционалы wq,q = 1, 2, ldots, Q, а значения (неотрицательных) функционалов на приближенных решениях x(k), k = kmin, kmin + 1,ldots, kmax, через wqx(k)) = wq, k. Принимается, что все признаки (функционалы wq ) введены так, что чем меньше значение wq, k > 0, тем приближенное решение x(k) по данному признаку лучше. Совокупность приближенных решений {x(k)}k=kmink=kmax ранжируется по каждому признаку; соответствующие ранги rgwq, k изменяются от 1 до k = (kmax) - kmin + 1. При этом ранг 1 приписывается тому приближенному решению x(k), для которого wq, k = mink, ранг 2 - тому, для которого wq, k = mink из всех остальных приближенных решений, и т.д., смысл процедуры назначения рангов по q -му признаку ясен. Таким образом определяются ранги приближенных решений x(k), kmin le k le kmax, по всем признакам q, 1le qle Q. Далее осуществляется процедура определения для каждого приближенного решения суммарного ранга,

eqn222.gif(202)

Далее по найденным суммарным рангам и осуществляется нахождение характеристических числовых показателей. В задаче выделения допустимых решений назначается некоторое число Crit, и если выполняется неравенство

eqn223.gif(203)

то данному приближенному решению x(k) сопоставляется характеристический числовой показатель 1, т.е. x(k) считается допустимым решением; если же неравенство (203) места не имеет, то приближенному решению x(k) сопоставляется характеристическое число 0, т.е. это приближенное решение допустимым не считается.

В задаче же определения весовых множителей pk в принципе усреднения пробных решений используется формула

eqn224.gif(204)

в которой

eqn225.gif(205)

Теперь относительно процедур распознавания образов, основанных на использовании эвристических процедур проверки совокупности логических условий. Эти процедуры поясним на важнейшем примере выделения множеств пробных решений в ситуации, когда либо постоянные в неравенствах (115) неизвестны, либо нарушается условие достаточной близости d2min к d2max, см. (117). В данных процедурах также используется набор функционалов Wp(x)ge 0, p = 1, 2, ldots, P, при этом вводятся условия в форме неравенств, выделяющие пробные решения; если

eqn226.gif(206)

где C2min(p) и C2max(p) суть заданные постоянные, то приближенное решение x(k) является кандидатом в пробные решения по функционалу WP(x). Принимается, что если данное приближенное решение x(k) является кандидатом в пробные по заданной доле всех функционалов Wp(x) (например, оно является кандидатом в пробные не менее чем по 3/4 от общего числа функционалов), то оно причисляется к числу пробных. Критерии останова процедуры нахождения пробных решений с помощью проверки логических условий могут быть различными:

а) уже найдено априорно заданное число пробных решений;

б) подряд для заданного числа приближенных решений ни одно из них не оказалось принадлежащим к числу пробных (после того, как некоторое число пробных решений было уже найдено);

- и т.д., и т.п.

Во второй части работы оба основных подхода к использованию методов распознавания образов в компьютерных алгоритмах нахождения устойчивых приближенных решений систем линейных алгебраических уравнений с приближенными данными будут дополнительно обсуждены.

3-8. И самое последнее в данном разделе, посвященном изложению основных положений новой теории регуляризации систем линейных алгебраических уравнений с приближенными данными. В п. 1-2 было проведено классическое определение регуляризующего алгоритма по А. Н. Тихонову, [см. Иванов и др., 1978; Лисковец, 1981; Морозов, 1974, 1987; Танана, 1981; Тихонов, Арсенин, 1979; Тихонов и др., 1985]. В течение достаточно длинного периода (по крайней мере в 60-е-70-е годы) главным в теории линейных некорректных задач было именно доказательство регулярности различных конкретных алгоритмов, [см. Алифанов и др., 1998; Воеводин, 1969; Иванов, 1962, 1966, 1977; Иванов и др., 1978; Лаврентьев, 1955, 1959, 1962; Лисковец, 1981; Лоусон, Хенсон, 1986; Морозов, 1973, 1974, 1987; Танана, 1981]. Однако в дальнейшем было понято, что теоретического обоснования регулярности недостаточно, ибо наличие ошибок округления при реализации регулярных методов на практике может радикально изменять ситуацию. Именно по этой причине в данной статье доказательства регулярности различных обсуждаемых алгоритмов не приводятся.*)

В новой теории регуляризации систем линейных алгебраических уравнений с приближенными данными упор делается на других моментах:

1) нахождения достаточно точных и устойчивых приближенных решений систем в условиях большой априорной неопределенности в информации об искомом решении и полезном сигнале, а также помехах;

2) эффективности алгоритмов по быстродействию (что принципиально важно в случае систем большой и сверхбольшой размерности);

3) использовании распознавания образов для выделения допустимых решений и назначении коэффициентов в принципе усреднения допустимых решений.

По указанным причинам во второй части работы при описании конкретных методов проблема собственно регулярности алгоритмов нахождения допустимых решений рассматриваться не будет; этот аспект в рамках новой теории не имеет сколько-нибудь определяющего значения.


This document was generated by TeXWeb (Win32, v.1.0) on July 4, 1999.