Подпрограмма:  PDSYGV3

Назначение

Вычисление собственных значений, принадлежащих заданному интервалу (VL, VU), в обобщенной проблеме собственных значений для вещественных симметричных матриц A и B

Математическое описание

Данная подпрограмма реализует алгоритм вычисления собственных значений, принадлежащих заданному интервалу (VL, VU), для уравнений вида:

          (1)     Аx  =  λBx   ,

          (2)   АBx  =  λx   ,

          (3)   BАx  =  λx   ,

где  A  и  B - вещественные симметричные матрицы и матрица B положительно определена.

При помощи разложения Холецкого для матрицы B:  В = LLT исходные уравнения (1),(2) или (3) приводятся к стандартному виду Cy = λy, где

    для (1):  C  =  L - 1AL - T,  а   y  =  L-Tx .
    для (2):  C  =  L TAL   ,    а   y  =  L-Tx .
    для (3):  C  =  L TAL   ,    а   y  =  Lx .

Стандартная задача решается путем приведения симметричной матрицы C к трехдиагональному виду и вычисления собственных значений  λ неявным  QL - или QR - алгоритмом.

Собственные значения вычисляются с заданной точностью.

Подробнее см. в //http://srcc.msu.su/num_anal/par_prog/

Дж.Х. Уилкинсон, Алгебраическая проблема собственных значений, "Hаука", M., 1970.

Использование

         CALL  PDSYGV3 ( IBTYPE, UPLO, N, A, IA, JA, DESCA, B, IB, JB, DESCB,
                                         VL, VU, ABSTOL, M, W, WORK, LWORK,
                                         IWORK, LIWORK, IFAIL, INFO)

Параметры

IBTYPE - определяет вид обобщенной проблемы собственных значений:
если IBTYPE = 1 -  вид (1);
если IBTYPE = 2 -  вид (2);
если IBTYPE = 3 -  вид (3);
(глобальный входной параметр, тип целый);
UPLO - если UPLO = ' U ' - задается верхний треугольник матрицы A;
если UPLO = ' L ' - задается нижний треугольник матрицы A
(глобальный входной параметр, тип символьный);
N - порядок распределенной подматрицы sub (A); N ≥ 0 (глобальный входной параметр, тип целый);
A - массив двойной точности, распределенный по процессам блочно - циклическим образом (см.), глобальная размерность которого (N, N), а локальная размерность ( LLD_A, LOCc ( JA + N - 1)),
на входе - это локальная часть распределенной симметричной подматрицы sub(A);
если UPLO = ' U ', то используется только верхняя треугольная часть подматрицы sub(A);
если UPLO = ' L ', то используется только нижняя треугольная часть подматрицы sub(A);
на выходе - нижний треугольник (при UPLO = ' L ' ) или верхний треугольник (при UPLO = ' U ' ) матрицы sub(A), включая диагональ, не сохраняется (локальный входной параметр и локальный выходной параметр);
IA - глобальный номер строки матрицы A, который указывает на начало подматрицы, которая должна быть обработана (глобальный входной параметр, тип целый);
JA - глобальный номер столбца матрицы A, который указывает на начало подматрицы, которая должна быть обработана (глобальный входной параметр, тип целый);
DESCA - дескриптор распределенной матрицы A (одномерный массив длины DLEN);
если тип дескриптора одномерный ( DTYPE_A = 501),  DLEN ≥ 7,
если тип дескриптора двумерный    ( DTYPE_A = 1),      DLEN ≥ 9;
DESCA содержит информацию о размещении A в памяти; полное описание DESCA см. в разделе документации "Дескрипторы глобальных массивов" (глобальный и локальный входной параметр, тип целый);
B - массив двойной точности, распределенный по процессам блочно - циклическим образом (см.), глобальная размерность которого (N, N), а локальная размерность ( LLD_B, LOCc ( JB + N - 1)),
на входе - это локальная часть распределенной симметричной подматрицы sub(B);
если UPLO = ' U ', то используется только верхняя треугольная часть подматрицы sub(B);
если UPLO = ' L ', то используется только нижняя треугольная часть подматрицы sub(B);
на выходе, если INFO <= N, часть матрицы sub(B) содержит матрицу, замененную на треугольный множитель L из разложения Холецкого  sub(B) = L*L T (локальный входной параметр и локальный выходной параметр);
IB - глобальный номер строки матрицы B, который указывает на начало подматрицы, которая должна быть обработана (глобальный входной параметр, тип целый);
JB - глобальный номер столбца матрицы B, который указывает на начало подматрицы, которая должна быть обработана (глобальный входной параметр, тип целый);
DESCB - дескриптор распределенной матрицы B (одномерный массив длины DLEN);
если тип дескриптора одномерный ( DTYPE_B = 501),  DLEN ≥ 7,
если тип дескриптора двумерный    ( DTYPE_B = 1),      DLEN ≥ 9;
DESCB содержит информацию о размещении B в памяти; полное описание DESCB см. в разделе документации "Дескрипторы глобальных массивов" (глобальный и локальный входной параметр, тип целый);
VL - заданная нижняя граница интервала, в котором ищутся собственные значения (глобальный входной параметр, тип DOUBLE PRECISION);
VU - заданная верхняя граница интервала, в котором ищутся собственные значения (глобальный входной параметр, тип DOUBLE PRECISION);
ABSTOL - заданная абсолютная точность, с которой должны быть вычислены собственные значения;
заданная точность считается достигнутой, если собственное значение лежит в интервале [a, b], ширина которого не превосходит ABSTOL + EPS * MAX ( | a |, | b | ), где EPS - машинная точность;
если ABSTOL ≤ 0, то ABSTOL полагается равным EPS * norm ( D ), где norm ( D ) - первая норма трехдиагональной матрицы, полученной посредством преобразования матрицы A к трехдиагональной форме;
собственные значения будут вычислены с наибольшей точностью, если ABSTOL = 2 * PDLAMCH ('S'), где PDLAMCH ('S') = sfmin - минимальное вещественное число, при котором 1 / sfmin не вызывает переполнения; (глобальный входной параметр, тип DOUBLE PRECISION);
M - общее количество собственных значений, найденных в заданном интервале; 0 ≤ M ≤ N; (глобальный выходной параметр, тип целый);
W - одномерный массив двойной точности длины N; если  INFO = 0, собственные значения располагаются в нем по возрастанию (глобальный выходной параметр);
WORK - одномерный рабочий массив двойной точности длины LWORK;
на выходе, в элементе WORK (1) возвращается необходимая длина рабочего пространства
(локальное рабочее пространство, локальный выходной параметр);
LWORK - задаваемая длина рабочего пространства WORK;
LWORK ≥ 5 * N + MAX ( 5 * NN , NP0 * MQ0 + 2 * NB * NB) +
ICEIL( NEIG, NPROW * NPCOL) * NN, где
NP0 = NUMROC ( NN, NB, 0, 0, NPROW) - число строк локальной части матрицы sub (A);
MQ0 = NUMROC ( MAX(NEIG, NB, 2), NB, 0, 0, NPCOL) - число столбцов локальной части матрицы sub (A);
NEIG - число собственных векторов;
NB = DESCA (NB_);
NN = MAX( N, NB, 2 )
Минимальная требуемая величина LWORK может быть вычислена самой подпрограммой, если к ней обратиться со значением LWORK = -1; при этом подпрограмма не производит никаких других вычислений, а требуемое значение LWORK возвращается в элементе массива WORK (1);
(локальный входной параметр, тип целый);
IWORK - одномерный рабочий массив целого типа длины LIWORK;
на выходе в элементе IWORK (1) содержится необходимая длина рабочего пространства IWORK (локальное рабочее пространство, локальный выходной параметр);
LIWORK - задаваемая длина рабочего пространства IWORK;
LIWORK ≥ 6 * NNP, где NNP = MAX ( N, NPROW * NPCOL + 1, 4 );
минимальная требуемая величина LIWORK может быть вычислена самой подпрограммой, если к ней обратиться со значением LIWORK = - 1; при этом подпрограмма не производит никаких других вычислений, а требуемое значение LIWORK возвращается в элементе массива IWORK (1);
(локальный или глобальный входной параметр, тип целый);
IFAIL - обеспечивает дополнительную информацию, когда INFO ≠ 0;
если MOD (INFO/16,2) ≠ 0, то IFAIL содержит порядок наименьшего минора матрицы  B, который не является положительно определенным
(глобальный выходной параметр, тип целый);
INFO - целая переменная, диагностирующая результат работы подпрограммы (глобальный выходной параметр)
= 0 - успешное завершение работы;
< 0 - если i - ый фактический параметр подпрограммы является массивом и его j - ый элемент имеет недопустимое значение, тогда INFO = - ( i * 100 + j ), если i - ый фактический параметр является скаляром и имеет недопустимое значение, тогда INFO = - i;
> 0 - если (MOD(INFO/8,2).NE.0), то значит подпрограмма PDSTEBZ не смогла вычислить собственные значения;
если (MOD(INFO/16,2).NE.0), то значит матрица  B не является положительно определенной, и IFAIL содержит порядок наименьшего минора, который не является положительно определеннным.

Версии

PSSYGV3 -   PCHEGV3     PZHEGV3     вычисление собственных значений, принадлежащих заданному интервалу (VL, VU), в обобщенной проблеме собственных значений для вещественных симметричных (эрмитовых) матриц A и B для случаев вещественных данных одинарной точности, комплексных данных одинарной точности, комплексных данных двойной точности соответственно

Вызываемые подпрограммы

Здесь указаны только базовые подпрограммы (2 - ого уровня), которые вызываются из целевой подпрограммы (1 - ого уровня).

PDSYNGST - PZHENGST    приведение обобщенной проблемы собственных значений к стандартной форме
PDSYEV3 - PZHEEV3    вычисление собственных значений, принадлежащих заданному интервалу (VL, VU), симметричной (эрмитовой) матрицы в линейной проблеме собственных значений
PDPOTRF - PZPOTRF    приведение симметричной (эрмитовой) матрицы к трехдиагональной форме методом отражений
PDLAMCH - вычисление машинных параметров для арифметики с плавающей запятой

Замечания по использованию

  1.  В подпрограммах PSSYGV3, PCHEGV3, PZHEGV3 параметры A, B и WORK имеют тип REAL, COMPLEX и DOUBLE COMPLEX соответственно, а параметр W - REAL, REAL и DOUBLE PRECISION соответственно
  2.  Список параметров подпрограммы PZHEGV3 имеет следующий вид:

PZHEGV3 (IBTYPE, UPLO, N, A, IA, JA, DESCA, B, IB, JB, DESCB, VL, VU,
    ABSTOL, M, W, WORK, LWORK, RWORK, LRWORK, IWORK, LIWORK, IFAIL, INFO),
где дополнительные параметры RWORK и LRWORK означают:
   RWORK - одномерный рабочий массив двойной точности длины LRWORK;
                      на выходе в элементе RWORK (1) возвращается необходимая
                      длина рабочего массива RWORK (локальное рабочее пространство,
                      локальный выходной параметр);
 LRWORK - задаваемая длина рабочего пространства RWORK;
                       LRWORK ≥4*N + MAX( 5*NN, NP0 * MQ0 ) +
                                      ICEIL( NEIG, NPROW*NPCOL)*NN , где

                      NEIG = число требующихся собственных векторов
                      NB = DESCA( NB_ )
                      NN = MAX( N, NB, 2 )
                      NP0 = NUMROC( NN, NB, 0, 0, NPROW )
                      MQ0 = NUMROC( MAX( NEIG, NB, 2 ), NB, 0, 0, NPCOL )
                      (локальный входной параметр, тип целый);
  3.  Используются подпрограммы BLACS_GRIDINFO, DGEBR2D, DGEBS2D ( из пакета BLACS),
DSCAL ( из пакета BLAS),
LSAME, INDXG2P, NUMROC, CHK1MAT, PCHK2MAT, PXERBLA ( из библиотеки ScaLAPACK_TOOLS)

Пример использования

Вычисление собственных значений, принадлежащих заданному интервалу (VL, VU), в обобщенной проблеме собственных значений (1) для вещественных симметричных матриц A и B, которые имеют вид ( заданы только верхние треугольники ):

           |   10    2    3    1    1    |
           |    0   12    1    2    1    |
           |    0    0   11    1   -1    |
           |    0    0    0    9     1    |
           |    0    0    0    0   15    |

           |   12    1   -1    2    1    |
           |    0   14    1   -1    1    |
           |    0    0   16   -1    1    |
           |    0    0    0   12   -1    |
           |    0    0    0    0   11    |

Порядок матриц N = 5.
Пусть матрицы разбиваются на блоки с размером блоков NB = 2.

Осуществляется пропуск программы на 4 процессах, которые образуют решетку 2 на 2.

Фрагмент фортранного текста вызывающей программы.
(полный текст теста можно получить в tdsygv31.zip, а принятые обозначения - посмотреть в разделе документации "Обозначения и упрощения в примерах по использованию подпрограмм комплекса").

Матрицы A и B инициализируются посредством обращения к подпрограмме PDELSET из библиотеки ScaLAPACK_TOOLS.

      PROGRAM TDSYGV31
      include 'mpif.h'
      INTEGER                         LWORK, LIWORK, MAXN, LDA, MAXPROCS, NOUT
      PARAMETER                  ( LDA = 100, LWORK = 5577, MAXN = 100, LIWORK = 30,
    $                                         MAXPROCS = 512, NOUT = 6 )
      CHARACTER                 UPLO
      PARAMETER                 ( UPLO = 'U' )
      INTEGER                        CTXT, I, IAM, INFO, MYCOL, MYROW, N, NB, IFAIL,
    $                                        NPCOL, NPROCS, NPROW, IA, JA, IB, JB, IBTYPE
      DOUBLE PRECISION    ABSTOL, VL, VU
*
      INTEGER                        DESCA( 9 ), DESCB(9), IWORK( LIWORK )
      DOUBLE PRECISION   A( LDA, LDA ),  B( LDA, LDA ), W( MAXN ),
    $                                        WORK( LWORK ), WORK1( 5 )
*
      EXTERNAL                    BLACS_EXIT, BLACS_GET, BLACS_GRIDEXIT,
    $                                        BLACS_GRIDINFO, BLACS_GRIDINIT, BLACS_PINFO,
    $                                        BLACS_SETUP, DESCINIT, PDMATINIT, PDLAPRNT,
    $                                        PDSYGV3
*
      N = 5
      NB = 2
      NPROW = 2
      NPCOL = 2
      IA = 1
      JA = 1
      IB = 1
      JB = 1
      VL = 0.5D0
      VU = 1.5D0
      IBTYPE = 1
*
      CALL  BLACS_PINFO( IAM, NPROCS )
      IF( ( NPROCS .LT. 1 ) ) THEN
         CALL  BLACS_SETUP( IAM, NPROW*NPCOL )
      END IF
*
      CALL  BLACS_GET( -1, 0, CTXT )
      CALL  BLACS_GRIDINIT( CTXT, 'R', NPROW, NPCOL )
      CALL  BLACS_GRIDINFO( CTXT, NPROW, NPCOL, MYROW, MYCOL )

      IF( MYROW .EQ. -1 ) GO TO 20
      ABSTOL = 2.0D0* PDLAMCH(CTXT,'U')

      CALL  DESCINIT( DESCA, N, N, NB, NB, 0, 0, CTXT, LDA, INFO )
      CALL  DESCINIT( DESCB, N, N, NB, NB, 0, 0, CTXT, LDA, INFO )
      CALL  DESCINIT( DESCZ, N, N, NB, NB, 0, 0, CTXT, LDA, INFO )

* Построение матриц A и B

      CALL  PDMATINIT( N, A, IA, JA, DESCA, B, IB, JB, DESCB, INFO )

* Решение обобщенной проблемы собственных значений

      CALL  PDSYGV3( IBTYPE, UPLO, N, A, IA, JA, DESCA, B, IB, JB, DESCB, VL, VU, ABSTOL,
                                    M, W, WORK, LWORK, IWORK, LIWORK, IFAIL, INFO )

      CALL  BLACS_GRIDEXIT( CTXT )
 20 CONTINUE

      CALL  BLACS_EXIT( 0 )
      STOP
      END
*
      SUBROUTINE  PDMATINIT( N, A, IA, JA, DESCA, B, IB, JB, DESCB, INFO )
*
* PDMATINIT генерирует и распределяет матрицы A и B по решетке процессов
*
      INTEGER                        IA, INFO, JA, N
      INTEGER                        DESCA( * ), DESCB( * )
      DOUBLE PRECISION   A( * ), B( * )
      INTEGER                        I, J, MYCOL, MYROW, NPCOL, NPROW
      EXTERNAL                    PDELSET
      INTRINSIC                     DBLE
*
      INFO = 0
*
      IF( IA .NE. 1 ) THEN
         INFO = -3
      ELSE IF( JA .NE. 1 ) THEN
         INFO = -4
      END IF
*
      DO 2  J = 1, N
      DO 1  I = 1, N
       CALL  PDELSET( A, I, J, DESCA, 0.0D0)
       CALL  PDELSET( B, I, J, DESCB, 0.0D0)
   1 CONTINUE
   2 CONTINUE
*
      DO 3  I = 1, N-1
          J = I + 1
            CALL  PDELSET( A, I, J, DESCA, 1.0D0)
            CALL  PDELSET( B, I, J, DESCB, 1.0D0)
         END IF
   3 CONTINUE
*
      J = N
      DO 5  I = 1, N-1
       CALL  PDELSET( A, I, J, DESCA, 1.0D0)
       CALL  PDELSET( B, I, J, DESCB, 1.0D0)
   5 CONTINUE
*
       CALL  PDELSET( A, 1, 1, DESCA, 10.0D0)
       CALL  PDELSET( A, 1, 2, DESCA, 2.0D0)
       CALL  PDELSET( A, 1, 3, DESCA, 3.0D0)
       CALL  PDELSET( A, 1, 4, DESCA, 1.0D0)
       CALL  PDELSET( A, 2, 2, DESCA, 12.0D0)
       CALL  PDELSET( A, 2, 4, DESCA, 2.0D0)
       CALL  PDELSET( A, 3, 3, DESCA, 11.0D0)
       CALL  PDELSET( A, 3, 5, DESCA, -1.0D0)
       CALL  PDELSET( A, 4, 4, DESCA, 9.0D0)
       CALL  PDELSET( A, 5, 5, DESCA, 15.0D0)
*
       CALL  PDELSET( B, 1, 1, DESCA, 12.0D0)
       CALL  PDELSET( B, 1, 3, DESCA, -1.0D0)
       CALL  PDELSET( B, 1, 4, DESCA, 2.0D0)
       CALL  PDELSET( B, 2, 2, DESCA, 14.0D0)
       CALL  PDELSET( B, 2, 4, DESCA, -1.0D0)
       CALL  PDELSET( B, 3, 3, DESCA, 16.0D0)
       CALL  PDELSET( B, 3, 4, DESCA, -1.0D0)
       CALL  PDELSET( B, 4, 4, DESCA, 12.0D0)
       CALL  PDELSET( B, 4, 5, DESCA, -1.0D0)
       CALL  PDELSET( B, 5, 5, DESCA, 11.0D0)
*
      RETURN
      END

Результаты:

 Значение  INFO  =   0
                        M = 4

 Собственные значения:

  W(1) =  0.663662748392315
  W(2) =  0.943859004668386
  W(3) =  1.10928454001752
  W(4) =  1.49235323254300