Подпрограмма:  CAL_GESVD1N

Назначение

Организация вызова подпрограмм вычисления сингулярных чисел матриц и вычисление времени, затраченного на решение задачи

Описание

Эта служебная подпрограмма организует за пользователя правильный вызов целевых подпрограмм вычисления сингулярных чисел матриц и вычисление времени, затраченного на решение задачи на заданном числе параллельных процессов (NPROCS) с матрицей заданного порядка (N) и при заданных параметрах распараллеливания (NPROW, NPCOL, NB ).
Сначала она либо считывает из внешнего файла, заданную пользователем исходную матрицу, либо строит некую "стандартную" матрицу порядка N; распределяет её части(блоки) по параллельным процессам в соответствии с используемыми алгоритмами и формирует правильный список фактических параметров для выбранной пользователем целевой подпрограммы.
После этого осуществляет вызов и счет по этой подпрограмме, вычисляя при этом время, прошедшее с момента обращения к подпрограмме до момента выхода из неё. Полученный массив сингулярных чисел записывается во внешний файл.

Литература:

http://software.intel.com/en-us/articles/intel-math-kernel-library-documentation/
http://www.netlib.org/scalapack/slug/index.html
http://num_anal.srcc.msu.ru/par_prog/

Использование

         CALL  CAL_GESVD1N( NAME, M, N, NPROW, NPCOL, AMEM, MEMSIZE,
                                                        NB, INFILEA, OUTFILE, TFILE, NPRT, CTXT )

Параметры

NAME - имя целевой подпрограммы, при применении которой для решения задачи вычисляется время, затраченное на ее решение (одно из PDGESVD1, PDGESVD4); (входной параметр, тип символьный);
M - число строк исходной матрицы, при котором вычисляется время, затраченное на решение задачи (входной параметр, тип целый);
N - число столбцов исходной матрицы, при котором вычисляется время, затраченное на решение задачи (входной параметр, тип целый);
NPROW - число строк в решетке процессов, для которой измеряется время на решение задачи (входной параметр, тип целый);
NPCOL - число столбцов в решетке процессов, для которой измеряется время на решение задачи (входной параметр, тип целый);
AMEM - массив локальной рабочей памяти, в которую распределяется локальная часть исходной матрицы, хранятся элементы рабочих массивов, где формируются локальные части массива сингулярных чисел (входной параметр, тип DOUBLE PRECISION);
MEMSIZE - задаваемый размер массива AMEM, который должен быть больше или равен значению параметра MMIN, выданному пользователю соответствующей подпрограммой вычисления параметров PAR_GESVD1 при задании ей набора параметров распараллеливания, при которых измеряется время, затраченное на решение задачи (см.Автоматизация доступа к подпрограммам Комплекса (входной параметр, тип целый);
NB - размер блока, матрицы, при котором измеряется время на решение задачи (входной параметр, тип целый);
INFILEA - имя файла, содержащего исходную матрицу (A) либо "  "(пробел); в последнем случае будет использована некая "стандартная" матрица заданного порядка (входной параметр, тип символьный);
OUTFILE - имя файла, в который в результате работы подпрограммы будет записан результирующий массив сингулярных чисел (входной параметр, тип символьный).
TFILE - имя файла, в который записывается время, затраченное на решение задачи при заданном наборе параметров распараллеливания;
при обращении к подпрограмме CAL_GESVD1N в цикле с разными наборами параметров распараллеливания в данный файл будут записаны все результаты таймирования, полученные при всех вычислительных экспериментах, выполненных в данном запуске подпрограммы BSTPAR9, инициирующей групповой запуск нескольких вычислительных экспериментов (т.е. нескольких вызовов подпрограммы CAL_GESVD1N с разными наборами параметров) (входной параметр, тип символьный);
NPRT - режим выдачи результатов вычислительного эксперимента:
= 0 - на печать не выдается ничего, кроме минимального времени счета полученного в данном эксперименте и значений параметров распараллеливания, при которых получено это минимальное время;
= 1 - на печать выдаются все результаты таймирования ( при всех испытанных в данном групповом запуске наборах параметров распараллеливания );
= 2 - на печать выдается все то же самое, что и при NPRT = 1, а также результаты решения самой задачи целевой программой Комплекса для заданной матрицы;
= 3 - на печать выдается все то же самое, что и при NPRT = 2, а также все входные параметры и матрицы
(входной параметр, тип целый);
CTXT - значение параметра контекста, соответствующего выбранной решетке процессов (входной параметр, тип целый)

Вызываемые подпрограммы

Здесь указаны только целевые (1 - ого уровня) и базовые подпрограммы (2 - ого уровня), которые вызываются из целевых подпрограмм.

PDGESVD1 - PDGESVD4    сингулярное разложение квадратной матрицы с вычислением всех сингулярных чисел;
сингулярное разложение прямоугольной матрицы с вычислением всех сингулярных чисел;
соответственно
MINTGESVD1 - Построение некоторой "стандартной" квадратной матрицы заданного порядка N и распределение ее частей(блоков) по параллельным процессам ( в том случае, если не был задан файл с исходной матрицей )

Замечания по использованию

  1.  Используются подпрограммы BLACS_EXIT, BLACS_GET, BLACS_GRIDEXIT, BLACS_GRIDINFO BLACS_GRIDINIT, BLACS_PINFO, BLACS_SETUP, IGSUM2D ( из пакета BLACS в составе MKL-библиотеки), DESCINIT, ICEIL, NUMROC, PDLAPRNT ( из пакета ScaLAPACK(TOOLS) в составе MKL-библиотеки), PDLAREAD, PDLAWRITE, MPI_Wtime()
  2.  Время, затраченное на решение задачи, присваивается переменной  time,  описанной в общем блоке

Пример использования

Требуется вычислить время, необходимое для вычисления сингулярных чисел матрицы с помощью подпрограммы PDGESVD1.
При этом матрица - порядка 7000. Для решения задачи предполагается использовать 8 процессоров, образующих решетку 8 * 1.
Матрица делится на блоки 70 * 70 (т.е. NB = 70 )
При предварительном обращении к подпрограмме PAR_GESVD1 с указанными выше параметрами был вычислен максимальный размер локальной памяти, необходимой для решения задачи MMIN = 6593933. Для вычисления используется "стандартная" матрица, построение и распределение которой по процессам выполняется служебной подпрораммой  MINTGESVD1.

Фрагмент фортранного текста вызывающей программы
(полный текст теста можно получить в tcl_gesvd1n.zip)

      PROGRAM   TCL_GESVD1N
      include 'mpif.h'
      INTEGER                         M, N, NPROW, NPCOL, NB, MEMSIZE
*
      PARAMETER          ( N=7000, NB=70, MEMSIZE= 6700000, NPRT= 1 )
*
      DOUBLE PRECISION   AMEM( MEMSIZE )
      CHARACTER*(*)           NAME
      CHARACTER                 INFILEA*(*), OUTFILE*(*), TFILE*(*)
      PARAMETER         ( INFILEA = '  ',
     $                                OUTFILE = 'BSTPARRES',
     $                                TFILE = 'BSTRES')
*
      PARAMETER         ( NAME = 'PDGESVD1')
      COMMON            time, J
      EXTERNAL    CAL_GESVD1N, BLACS_GET, BLACS_GRIDINIT, BLACS_GRIDINFO
*
      NPROW = 8
      NPCOL = 1
*
      CALL  BLACS_GET( -1, 0, CTXT )
*
      CALL  BLACS_GRIDINIT( CTXT, 'R', NPROW, NPCOL )
      CALL  BLACS_GRIDINFO( CTXT, NPROW, NPCOL, MYROW, MYCOL )
*

      CALL  CAL_GESVD1N(NAME, M, N, NPROW, NPCOL, AMEM, MEMSIZE, NB,
     $                                          INFILEA, OUTFILE, TFILE, NPRT, CTXT )
*

      STOP
      END

Результаты:

   Время решения задачи   time  =   0.285D+03

 Сингулярные числа матрицы (в файле OUTFILE)

     S(1) =   34045148.0661785 ;
     S(2) =   6260093.41975719 ;

      .  .  .  .  .  .  .  .  . 

  S(6998) =   3.50220686755503 ;
  S(6999) =   2.28844031095804 ;
  S(7000) =   1.00000000287643 ;

 Добавим, что минимальное время получено для решетки (  2,  4 ) и  NB =  42    time =  0.262D+03