Выбор пaраметров распараллеливания для целевой программы комплекса PARALG, вычисления собственных значений матрицы общего вида
Эта служебная подпрограмма выбирает и вычисляет за пользователя параметры распараллеливания, которые конкретизируют распределение вычислений между параллельными процессами и значения которых необходимо передавать целевой программе вычисления собственных значений матрицы общего вида
Литература:
http://num_anal.srcc.msu.ru/par_prog/
http://software.intel.com/en-us/articles/intel-math-kernel-library-documentation/
http://www.netlib.org/scalapack/slug/index.html
CALL PAR_GEEV1(N, NPROCS, MMIN, NB, NPROW, NPCOL)
Параметры
N - | порядок исходной матрицы (входной параметр, тип целый); |
NPROCS - | число процессов, которое может выделить пользователь для решения задачи (входной параметр, тип целый); |
MMIN - | минимальное количество локальной памяти, которое необходимо выделить на каждом из параллельных процессов для решения задачи (выходной параметр, тип целый); |
NB - | величина блока, на которые делится исходная матрица; NB полагается равным 0, если пользователь доверяет выбор его значения этой подпрограмме (входной и выходной параметр, тип целый); |
NPROW - | число строк в решетке процессов (выходной параметр, тип целый); |
NPCOL - | число столбцов в решетке процессов (выходной параметр, тип целый); |
Вызываемые подпрограммы: нет
Замечания по использованию
1. | Подпрограмма является последовательной фортранной программой и не использует распределенную память (требуется только один процессор) | |
1. | В случае самостоятельного выбора размера блока (NB), на которые разбивается матрица A при распределении ее частей по паралельным процессам, напоминаем, что в настоящей реализации подпрограммы PDGEEV1 нельзя задавать размер блока (NB), меньше 7. | |
2. | Используются подпрограммы ICEIL, NUMROC ( из библиотеки ScaLAPACK_TOOLS) |
Необходимо выбрать размер блока NB, число строк и столбцов решетки процессов
(NPROW,NPCOL) и вычислить размер локальной памяти, необходимой для
вычисления собственных значений матрицы общего вида
с помощью подпрограммы PDGEEV1.
Матрица - квадратная порядка 20.
Выделяемое число процессов NPROCS = 8. NB = 0.
Фрагмент фортранного текста вызывающей программы
(полный текст теста можно получить в
tpr_geev1.zip)
PROGRAM TPR_GEEV1 * INTEGER N, NPROCS, MMIN, NB, NPROW, NPCOL EXTERNAL PAR_GEEV1 * N = 20 NPROCS = 8 NB=0 * CALL PAR_GEEV1(N, NPROCS, MMIN, NB, NPROW, NPCOL) STOP END Результаты: NB = 8 NPROW = 2 NPCOL = 4 MMIN = 373