Выбор пaраметров распараллеливания для целевых программ комплекса PARALG вычисления собственных значений эрмитовых матриц
Эта служебная подпрограмма выбирает и вычисляет за пользователя параметры распараллеливания, которые конкретизируют распределение вычислений между параллельными процессами и значения которых необходимо передавать целевым программам вычисления собственных значений эрмитовых матриц
Литература:
http://num_anal.srcc.msu.ru/par_prog/
http://software.intel.com/en-us/articles/intel-math-kernel-library-documentation/
http://www.netlib.org/scalapack/slug/index.html
CALL PAZ_HEEV1(NAME, N, NPROCS, MMIN, NB, NPROW, NPCOL)
Параметры
NAME - | имя целевой подпрограммы, с помощью которой пользователь собирается решать свою задачу (одно из PZHEEV1, PZHEEV3, PZHEEV5); (входной параметр, тип символьный); |
N - | порядок исходной матрицы (входной параметр, тип целый); |
NPROCS - | число процессов, которое может выделить пользователь для решения задачи (входной параметр, тип целый); |
MMIN - | минимальное количество локальной памяти, которое необходимо выделить на каждом из параллельных процессов для решения задачи (выходной параметр, тип целый); |
NB - | величина блока, на которые делится исходная матрица; NB полагается равным 0, если пользователь доверяет выбор его значения этой подпрограмме (входной и выходной параметр, тип целый); |
NPROW - | число строк в решетке процессов (выходной параметр, тип целый); |
NPCOL - | число столбцов в решетке процессов (выходной параметр, тип целый); |
Вызываемые подпрограммы: нет
Замечания по использованию
1. | Подпрограмма является последовательной фортранной программой и не использует распределенную память (требуется только один процессор) | |
2. | Используются подпрограммы ICEIL, NUMROC ( из библиотеки ScaLAPACK_TOOLS) |
Необходимо выбрать размер блока NB, число строк и столбцов решетки процессов
(NPROW,NPCOL) и вычислить размер локальной памяти, необходимой для
вычисления собственных значений эрмитовой матрицы с помощью подпрограммы PZHEEV1.
Матрица - квадратная эрмитова порядка 7.
Выделяемое число процессов NPROCS = 4. NB = 0.
Фрагмент фортранного текста вызывающей программы
(полный текст теста можно получить в
tpz_heev1.zip)
PROGRAM TPZ_HEEV1 * INTEGER N, NPROCS, MMIN, NB, NPROW, NPCOL CHARACTER*(*) NAME PARAMETER ( NAME = 'PZHEEV1') EXTERNAL PAZ_HEEV1 * N = 7 NPROCS = 4 NB=0 * CALL PAZ_HEEV1(NAME, N, NPROCS, MMIN, NB, NPROW, NPCOL) STOP END Результаты: NB = 4 NPROW = 2 NPCOL = 2 MMIN = 81