ЛИТЕРАТУРА

  1.  Антонов А.С. Параллельное программирование с использованием технологии MPI: Учебное пособие. -М.: Изд - во МГУ, 2004. - 71с.
  2.  Воеводин В.В. Математические модели и методы в параллельных процессах. - М.: Наука, 1986. - 296с.
  3.  Воеводин В.В. Математические основы параллельных вычислений. - М.: Изд - во МГУ, 1991. - 345с.
  4.  Воеводин В.В. Параллельные структуры алгоритмов и программ. - М.: ОВМ АН СССР, 1987. - 148с.
  5.  Воеводин В.В., Воеводин Вл.В. Параллельные вычисления. - С. - П. - "БХВ - Петербург", 2002. - 608с.
  6.  Дацюк В.Н., Букатов А.А., Жегуло А.И. Введение в организацию и методы программирования многопроцессорных вычислительных систем (методическое пособие, часть I) - Ростов - на - Дону : Изд - во РГУ, 2000. - 36с.
  7.  Дацюк В.Н., Букатов А.А., Жегуло А.И. Среда параллельного программирования MPI (методическое пособие, часть II) - Ростов - на - Дону : Изд - во РГУ, 2000. - 65с.
  8.  Немнюгин С.А., Стесик О.Л. "Параллельное программирование для многопроцессорных вычислительных систем", "БХВ - Петербург", 2002. - 400с.
  9.  Корнеев В.Д. "Параллельное программирование в MPI", Новосибирск : Изд - во СО РАН, 2000. - 213с.
  10.  Антонов А.С. Практический курс MPI.
MPI : A Message - Passing Interface Standard ( Version 1.1).
  11.  E. Anderson, Z. Bai, C. Bischof, J. Demmel, J. Dongarra, J. Du Croz, A. Greenbaum, S. Hammarling, A. Mckenney, S. Ostrouchov, and D. Sorensen, LAPACK Users' Guide, Society for Industrial and Applied Mathematics, Philadelphia, PA, second ed., 1995.
  12.  E. Anderson, Z. Bai, C. Bischof, J. Demmel, J. Dongarra, J. Du Croz, A. Greenbaum, S. Hammarling, A. Mckenney, and D. Sorensen, LAPACK: A portable linear algebra library for high - performance computers, Computer Science Dept. Technical Report CS - 90 - 105, University of Tennessee, Knoxville, TN, May 1990. (Also LAPACK Working Note #20).
  13.  M. Arioli, J.W. Demmel, and I.S. Duff, Solving sparse linear systems with sparse backward error, SIAM J. Matrix Anal. Appl., 10 (1989), pp. 165 - 190.
  14.  L. S. Blackford, J. Choi, A. Cleary, J. Demmej, I. Dhillon, J. J. Dongarra, S. Hammarling, G. Henry, A. Petitet, K. Stanley, D. W. Walker, and R. C. Whaley, ScaLAPACK: A portable linear algebra library for distributed memory computers - design issues and performance, in Proceedings of Supercomputing '96, Sponsored by ACM SIGARCH and IEEE Computer Society, 1996. (ACM Order Number: 415962, IEEE Computer Society Press Order Number: RS00126. http://www.supercomp.org/sc96/proceedings/).
  15.  height 2pt depth - 1.6pt width 23pt, ScaLAPACK: A portable linear algebra library for distributed memory computers - design issues and performance, Computer Science Dept. Technical Report CS - 95 - 283, University of Tennessee, Knoxville, TN, March 1995. (Also LAPACK Working Note #95).
  16.  J. Choi, J. Dongarra, and D. Walker, PB - BLAS: A Set of Parallel Block Basic Linear Algebra Subroutines, Concurrency: Practice and Experience, 8 (1996), pp. 517 - 535.
  17.  A. Chtchelkanova, J. Gunnels, G. Morrow, J. Overfelt, and R. van de Geun, Parallel Implementation of BLAS: General Techniques for Level 3 BLAS, Tech. Rep. TR95 - 49, Department of Computer Sciences, UT - Austin, 1995, Submitted to Concurrency: Practice and Experience.
  18.  A. Cleary and J. Dongarra, Implementation in scalapack of divide - and - conquer algorithms for banded and tridiagonal linear systems, Computer Science Dept. Technical Report CS - 97 - 358, University of Tennessee, Knoxville, TN, April 1997. (Also LAPACK Working Note #125).
  19.  J. Dongarra, G.Henry, and D. Watkins, A distributed memory implementation of the nonsymmetric QR algorithm, in Proceedings of the Eighth SIAM Conference on Parallel Processing for Scientific Computing, Philadelphia, PA, 1997, Society for Industrial and Applied Mathematics.
  20.  J. Dongarra and R. van de Geun, Two dimensional basic linear communication subprograms, Computer Science Dept. Technical Report CS - 91 - 138, University of Tennessee, Knoxville, TN, 1991. (Also LAPACK Working Note #37).
  21.  J. Dongarra, R. van de Geun, and R.C. Whaley, Two dimensional basic linear algebra communication subprograms, in Environments and Tools for Parallel Scientific Computing, Advances in Parallel Computing, J. Dongarra and B. Tourancheau, eds., vol. 6, Elsevier Science Publishers B.V., 1993, pp. 31 - 40.
  22.  J. Dongarra and R.C. Whaley, A user's guide to the BLACS v1.1, Computer Science Dept. Technical Report CS - 95 - 281, University of Tennessee, Knoxville, TN, 1995. (Also LAPACK Working Note #94).
  23.  G. Geist and C. Romine, LU factorization algorithms on distributed memory multiprocessor architectures, SIAM J. Sci. Stat Comput., 9 (1988), pp. 639 - 649.
  24.  G. Golub and C.F. Van Loan, Matrix Computations, Johns Hopkins University Press, Baltimore, MD, third ed., 1996.
  25.  W.W. Hager, Condition estimators, SIAM J. Sci. Stat. Comput., 5 (1984), pp. 311 - 316.
  26.  G. Henry, D. Watkins, and J. Dongarra, A parallel implementation of the nonsymmetric QR algorithm for distributed memory architectures, Computer Science Dept. Technical Report CS - 97 - 352, University of Tennessee, Knoxville, TN, March 1997. (Also LAPACK Working Note #121).
  27.  N.J. Higham, A survey of condition number estimation for triangular matrices, SIAM Review, 29 (1987), pp. 575 - 596.
  28.  height 2pt depth  - 1.6pt width 23pt, FORTRAN codes for estimating the one - norm of a real or complex matrix, with applications to condition estimation, ACM Trans. Math. Softw., 14 (1988), pp. 381 - 396.
  29.  height 2pt depth - 1.6pt width 23pt, Experience with a matrix norm estimator, SIAM J. Sci. Stat. Comput., 11 (1990), pp. 804 - 809.
  30.  C.L. Lawson, R.J. Hanson, D. Kincaid, and F.T. Krogh, Basic linear algebra subprograms for Fortran usage, ACM Trans. Math. Soft., 5 (1979), pp. 308 - 323.
  31.  W. Lichtenstein and S.L. Johnsson, Block - cyclic dense linear algebra, SIAM J. Sci. Stat. Comput. 14 (1993), pp. 1259 - 1288.
  32.  A. Petitet, Algorithmic Redistribution Methods for Block Cyclic Decompositions, PhD thesis, University of Tennessee, Knoxville, TN, 1996.
  33.  L. Prylli and B. Tourancheau, Efficient block cyclic data redistribution, in EUROPAR'96, vol.1 of Lecture Notes in Computer Science, Springer - Verlag, 1996, pp. 155 - 165.
  34.  R.C. Whaley, Basic linear algebra communication subprograms: Analysis and implementation across multiple parallel architectures, Computer Science Dept. Technical Report CS - 94 - 234, University of Tennessee, Knoxville, TN, May 1994. (Also LAPACK Working Note 73).
  35.  Форсайт Дж., Малькольм М., Моулер К. Машинные методы математических вычислений. М.: Изд-во МИР, 1980.
  36.  Fernando K.V. and Parlett B.N. Accurate singular values and differential qd algorithms// Numer.Math. 1994, Vol-67, No. 2, pp. 191-230.