pclarzc_8f_source.html

      SUBROUTINE pclarzc( SIDE, M, N, L, V, IV, JV, DESCV, INCV, TAU, C,

     $                    IC, JC, DESCC, WORK )

*

*  -- ScaLAPACK auxiliary routine (version 1.7) --

*     University of Tennessee, Knoxville, Oak Ridge National Laboratory,

*     and University of California, Berkeley.

*     May 25, 2001

*

*     .. Scalar Arguments ..

      CHARACTER          SIDE

      INTEGER            IC, INCV, IV, JC, JV, L, M, N

*     ..

*     .. Array Arguments ..

      INTEGER            DESCC( * ), DESCV( * )

      COMPLEX            C( * ), TAU( * ), V( * ), WORK( * )

*     ..

*

*  Purpose

*  =======

*

*  PCLARZC applies a complex elementary reflector Q**H to a

*  complex M-by-N distributed matrix sub( C ) = C(IC:IC+M-1,JC:JC+N-1),

*  from either the left or the right. Q is represented in the form

*

*        Q = I - tau * v * v'

*

*  where tau is a complex scalar and v is a complex vector.

*

*  If tau = 0, then Q is taken to be the unit matrix.

*

*  Q is a product of k elementary reflectors as returned by PCTZRZF.

*

*  Notes

*  =====

*

*  Each global data object is described by an associated description

*  vector.  This vector stores the information required to establish

*  the mapping between an object element and its corresponding process

*  and memory location.

*

*  Let A be a generic term for any 2D block cyclicly distributed array.

*  Such a global array has an associated description vector DESCA.

*  In the following comments, the character _ should be read as

*  "of the global array".

*

*  NOTATION        STORED IN      EXPLANATION

*  --------------- -------------- --------------------------------------

*  DTYPE_A(global) DESCA( DTYPE_ )The descriptor type.  In this case,

*                                 DTYPE_A = 1.

*  CTXT_A (global) DESCA( CTXT_ ) The BLACS context handle, indicating

*                                 the BLACS process grid A is distribu-

*                                 ted over. The context itself is glo-

*                                 bal, but the handle (the integer

*                                 value) may vary.

*  M_A    (global) DESCA( M_ )    The number of rows in the global

*                                 array A.

*  N_A    (global) DESCA( N_ )    The number of columns in the global

*                                 array A.

*  MB_A   (global) DESCA( MB_ )   The blocking factor used to distribute

*                                 the rows of the array.

*  NB_A   (global) DESCA( NB_ )   The blocking factor used to distribute

*                                 the columns of the array.

*  RSRC_A (global) DESCA( RSRC_ ) The process row over which the first

*                                 row of the array A is distributed.

*  CSRC_A (global) DESCA( CSRC_ ) The process column over which the

*                                 first column of the array A is

*                                 distributed.

*  LLD_A  (local)  DESCA( LLD_ )  The leading dimension of the local

*                                 array.  LLD_A >= MAX(1,LOCr(M_A)).

*

*  Let K be the number of rows or columns of a distributed matrix,

*  and assume that its process grid has dimension p x q.

*  LOCr( K ) denotes the number of elements of K that a process

*  would receive if K were distributed over the p processes of its

*  process column.

*  Similarly, LOCc( K ) denotes the number of elements of K that a

*  process would receive if K were distributed over the q processes of

*  its process row.

*  The values of LOCr() and LOCc() may be determined via a call to the

*  ScaLAPACK tool function, NUMROC:

*          LOCr( M ) = NUMROC( M, MB_A, MYROW, RSRC_A, NPROW ),

*          LOCc( N ) = NUMROC( N, NB_A, MYCOL, CSRC_A, NPCOL ).

*  An upper bound for these quantities may be computed by:

*          LOCr( M ) <= ceil( ceil(M/MB_A)/NPROW )*MB_A

*          LOCc( N ) <= ceil( ceil(N/NB_A)/NPCOL )*NB_A

*

*  Because vectors may be viewed as a subclass of matrices, a

*  distributed vector is considered to be a distributed matrix.

*

*  Restrictions

*  ============

*

*  If SIDE = 'Left' and INCV = 1, then the row process having the first

*  entry V(IV,JV) must also own C(IC+M-L,JC:JC+N-1). Moreover,

*  MOD(IV-1,MB_V) must be equal to MOD(IC+N-L-1,MB_C), if INCV=M_V, only

*  the last equality must be satisfied.

*

*  If SIDE = 'Right' and INCV = M_V then the column process having the

*  first entry V(IV,JV) must also own C(IC:IC+M-1,JC+N-L) and

*  MOD(JV-1,NB_V) must be equal to MOD(JC+N-L-1,NB_C), if INCV = 1 only

*  the last equality must be satisfied.

*

*  Arguments

*  =========

*

*  SIDE    (global input) CHARACTER

*          = 'L': form  Q**H * sub( C ),

*          = 'R': form  sub( C ) * Q**H.

*

*  M       (global input) INTEGER

*          The number of rows to be operated on i.e the number of rows

*          of the distributed submatrix sub( C ). M >= 0.

*

*  N       (global input) INTEGER

*          The number of columns to be operated on i.e the number of

*          columns of the distributed submatrix sub( C ). N >= 0.

*

*  L       (global input) INTEGER

*          The columns of the distributed submatrix sub( A ) containing

*          the meaningful part of the Householder reflectors.

*          If SIDE = 'L', M >= L >= 0, if SIDE = 'R', N >= L >= 0.

*

*  V       (local input) COMPLEX pointer into the local memory

*          to an array of dimension (LLD_V,*) containing the local

*          pieces of the distributed vectors V representing the

*          Householder transformation Q,

*             V(IV:IV+L-1,JV) if SIDE = 'L' and INCV = 1,

*             V(IV,JV:JV+L-1) if SIDE = 'L' and INCV = M_V,

*             V(IV:IV+L-1,JV) if SIDE = 'R' and INCV = 1,

*             V(IV,JV:JV+L-1) if SIDE = 'R' and INCV = M_V,

*

*          The vector v in the representation of Q. V is not used if

*          TAU = 0.

*

*  IV      (global input) INTEGER

*          The row index in the global array V indicating the first

*          row of sub( V ).

*

*  JV      (global input) INTEGER

*          The column index in the global array V indicating the

*          first column of sub( V ).

*

*  DESCV   (global and local input) INTEGER array of dimension DLEN_.

*          The array descriptor for the distributed matrix V.

*

*  INCV    (global input) INTEGER

*          The global increment for the elements of V. Only two values

*          of INCV are supported in this version, namely 1 and M_V.

*          INCV must not be zero.

*

*  TAU     (local input) COMPLEX, array, dimension  LOCc(JV) if

*          INCV = 1, and LOCr(IV) otherwise. This array contains the

*          Householder scalars related to the Householder vectors.

*          TAU is tied to the distributed matrix V.

*

*  C       (local input/local output) COMPLEX pointer into the

*          local memory to an array of dimension (LLD_C, LOCc(JC+N-1) ),

*          containing the local pieces of sub( C ). On exit, sub( C )

*          is overwritten by the Q**H * sub( C ) if SIDE = 'L', or

*          sub( C ) * Q**H if SIDE = 'R'.

*

*  IC      (global input) INTEGER

*          The row index in the global array C indicating the first

*          row of sub( C ).

*

*  JC      (global input) INTEGER

*          The column index in the global array C indicating the

*          first column of sub( C ).

*

*  DESCC   (global and local input) INTEGER array of dimension DLEN_.

*          The array descriptor for the distributed matrix C.

*

*  WORK    (local workspace) COMPLEX array, dimension (LWORK)

*          If INCV = 1,

*            if SIDE = 'L',

*              if IVCOL = ICCOL,

*                LWORK >= NqC0

*              else

*                LWORK >= MpC0 + MAX( 1, NqC0 )

*              end if

*            else if SIDE = 'R',

*              LWORK >= NqC0 + MAX( MAX( 1, MpC0 ), NUMROC( NUMROC(

*                       N+ICOFFC,NB_V,0,0,NPCOL ),NB_V,0,0,LCMQ ) )

*            end if

*          else if INCV = M_V,

*            if SIDE = 'L',

*              LWORK >= MpC0 + MAX( MAX( 1, NqC0 ), NUMROC( NUMROC(

*                       M+IROFFC,MB_V,0,0,NPROW ),MB_V,0,0,LCMP ) )

*            else if SIDE = 'R',

*              if IVROW = ICROW,

*                LWORK >= MpC0

*              else

*                LWORK >= NqC0 + MAX( 1, MpC0 )

*              end if

*            end if

*          end if

*

*          where LCM is the least common multiple of NPROW and NPCOL and

*          LCM = ILCM( NPROW, NPCOL ), LCMP = LCM / NPROW,

*          LCMQ = LCM / NPCOL,

*

*          IROFFC = MOD( IC-1, MB_C ), ICOFFC = MOD( JC-1, NB_C ),

*          ICROW = INDXG2P( IC, MB_C, MYROW, RSRC_C, NPROW ),

*          ICCOL = INDXG2P( JC, NB_C, MYCOL, CSRC_C, NPCOL ),

*          MpC0 = NUMROC( M+IROFFC, MB_C, MYROW, ICROW, NPROW ),

*          NqC0 = NUMROC( N+ICOFFC, NB_C, MYCOL, ICCOL, NPCOL ),

*

*          ILCM, INDXG2P and NUMROC are ScaLAPACK tool functions;

*          MYROW, MYCOL, NPROW and NPCOL can be determined by calling

*          the subroutine BLACS_GRIDINFO.

*

*  Alignment requirements

*  ======================

*

*  The distributed submatrices V(IV:*, JV:*) and C(IC:IC+M-1,JC:JC+N-1)

*  must verify some alignment properties, namely the following

*  expressions should be true:

*

*  MB_V = NB_V,

*

*  If INCV = 1,

*    If SIDE = 'Left',

*      ( MB_V.EQ.MB_C .AND. IROFFV.EQ.IROFFC .AND. IVROW.EQ.ICROW )

*    If SIDE = 'Right',

*      ( MB_V.EQ.NB_A .AND. MB_V.EQ.NB_C .AND. IROFFV.EQ.ICOFFC )

*  else if INCV = M_V,

*    If SIDE = 'Left',

*      ( MB_V.EQ.NB_V .AND. MB_V.EQ.MB_C .AND. ICOFFV.EQ.IROFFC )

*    If SIDE = 'Right',

*      ( NB_V.EQ.NB_C .AND. ICOFFV.EQ.ICOFFC .AND. IVCOL.EQ.ICCOL )

*  end if

*

*  =====================================================================

*

*     .. Parameters ..

      INTEGER            BLOCK_CYCLIC_2D, CSRC_, CTXT_, DLEN_, DTYPE_,

     $                   lld_, mb_, m_, nb_, n_, rsrc_

      parameter( block_cyclic_2d = 1, dlen_ = 9, dtype_ = 1,

     $                     ctxt_ = 2, m_ = 3, n_ = 4, mb_ = 5, nb_ = 6,

     $                     rsrc_ = 7, csrc_ = 8, lld_ = 9 )

      COMPLEX            ONE, ZERO

      parameter( one  = ( 1.0e+0, 0.0e+0 ),

     $                     zero = ( 0.0e+0, 0.0e+0 ) )

*     ..

*     .. Local Scalars ..

      LOGICAL            CCBLCK, CRBLCK, LEFT

      CHARACTER          COLBTOP, ROWBTOP

      INTEGER            ICCOL1, ICCOL2, ICOFFC1, ICOFFC2, ICOFFV,

     $                   icrow1, icrow2, ictxt, iic1, iic2, iiv, ioffc1,

     $                   ioffc2, ioffv, ipw, iroffc1, iroffc2, iroffv,

     $                   ivcol, ivrow, jjc1, jjc2, jjv, ldc, ldv, mpc2,

     $                   mpv, mycol, myrow, ncc, ncv, npcol, nprow,

     $                   nqc2, nqv, rdest

      COMPLEX            TAULOC( 1 )

*     ..

*     .. External Subroutines ..

      EXTERNAL           blacs_gridinfo, caxpy, ccopy, cgebr2d,

     $                   cgebs2d, cgemv, cgerc, cgerv2d,

     $                   cgesd2d, cgsum2d, claset, infog2l,

     $                   pb_topget, pbctrnv

*     ..

*     .. External Functions ..

      LOGICAL            LSAME

      INTEGER            NUMROC

      EXTERNAL           lsame, numroc

*     ..

*     .. Intrinsic Functions ..

      INTRINSIC          min, mod

*     ..

*     .. Executable Statements ..

*

*     Quick return if possible

*

      IF( m.LE.0 .OR. n.LE.0 )

     $   RETURN

*

*     Get grid parameters.

*

      ictxt = descc( ctxt_ )

      CALL blacs_gridinfo( ictxt, nprow, npcol, myrow, mycol )

*

*     Figure local indexes

*

      left = lsame( side, 'L' )

      CALL infog2l( iv, jv, descv, nprow, npcol, myrow, mycol, iiv, jjv,

     $              ivrow, ivcol )

      iroffv = mod( iv-1, descv( nb_ ) )

      mpv = numroc( l+iroffv, descv( mb_ ), myrow, ivrow, nprow )

      IF( myrow.EQ.ivrow )

     $   mpv = mpv - iroffv

      icoffv = mod( jv-1, descv( nb_ ) )

      nqv = numroc( l+icoffv, descv( nb_ ), mycol, ivcol, npcol )

      IF( mycol.EQ.ivcol )

     $   nqv = nqv - icoffv

      ldv = descv( lld_ )

      ncv = numroc( descv( n_ ), descv( nb_ ), mycol, descv( csrc_ ),

     $              npcol )

      ldv = descv( lld_ )

      iiv = min( iiv, ldv )

      jjv = min( jjv, ncv )

      ioffv = iiv+(jjv-1)*ldv

      ncc = numroc( descc( n_ ), descc( nb_ ), mycol, descc( csrc_ ),

     $              npcol )

      CALL infog2l( ic, jc, descc, nprow, npcol, myrow, mycol,

     $              iic1, jjc1, icrow1, iccol1 )

      iroffc1 = mod( ic-1, descc( mb_ ) )

      icoffc1 = mod( jc-1, descc( nb_ ) )

      ldc = descc( lld_ )

      iic1 = min( iic1, ldc )

      jjc1 = min( jjc1, max( 1, ncc ) )

      ioffc1 = iic1 + ( jjc1-1 ) * ldc

*

      IF( left ) THEN

         CALL infog2l( ic+m-l, jc, descc, nprow, npcol, myrow, mycol,

     $                 iic2, jjc2, icrow2, iccol2 )

         iroffc2 = mod( ic+m-l-1, descc( mb_ ) )

         icoffc2 = mod( jc-1, descc( nb_ ) )

         nqc2 = numroc( n+icoffc2, descc( nb_ ), mycol, iccol2, npcol )

         IF( mycol.EQ.iccol2 )

     $      nqc2 = nqc2 - icoffc2

      ELSE

         CALL infog2l( ic, jc+n-l, descc, nprow, npcol, myrow, mycol,

     $                 iic2, jjc2, icrow2, iccol2 )

         iroffc2 = mod( ic-1, descc( mb_ ) )

         mpc2 = numroc( m+iroffc2, descc( mb_ ), myrow, icrow2, nprow )

         IF( myrow.EQ.icrow2 )

     $      mpc2 = mpc2 - iroffc2

         icoffc2 = mod( jc+n-l-1, descc( nb_ ) )

      END IF

      iic2 = min( iic2, ldc )

      jjc2 = min( jjc2, ncc )

      ioffc2 = iic2 + ( jjc2-1 ) * ldc

*

*     Is sub( C ) only distributed over a process row ?

*

      crblck = ( m.LE.(descc( mb_ )-iroffc1) )

*

*     Is sub( C ) only distributed over a process column ?

*

      ccblck = ( n.LE.(descc( nb_ )-icoffc1) )

*

      IF( left ) THEN

*

         IF( crblck ) THEN

            rdest = icrow2

         ELSE

            rdest = -1

         END IF

*

         IF( ccblck ) THEN

*

*           sub( C ) is distributed over a process column

*

            IF( descv( m_ ).EQ.incv ) THEN

*

*              Transpose row vector V (ICOFFV = IROFFC2)

*

               ipw = mpv+1

               CALL pbctrnv( ictxt, 'Rowwise', 'transpose', M,

     $                       DESCV( NB_ ), IROFFC2, V( IOFFV ), LDV,

     $                       ZERO,

     $                       WORK, 1, IVROW, IVCOL, ICROW2, ICCOL2,

     $                       WORK( IPW ) )

*

*              Perform the local computation within a process column

*

.EQ.               IF( MYCOLICCOL2 ) THEN

*

.EQ.                  IF( MYROWIVROW ) THEN

*

                     CALL CGEBS2D( ICTXT, 'columnwise', ' ', 1, 1,

     $                             TAU( IIV ), 1 )

                     TAULOC( 1 ) = CONJG( TAU( IIV ) )

*

                  ELSE

*

                     CALL CGEBR2D( ICTXT, 'columnwise', ' ', 1, 1,

     $                             TAULOC, 1, IVROW, MYCOL )

                     TAULOC( 1 ) = CONJG( TAULOC( 1 ) )

*

                  END IF

*

.NE.                  IF( TAULOC( 1 )ZERO ) THEN

*

*                    w := sub( C )' * v

*

.GT.                     IF( MPV0 ) THEN

                        CALL CGEMV( 'conjugate transpose', MPV, NQC2,

     $                              ONE, C( IOFFC2 ), LDC, WORK, 1,

     $                              ZERO, WORK( IPW ), 1 )

                     ELSE

                        CALL CLASET( 'all', NQC2, 1, ZERO, ZERO,

     $                               WORK( IPW ), MAX( 1, NQC2 ) )

                     END IF

.EQ.                     IF( MYROWICROW1 )

     $                  CALL CAXPY( NQC2, ONE, C( IOFFC1 ), LDC,

     $                              WORK( IPW ), MAX( 1, NQC2 ) )

*

                     CALL CGSUM2D( ICTXT, 'columnwise', ' ', NQC2, 1,

     $                             WORK( IPW ), MAX( 1, NQC2 ), RDEST,

     $                             MYCOL )

*

*                    sub( C ) := sub( C ) - v * w'

*

.EQ.                     IF( MYROWICROW1 )

     $                  CALL CAXPY( NQC2, -TAULOC( 1 ), WORK( IPW ),

     $                              MAX( 1, NQC2 ), C( IOFFC1 ), LDC )

                     CALL CGERC( MPV, NQC2, -TAULOC( 1 ), WORK, 1,

     $                           WORK( IPW ), 1, C( IOFFC2 ), LDC )

                  END IF

*

               END IF

*

            ELSE

*

*              V is a column vector

*

.EQ.               IF( IVCOLICCOL2 ) THEN

*

*                 Perform the local computation within a process column

*

.EQ.                  IF( MYCOLICCOL2 ) THEN

*

                     TAULOC( 1 ) = CONJG( TAU( JJV ) )

*

.NE.                     IF( TAULOC( 1 )ZERO ) THEN

*

*                       w := sub( C )' * v

*

.GT.                        IF( MPV0 ) THEN

                           CALL CGEMV( 'conjugate transpose', MPV, NQC2,

     $                              ONE, C( IOFFC2 ), LDC, V( IOFFV ),

     $                              1, ZERO, WORK, 1 )

                        ELSE

                           CALL CLASET( 'all', NQC2, 1, ZERO, ZERO,

     $                                  WORK, MAX( 1, NQC2 ) )

                        END IF

.EQ.                        IF( MYROWICROW1 )

     $                     CALL CAXPY( NQC2, ONE, C( IOFFC1 ), LDC,

     $                                 WORK, MAX( 1, NQC2 ) )

*

                        CALL CGSUM2D( ICTXT, 'columnwise', ' ', NQC2, 1,

     $                                WORK, MAX( 1, NQC2 ), RDEST,

     $                                MYCOL )

*

*                       sub( C ) := sub( C ) - v * w'

*

.EQ.                        IF( MYROWICROW1 )

     $                     CALL CAXPY( NQC2, -TAULOC( 1 ), WORK,

     $                                 MAX( 1, NQC2 ), C( IOFFC1 ),

     $                                 LDC )

                        CALL CGERC( MPV, NQC2, -TAULOC( 1 ), V( IOFFV ),

     $                              1, WORK, 1, C( IOFFC2 ), LDC )

                     END IF

*

                  END IF

*

               ELSE

*

*                 Send V and TAU to the process column ICCOL2

*

.EQ.                  IF( MYCOLIVCOL ) THEN

*

                     IPW = MPV+1

                     CALL CCOPY( MPV, V( IOFFV ), 1, WORK, 1 )

                     WORK( IPW ) = TAU( JJV )

                     CALL CGESD2D( ICTXT, IPW, 1, WORK, IPW, MYROW,

     $                             ICCOL2 )

*

.EQ.                  ELSE IF( MYCOLICCOL2 ) THEN

*

                     IPW = MPV+1

                     CALL CGERV2D( ICTXT, IPW, 1, WORK, IPW, MYROW,

     $                             IVCOL )

                     TAULOC( 1 ) = CONJG( WORK( IPW ) )

*

.NE.                     IF( TAULOC( 1 )ZERO ) THEN

*

*                       w := sub( C )' * v

*

.GT.                        IF( MPV0 ) THEN

                           CALL CGEMV( 'conjugate transpose', MPV, NQC2,

     $                                 ONE, C( IOFFC2 ), LDC, WORK, 1,

     $                                 ZERO, WORK( IPW ), 1 )

                        ELSE

                           CALL CLASET( 'all', NQC2, 1, ZERO, ZERO,

     $                                  WORK( IPW ), MAX( 1, NQC2 ) )

                        END IF

.EQ.                        IF( MYROWICROW1 )

     $                     CALL CAXPY( NQC2, ONE, C( IOFFC1 ), LDC,

     $                                 WORK( IPW ), MAX( 1, NQC2 ) )

*

                        CALL CGSUM2D( ICTXT, 'columnwise', ' ', NQC2, 1,

     $                                WORK( IPW ), MAX( 1, NQC2 ),

     $                                RDEST, MYCOL )

*

*                       sub( C ) := sub( C ) - v * w'

*

.EQ.                        IF( MYROWICROW1 )

     $                     CALL CAXPY( NQC2, -TAULOC( 1 ), WORK( IPW ),

     $                                 MAX( 1, NQC2 ), C( IOFFC1 ),

     $                                 LDC )

                        CALL CGERC( MPV, NQC2, -TAULOC( 1 ), WORK, 1,

     $                              WORK( IPW ), 1, C( IOFFC2 ), LDC )

                     END IF

*

                  END IF

*

               END IF

*

            END IF

*

         ELSE

*

*           sub( C ) is a proper distributed matrix

*

.EQ.            IF( DESCV( M_ )INCV ) THEN

*

*              Transpose and broadcast row vector V (ICOFFV=IROFFC2)

*

               IPW = MPV+1

               CALL PBCTRNV( ICTXT, 'rowwise', 'transpose', M,

     $                       DESCV( NB_ ), IROFFC2, V( IOFFV ), LDV,

     $                       ZERO,

     $                       WORK, 1, IVROW, IVCOL, ICROW2, -1,

     $                       WORK( IPW ) )

*

*              Perform the local computation within a process column

*

.EQ.               IF( MYROWIVROW ) THEN

*

                  CALL CGEBS2D( ICTXT, 'columnwise', ' ', 1, 1,

     $                          TAU( IIV ), 1 )

                  TAULOC( 1 ) = CONJG( TAU( IIV ) )

*

               ELSE

*

                  CALL CGEBR2D( ICTXT, 'columnwise', ' ', 1, 1, TAULOC,

     $                          1, IVROW, MYCOL )

                  TAULOC( 1 ) = CONJG( TAULOC( 1 ) )

*

               END IF

*

.NE.               IF( TAULOC( 1 )ZERO ) THEN

*

*                 w := sub( C )' * v

*

.GT.                  IF( MPV0 ) THEN

                     CALL CGEMV( 'conjugate transpose', MPV, NQC2, ONE,

     $                           C( IOFFC2 ), LDC, WORK, 1, ZERO,

     $                           WORK( IPW ), 1 )

                  ELSE

                     CALL CLASET( 'all', NQC2, 1, ZERO, ZERO,

     $                            WORK( IPW ), MAX( 1, NQC2 ) )

                  END IF

.EQ.                  IF( MYROWICROW1 )

     $               CALL CAXPY( NQC2, ONE, C( IOFFC1 ), LDC,

     $                           WORK( IPW ), MAX( 1, NQC2 ) )

*

                  CALL CGSUM2D( ICTXT, 'columnwise', ' ', NQC2, 1,

     $                          WORK( IPW ), MAX( 1, NQC2 ), RDEST,

     $                          MYCOL )

*

*                 sub( C ) := sub( C ) - v * w'

*

.EQ.                  IF( MYROWICROW1 )

     $               CALL CAXPY( NQC2, -TAULOC( 1 ), WORK( IPW ),

     $                           MAX( 1, NQC2 ), C( IOFFC1 ), LDC )

                  CALL CGERC( MPV, NQC2, -TAULOC( 1 ), WORK, 1,

     $                        WORK( IPW ), 1, C( IOFFC2 ), LDC )

               END IF

*

            ELSE

*

*              Broadcast column vector V

*

               CALL PB_TOPGET( ICTXT, 'broadcast', 'rowwise', ROWBTOP )

.EQ.               IF( MYCOLIVCOL ) THEN

*

                  IPW = MPV+1

                  CALL CCOPY( MPV, V( IOFFV ), 1, WORK, 1 )

                  WORK( IPW ) = TAU( JJV )

                  CALL CGEBS2D( ICTXT, 'rowwise', ROWBTOP, IPW, 1,

     $                          WORK, IPW )

                  TAULOC( 1 ) = CONJG( TAU( JJV ) )

*

               ELSE

*

                  IPW = MPV+1

                  CALL CGEBR2D( ICTXT, 'rowwise', ROWBTOP, IPW, 1, WORK,

     $                          IPW, MYROW, IVCOL )

                  TAULOC( 1 ) = CONJG( WORK( IPW ) )

*

               END IF

*

.NE.               IF( TAULOC( 1 )ZERO ) THEN

*

*                 w := sub( C )' * v

*

.GT.                  IF( MPV0 ) THEN

                     CALL CGEMV( 'conjugate transpose', MPV, NQC2, ONE,

     $                           C( IOFFC2 ), LDC, WORK, 1, ZERO,

     $                           WORK( IPW ), 1 )

                  ELSE

                     CALL CLASET( 'all', NQC2, 1, ZERO, ZERO,

     $                            WORK( IPW ), MAX( 1, NQC2 ) )

                  END IF

.EQ.                  IF( MYROWICROW1 )

     $               CALL CAXPY( NQC2, ONE, C( IOFFC1 ), LDC,

     $                           WORK( IPW ), MAX( 1, NQC2 ) )

*

                  CALL CGSUM2D( ICTXT, 'columnwise', ' ', NQC2, 1,

     $                          WORK( IPW ), MAX( 1, NQC2 ), RDEST,

     $                          MYCOL )

*

*                 sub( C ) := sub( C ) - v * w'

*

.EQ.                  IF( MYROWICROW1 )

     $               CALL CAXPY( NQC2, -TAULOC( 1 ), WORK( IPW ),

     $                           MAX( 1, NQC2 ), C( IOFFC1 ), LDC )

                  CALL CGERC( MPV, NQC2, -TAULOC( 1 ), WORK, 1,

     $                        WORK( IPW ), 1, C( IOFFC2 ), LDC )

               END IF

*

            END IF

*

         END IF

*

      ELSE

*

         IF( CCBLCK ) THEN

            RDEST = MYROW

         ELSE

            RDEST = -1

         END IF

*

         IF( CRBLCK ) THEN

*

*           sub( C ) is distributed over a process row

*

.EQ.            IF( DESCV( M_ )INCV ) THEN

*

*              V is a row vector

*

.EQ.               IF( IVROWICROW2 ) THEN

*

*                 Perform the local computation within a process row

*

.EQ.                  IF( MYROWICROW2 ) THEN

*

                     TAULOC( 1 ) = CONJG( TAU( IIV ) )

*

.NE.                     IF( TAULOC( 1 )ZERO ) THEN

*

*                       w := sub( C ) * v

*

.GT.                        IF( NQV0 ) THEN

                           CALL CGEMV( 'no transpose', MPC2, NQV, ONE,

     $                                 C( IOFFC2 ), LDC, V( IOFFV ),

     $                                 LDV, ZERO, WORK, 1 )

                        ELSE

                           CALL CLASET( 'all', MPC2, 1, ZERO, ZERO,

     $                                  WORK, MAX( 1, MPC2 ) )

                        END IF

.EQ.                        IF( MYCOLICCOL1 )

     $                     CALL CAXPY( MPC2, ONE, C( IOFFC1 ), 1,

     $                                   WORK, 1 )

*

                        CALL CGSUM2D( ICTXT, 'rowwise', ' ', MPC2, 1,

     $                                WORK, MAX( 1, MPC2 ), RDEST,

     $                               ICCOL2 )

*

.EQ.                        IF( MYCOLICCOL1 )

     $                     CALL CAXPY( MPC2, -TAULOC( 1 ), WORK, 1,

     $                                 C( IOFFC1 ), 1 )

*

*                       sub( C ) := sub( C ) - w * v'

*

                        CALL CGERC( MPC2, NQV, -TAULOC( 1 ), WORK, 1,

     $                              V( IOFFV ), LDV, C( IOFFC2 ), LDC )

                     END IF

*

                  END IF

*

               ELSE

*

*                 Send V and TAU to the process row ICROW2

*

.EQ.                  IF( MYROWIVROW ) THEN

*

                     IPW = NQV+1

                     CALL CCOPY( NQV, V( IOFFV ), LDV, WORK, 1 )

                     WORK( IPW ) = TAU( IIV )

                     CALL CGESD2D( ICTXT, IPW, 1, WORK, IPW, ICROW2,

     $                             MYCOL )

*

.EQ.                  ELSE IF( MYROWICROW2 ) THEN

*

                     IPW = NQV+1

                     CALL CGERV2D( ICTXT, IPW, 1, WORK, IPW, IVROW,

     $                             MYCOL )

                     TAULOC( 1 ) = CONJG( WORK( IPW ) )

*

.NE.                     IF( TAULOC( 1 )ZERO ) THEN

*

*                       w := sub( C ) * v

*

.GT.                        IF( NQV0 ) THEN

                           CALL CGEMV( 'no transpose', MPC2, NQV, ONE,

     $                                 C( IOFFC2 ), LDC, WORK, 1, ZERO,

     $                                 WORK( IPW ), 1 )

                        ELSE

                           CALL CLASET( 'all', MPC2, 1, ZERO, ZERO,

     $                                  WORK( IPW ), MAX( 1, MPC2 ) )

                        END IF

.EQ.                        IF( MYCOLICCOL1 )

     $                     CALL CAXPY( MPC2, ONE, C( IOFFC1 ), 1,

     $                                   WORK( IPW ), 1 )

                        CALL CGSUM2D( ICTXT, 'rowwise', ' ', MPC2, 1,

     $                                WORK( IPW ), MAX( 1, MPC2 ),

     $                                RDEST, ICCOL2 )

.EQ.                        IF( MYCOLICCOL1 )

     $                     CALL CAXPY( MPC2, -TAULOC( 1 ), WORK( IPW ),

     $                                 1, C( IOFFC1 ), 1 )

*

*                       sub( C ) := sub( C ) - w * v'

*

                        CALL CGERC( MPC2, NQV, -TAULOC( 1 ),

     $                              WORK( IPW ), 1, WORK, 1,

     $                              C( IOFFC2 ), LDC )

                     END IF

*

                  END IF

*

               END IF

*

            ELSE

*

*              Transpose column vector V (IROFFV = ICOFFC2)

*

               IPW = NQV+1

               CALL PBCTRNV( ICTXT, 'columnwise', 'transpose', N,

     $                       DESCV( MB_ ), ICOFFC2, V( IOFFV ), 1, ZERO,

     $                       WORK, 1, IVROW, IVCOL, ICROW2, ICCOL2,

     $                       WORK( IPW ) )

*

*              Perform the local computation within a process column

*

.EQ.               IF( MYROWICROW2 ) THEN

*

.EQ.                  IF( MYCOLIVCOL ) THEN

*

                     CALL CGEBS2D( ICTXT, 'rowwise', ' ', 1, 1,

     $                             TAU( JJV ), 1 )

                     TAULOC( 1 ) = CONJG( TAU( JJV ) )

*

                  ELSE

*

                     CALL CGEBR2D( ICTXT, 'rowwise', ' ', 1, 1, TAULOC,

     $                             1, MYROW, IVCOL )

                     TAULOC( 1 ) = CONJG( TAULOC( 1 ) )

*

                  END IF

*

.NE.                  IF( TAULOC( 1 )ZERO ) THEN

*

*                    w := sub( C ) * v

*

.GT.                     IF( NQV0 ) THEN

                        CALL CGEMV( 'no transpose', MPC2, NQV, ONE,

     $                              C( IOFFC2 ), LDC, WORK, 1, ZERO,

     $                              WORK( IPW ), 1 )

                     ELSE

                        CALL CLASET( 'all', MPC2, 1, ZERO, ZERO,

     $                               WORK( IPW ), MAX( 1, MPC2 ) )

                     END IF

.EQ.                     IF( MYCOLICCOL1 )

     $                  CALL CAXPY( MPC2, ONE, C( IOFFC1 ), 1,

     $                              WORK( IPW ), 1 )

                     CALL CGSUM2D( ICTXT, 'rowwise', ' ', MPC2, 1,

     $                             WORK( IPW ), MAX( 1, MPC2 ), RDEST,

     $                             ICCOL2 )

.EQ.                     IF( MYCOLICCOL1 )

     $                  CALL CAXPY( MPC2, -TAULOC( 1 ), WORK( IPW ), 1,

     $                              C( IOFFC1 ), 1 )

*

*                    sub( C ) := sub( C ) - w * v'

*

                     CALL CGERC( MPC2, NQV, -TAULOC( 1 ), WORK( IPW ),

     $                           1, WORK, 1, C( IOFFC2 ), LDC )

                  END IF

*

               END IF

*

            END IF

*

         ELSE

*

*           sub( C ) is a proper distributed matrix

*

.EQ.            IF( DESCV( M_ )INCV ) THEN

*

*              Broadcast row vector V

*

               CALL PB_TOPGET( ICTXT, 'broadcast', 'columnwise',

     $                         COLBTOP )

.EQ.               IF( MYROWIVROW ) THEN

*

                  IPW = NQV+1

                  CALL CCOPY( NQV, V( IOFFV ), LDV, WORK, 1 )

                  WORK( IPW ) = TAU( IIV )

                  CALL CGEBS2D( ICTXT, 'columnwise', COLBTOP, IPW, 1,

     $                          WORK, IPW )

                  TAULOC( 1 ) = CONJG( TAU( IIV ) )

*

               ELSE

*

                  IPW = NQV+1

                  CALL CGEBR2D( ICTXT, 'columnwise', COLBTOP, IPW, 1,

     $                          WORK, IPW, IVROW, MYCOL )

                  TAULOC( 1 ) = CONJG( WORK( IPW ) )

*

               END IF

*

.NE.               IF( TAULOC( 1 )ZERO ) THEN

*

*                 w := sub( C ) * v

*

.GT.                  IF( NQV0 ) THEN

                     CALL CGEMV( 'no transpose', MPC2, NQV, ONE,

     $                           C( IOFFC2 ), LDC, WORK, 1, ZERO,

     $                           WORK( IPW ), 1 )

                  ELSE

                     CALL CLASET( 'all', MPC2, 1, ZERO, ZERO,

     $                            WORK( IPW ), MAX( 1, MPC2 ) )

                  END IF

.EQ.                  IF( MYCOLICCOL1 )

     $               CALL CAXPY( MPC2, ONE, C( IOFFC1 ), 1,

     $                           WORK( IPW ), 1 )

*

                  CALL CGSUM2D( ICTXT, 'rowwise', ' ', MPC2, 1,

     $                          WORK( IPW ), MAX( 1, MPC2 ), RDEST,

     $                          ICCOL2 )

.EQ.                  IF( MYCOLICCOL1 )

     $               CALL CAXPY( MPC2, -TAULOC( 1 ), WORK( IPW ), 1,

     $                           C( IOFFC1 ), 1 )

*

*                 sub( C ) := sub( C ) - w * v'

*

                  CALL CGERC( MPC2, NQV, -TAULOC( 1 ), WORK( IPW ), 1,

     $                        WORK, 1, C( IOFFC2 ), LDC )

               END IF

*

            ELSE

*

*              Transpose and broadcast column vector V (ICOFFC2=IROFFV)

*

               IPW = NQV+1

               CALL PBCTRNV( ICTXT, 'columnwise', 'transpose', N,

     $                       DESCV( MB_ ), ICOFFC2, V( IOFFV ), 1, ZERO,

     $                       WORK, 1, IVROW, IVCOL, -1, ICCOL2,

     $                       WORK( IPW ) )

*

*              Perform the local computation within a process column

*

.EQ.               IF( MYCOLIVCOL ) THEN

*

                  CALL CGEBS2D( ICTXT, 'rowwise', ' ', 1, 1, TAU( JJV ),

     $                          1 )

                  TAULOC( 1 ) = CONJG( TAU( JJV ) )

*

               ELSE

*

                  CALL CGEBR2D( ICTXT, 'rowwise', ' ', 1, 1,

     $                          TAULOC( 1 ), 1, MYROW, IVCOL )

                  TAULOC( 1 ) = CONJG( TAULOC( 1 ) )

*

               END IF

*

.NE.               IF( TAULOC( 1 )ZERO ) THEN

*

*                 w := sub( C ) * v

*

.GT.                  IF( NQV0 ) THEN

                     CALL CGEMV( 'no transpose', MPC2, NQV, ONE,

     $                           C( IOFFC2 ), LDC, WORK, 1, ZERO,

     $                           WORK( IPW ), 1 )

                  ELSE

                     CALL CLASET( 'all', MPC2, 1, ZERO, ZERO,

     $                            WORK( IPW ), MAX( 1, MPC2 ) )

                  END IF

.EQ.                  IF( MYCOLICCOL1 )

     $               CALL CAXPY( MPC2, ONE, C( IOFFC1 ), 1,

     $                           WORK( IPW ), 1 )

                  CALL CGSUM2D( ICTXT, 'rowwise', ' ', MPC2, 1,

     $                          WORK( IPW ), MAX( 1, MPC2 ), RDEST,

     $                          ICCOL2 )

.EQ.                  IF( MYCOLICCOL1 )

     $               CALL CAXPY( MPC2, -TAULOC( 1 ), WORK( IPW ), 1,

     $                           C( IOFFC1 ), 1 )

*

*                 sub( C ) := sub( C ) - w * v'

*

                  CALL CGERC( MPC2, NQV, -TAULOC( 1 ), WORK( IPW ), 1,

     $                        WORK, 1, C( IOFFC2 ), LDC )

               END IF

*

            END IF

*

         END IF

*

      END IF

*

      RETURN

*

*     End of PCLARZC

*


      END

claset
subroutine claset(uplo, m, n, alpha, beta, a, lda)
CLASET initializes the off-diagonal elements and the diagonal elements of a matrix to given values.
Definition claset.f:106

caxpy
subroutine caxpy(n, ca, cx, incx, cy, incy)
CAXPY
Definition caxpy.f:88

ccopy
subroutine ccopy(n, cx, incx, cy, incy)
CCOPY
Definition ccopy.f:81

cgemv
subroutine cgemv(trans, m, n, alpha, a, lda, x, incx, beta, y, incy)
CGEMV
Definition cgemv.f:158

cgerc
subroutine cgerc(m, n, alpha, x, incx, y, incy, a, lda)
CGERC
Definition cgerc.f:130

min
#define min(a, b)
Definition macros.h:20

max
#define max(a, b)
Definition macros.h:21

cgebs2d
subroutine cgebs2d(contxt, scope, top, m, n, a, lda)
Definition mpi.f:1062

cgebr2d
subroutine cgebr2d(contxt, scope, top, m, n, a, lda)
Definition mpi.f:1103

infog2l
subroutine infog2l(grindx, gcindx, desc, nprow, npcol, myrow, mycol, lrindx, lcindx, rsrc, csrc)
Definition mpi.f:937

blacs_gridinfo
subroutine blacs_gridinfo(cntxt, nprow, npcol, myrow, mycol)
Definition mpi.f:754

numroc
integer function numroc(n, nb, iproc, isrcproc, nprocs)
Definition mpi.f:786

pbctrnv
subroutine pbctrnv(icontxt, xdist, trans, n, nb, nz, x, incx, beta, y, incy, ixrow, ixcol, iyrow, iycol, work)
Definition pbctrnv.f:4

pclarzc
subroutine pclarzc(side, m, n, l, v, iv, jv, descv, incv, tau, c, ic, jc, descc, work)
Definition pclarzc.f:3