Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
Qüest .. ió Quaderns d'Estadística i Investigació Operativa
Any 1993, volum 17, núm. 2 Segona època
Entitats patrocinadores:
Universitat de Barcelona Universitat Politècnica de Catalunya Institut d'Estadística de Catalunya
mJ1 Generalitat de Catalunya U1M Institut d'Estadística
de Catalunya
Sumari
Articles originals
Minque of variance components in replicated and multivariate linear model with linear restrictions......................................... 183 Júlia Volaufova
Nuevos estimadores de la varianza en poblaciones fini tas. . . . . . . . . . . . 203 M. Ruiz Espejo
Un contraste de normalidad basado en la energía informacional. . . . . . 221 M!!. del Carmen Pardo
An approximation of the K-function for the study of binary images.. 235 Guillermo Ayala Gallego and Amelia Simó Vidal
Estrategias óptimas de un juego bipersonal de suma cero y puntes de ensilladura del campo escalar asociado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 J. Freixas
Secció docent i problemes
Les correccions de continuïtat en distribucions binomial i Poisson, i la correcció de Yates en el test khi-quadrat en taules de contingència 2x2.................................................................. 269 M.S. Nikulin i C.1\1. Cuadras
Comentari de Llibres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
Novetats de software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
Resums en anglès.................................................... 293
QÜESTIIÓ, Vol 17, 2 pp. 183-201, 1993
MINQUE OF VARIANCE COMPONENTS IN REPLICATED AND MULTIVARIATE
LINEAR MODEL WITH LINEAR RESTRICTIONS
JÚLIA VOLAUFOV A* Institute of Measurement Science
Slovakia
The Minimum Nann Quadratic Unbiased Invariant Estimator of the estimable linear function of the unknown variance-covariance component parameter 1J in the linear model with given linear restrictions of the type R1J = e is derived in two special structures: replicated and growth-curve model.
Key words: MINQUE, linear model with restrictions, replicated model, growth-curve model.
l. INTRODUCTION
A general linear model with variance-covariance components is often considered in the form (see e.g.Rao-Kleffe [2])
p
(l) y=X/3+t:, E(t:)=O, E(t:t:1)=V(1J)=L1JiV; i=l
* Júlia Volaufova. Institute of Mcasurement Science. Slovak Academy of Scienccs. Dúbravska 9, 84219 Bratislava. The rcsearch was supportcd by a grant from the Slovak Academy of Sciences: nº 999366.
-Article rebut el desembre de 1991. -Acceptat el setembre de 1993.
183
where X, V; are given matrices, V; are symmetric for all i = l, ... , n, and ¡'} = (i'J1, ... , i'Jp)' E G C ffi.P is such that V = {V(i'J) : ¡'} E 8} constitutes a closed convex cone. The vector parameter /3 is an unlmown vector of fixed effects. The existence of the 3rd and the 4th moments of the vector f is assumed.
The aim is to fincl an estimator of a given linear function f'i'J as a function of the vector of observations y.
There are many authors investigating the problem (see e.g. [l]) considering a quadratic approach. The basic idea of this approach is to construct a quadratic form, say y' Ay, with a symmetric matrix A such that the statistic y1 Ay meets additional requirements as e. g. unbiasedness and invariance. If the distribution of the vector f is given, it is known how to find a statistic which minimizes the variance in the class of quadratic unbiased estimators.
In the early seventies C. R. Rao introduced a MINQUE principle which is based on the idea to find a quadratic form y' A 0 y which is an unbiasecl and invariant estimator ancl the matrix A 0 minimizes the Eucliclean norm tr AGAG for a suitable choice of the matrix G.
Let i'Jo be a preassigned vector from the parametric space such that V( i'J0) is a nonnegative definite matrix. In case that the vector y is normally clistributed, to minimize the variance of the unbiased and invariant statistic y' Ay at the paint i'Jo means to minimize the norm tr AV( i'J0 )A V( i'J 0). One reasonable suggestion is to substitute the matrix V(i'Jo) for the matrix G in the expression which should be minimized for getting the MINQUE.
To recall the known facts we give the following considerations which lead to the explicit form of the MIN QUE under the model (l) for a nonnegative definite matrix V(i'J 0 ). For simplicity we shall use the notation V(i'Jo) = V0 .
It is useful to analyze first the invariance principie. We can refer to e.g. Seely in [3] or, Rao and Kleffe in [2].
If the expectation of the vector y is an unknown vector X f3 we can investiga te a vector of observations in the form
Y• = X/3. +e,
where Y• = y - X /30 for a fixed vector /Jo E IR.k and /3. = /3 - /30. The covariance matrix V( i'J) of the vector y. is the same as the one of the vector y. It is natural to require that the estimator of the function f'i'J based on the vector y is the same as the estimator based on the vector y •. That should be valid for all vectors /3 E IR.k what implies the next definition.
184
Definition l
The statistic T(y) is said to be invariant under the group of transformations y 1-+ y - X/3 in model (l) if T(y) = T(y - X/3), for all j3 E m;k.
It is easy to see that the quadratic form y' Ay, A = A' is an invariant statistic in the model (1) if and.Dnly if AX =.O. Referring to Rao and.Kleffe in [2] p.78 we give the definition of a maximal invariant.
Definition 2
The statistic T(y) is said to be maximal invariant with respect to the group oftranslations ifT(y1) # T(y2 ) whenever y1 and Y2 are such that no translation maps Y1 in to Y2.
The condition for the quadratic form to be an unbiased and invariant estimator for the function J' 1J yields the necessary and sufficient con di t i on for the matrix A of the form:
(2) AX=O, trAVi=f;, i=l, ... ,p.
Denote To V0 + X X'. The matrix A satisfying the conclition (2) meets the equality tr A VoAVo = tr AToATo. The inclusion R(X) Ç R(To) and the property
imply the equalities
where "+" can be replaced by "-" in the first part of the equation. Here M= I - xx+, and the superscript "-" denotes the g-inverse of a matrix and "+" denotes the Moore - Penrose inverse of a matrix.
The following result can be found in [2] page 94.
Proposition l
(a) The MINQUE of the estimable function f'1J in the model (1) is given by
p
f'1J = ¿ À;q;,
i=l
185
(4)
where
q¡= y'(MVoM)+V;(MVoM)+y, i= l, ... ,p.
The vector >. is any solution of the system J(>. = f, where the matrix J(
is given by the entries
and represents the criterion matrix for the estimability of the function f' {).
(b) The variance of N at {) 0 under the normality assumption is given by
var1J 0 1'J = 2>.' J().= 2f' J(- f.
Remark l
Alternatively, the entries q¡ defined by (4) are given as:
q¡= y' RTo V;I?Jroy, RTo =To- MTo' MTo =I - X(X'To- x)- X'To-'
T he choice T0+ for T0- l e ads to ( 4). (See also [2].)
The estimation off'{) can be investigated also as a special linear problem, as considered by e.g. Verdooren in [4]. The estimator l'(y 0 y) is a linear function of the vector y 0 y, where l is an n 2 dimensional vector and '0' stands for the Kronecker product. This approach enables to apply linear methods to the problem of quadratic estimation.
Now let us introduce a class of estimators which is wider than the class of quadratic forms in y. The class of quadratic functions including the linear term and a scalar term
is investigated. A characterization of unbiasedness ancl invariance is given in the next theorem.
Theorem l
Let R(V(fJ)) = R(Vi: ... : V¡,), for all{) E 8. The class of unbiased estimators for the function f' {) and invariant with respect to the group of translations y 1-+ y - Xf3 in the model (1) is given by
(5) E:u,r = {y'Ay+b'y: A= A', b E ker X', AX =O, tr AV;= f;, i= l, ... ,p}
186
Proof
A condition for the unbiasedness of the estima tor y' Ay + b' y + d E E is expressed as
(6) E(y' Ay + b'y + d) = f'i'J for all /3 E ID?.k and i'J E 8.
The left hand side of the relation (6) is
p
/3'X' AX/3 +L i'J¡tr AVi + b'X/3 + d = f'i'J i=l
for all /3 E ID?.k and i'J E 8, which implies
p
(7) L i'J;tr AVi + d = f'i'J, and /3' X' AX/3 + b'X/3 =O, i=l
for all /3 E ID?.k and i'J E 8.
A necessary and sufficient condition for invariance is
(8) (y + X/3)' A(y + X/3) + b'(y + X/3) + d = y' Ay + b'y + d
for all /3 E ID?.k , which implies
(9) /3' X' AX/3 + b' X/3 + 2(3' X' Ay =O for all /3 E ID?.k.
The relations (7) and (9) imply the necessary and sufficient condition of the form
p
(10) Li'J¡trAVi + d i=l
/3' X' AX/3 + b' X/3 O
/3'X'Ay O
for all /3 E ID?.k and i'J E 8.
Let T be an arbitrary matrix which fulfils the condition R(T) = R(X: Vi : ... : V¡,). Then (10) is equivalent with
p
(11) Li'J¡trAVi + d f'i'J i=l
/3' X' AX/3 + b' X/3 o /3'X'ATz o
187
for all iJ E 8, fJ E m;k, and z E m;n. The system of equations (11) leads to
(12) d =O, tr AVi = f; i= l, ... , p
X'AT =O, b E kerX'
It is clear that each estimator from the class E meets the condition (12).
Let y' Ay+b'y be such that the matrix A and the vector b satisfy (12). Denote A. = r-'r' ATT-. We have to prove that A.X = O. Since y E R(T) almost everywhere, the equality
y' A. y + b' y = y' Ay + b' y
holds.
Further, trA.Vi = trT-'T'ATT-v;: = trAVi = f; for all i= l, ... ,p, and A.X = r-'T' ATT- X = r-'r' AX =O, hence the estimator y' A.y+b'y belongs to the class E.
•
Remark 2
The following definition will prove to be very useful in more complicated situations when the parameters of the model do not belong to an open set, e. g. if linear restrictions on the parameters are present.
Definition 3
The linear-quadra tic statistic T(y) of the form T(y) = y1 Ay + b' y + d = l' (y 0 y) + b'y + d which is unbiased for f'1'J, invariant under the group of translations y f--+ y+XfJ and minimizes the variance vart'J 0 T(y) under normality ofthe vector y at a given point 1'Jo will be called the MINQUE of the estimable function f'iJ.
Lemma l
The statistic T(y) = y' Ay + b'y+ d introduced in Definition 3 reduces in the model (1) to the simple form y'Ay.
Proof
We only need the decomposition
188
as cov 1'1a (y' Ay, b' y) = O under normality. The minimization requirement yields var1'! 0 (b'y) =O, from which follows b'y =O, as E(b'y) =O.
•
Sometimes it is reasonable to consider the situation that linear restrictions on the parameter ¡'} are given. They are often presented as R1} = e, where the matrix R and the vector e are given. The model (1) together with R1} =e yields the model
p
(13) (y, X,8, I: 1}; V; IR¡'} =e) i=l
Utilizing the linear approach the MINQUE for the estimable function f'¡J in model (13) has been derived by Volaufova and Witkovsky, see [5]. In the next, certain special structures of the model (13) are considered.
2. REPLICATED MODEL
In practica! work we come across situations where data from different sources contain information on the same set of parameters. In such cases we have the problem of pooling all the available information for an efficient estimation of parameters. In special cases one may have the replicated model
Ya = X,8 +€a a= l, ... , m
E(€a) =O, E(€€1) = V(¡J) cov(€a,€~) =O a =F ,8
which can be written as a combined model
(14)
where y = (y~, y~, ... , y~i)' , X = (10 X), l = (1, ... , l)' ancl analogously f..= (€~, .~., €;n)'. The con di tions E(f..) = O, E(ff') = I 0V(1}) holcl.
Uncler the above given assumptions the estimators can be basecl on the sample mean vector and the sample variance matrix
(15) l m
y= - 2=Ya, m
a=l
~ l m V= -- ~(Ya - y)(Ya -y)'.
m-1 L...-a=l
189
Denote W;= I® V¡ and W('l9) =I® V('l9), respectively. In case we have linear restrictions on the parameter 19 we get the model
(16) (7d_,X/3, W('l9) l R'!9 =e)
Fix the value '!90 and denote To = W('!90) + XX'. Denote by T0+~ a square root of the matrix T¡f, for which the equalities U~ U0 = T¡f, and U0T0 U~ = I hold. The vector 7d. transformed by the matrix U0 imply the model
(17) Uo7d_ = UoX/3 + Uoe.
The maximal invariant with respect to the translation U0y r-+ U0y + U0Xf3 is then the vector z = M 0 U0 y, w here the matrix M 0 of t he form- M 0 = I -U0X(X'T0+ X)- X'Uo' is the projection matrix onto the orthogonal complement of the column space of the matrix UoX.
Consider the vector z ® z. The expectation of this vector is
The symbol "vec" of the matrix denotes the vector formed by the columns of the matrix one below the other. For the sake of simplicity we shall denote the matrix
(vec M 0Uo W1Uo'M0, ... , vec M 0Uo WpUo' M 0 )
by the symbol Q.
In general the variance matrix I:( 19) of the vector z ® z depends on the 3rd and 4th moments of the vector y, i.e. not only on the vector parameter 19.
These simple considerations imply the model formed by the vector z ® z, its expectation Q'l9, and the covariance matrix fixedat 190. Denote this model as
(18)
A straightforward application of the linear theory offers the following lemmas.
Lernrna 2
The linear function J' 19 is unbiasedly invariantly estimable in model ( 18) iff J E R(Q'Q) or equivalently iff J E R(H), where the matrix H has elements H;,i = trV¡Vj.
(See also [2])
190
Lemma 3
Consider the model (18). Let the vector y be normally distributed. Then the ordinary least squares estimator of linear function f''l'J with J E R(Q'Q) is the BL UE in the sense that it is a linear function of z ® z. - -
Proof
The bes t linear (as a function of z ® z) unbiased estima tor (BL UE) of the function f''l'J in the model (18) is given in general as
The ordinary least squares estimator (OLS) ofthe estimable function f''l'J is given as
J'(Q'Q)-Q'(z ® z).
It is enough to show that the model (18) fulfils one of the necessary and sufficient con di tions for the OLS to be the locally best linear (in z ® z) unbiased estimator of J' 1'J, i. e. to show that the inclusion
R(E('l'Jo)Q) Ç R(Q)
holds.
In the case that the vector y is normally distributecl, the matrix E( 'l'Jo) is of the form
(19) E('l'Jo) =(M 0 Uo ®M 0 Uo)(I + F)(W('l'Jo)ViMo ® W('l'Jo)U~M 0 ),
where the matrix F is uniquely cleterminecl by the relation Fvec A = vec A', for each matrix A of proper dimension. We show that
E(1'Jo)vecM0 UoW;U~M0 E R(Q).
Substituting the expression from (19) for E(1'J0 ) we graclually get
E(1'Jo)vecM 0 UoW;U~M0 = = (M 0 Uo ® M 0 Uo)(I + F)vec (W(1'Jo)U~M0 UoW;U~l\iiiUo W('l'Jo))
= 2vec (M 0 Uo W(1'Jo)(MToM)+W;(MToM)+W(1'Jo)ViM 0 )
= 2vec (M0UoTo(MToM)+W¡(MToM)+ToU~M0 )
= 2vec(M0 UoW;U~M0 ).
191
Rere we have used the first part ofthe equalities (3). The matrix M is defined as M= I-xx+.
The proof is complete.
•
Remark 3
The matrix M can be expressed as
(20)
where Pm = l..111, Mm= I -Pm, In is the n x n identity matrix ancl the matrix m
M is given as M= I - xx+.
Corollary l
The orclinary least squares estimator in model (18) is the MINQ UE of the estimable function J' iJ.
For the purpose of completeness we give the following lemma. (See also [2]).
Lemma 4
The MINQUE of the estimable function f'iJ is given by
(21) p
~ ¿ ~ m f'iJ = >.;q.= tr GV + --f/ Ay,
-"' m-1 i=l
where the vector y ancl the matrix Vare given by (15),
p
G=¿ >.i Va+ Vi Va+, i=l
p
A=¿ >.i(MVoM)+V;(MVoM)+, i=l
(22)
>. = (>. 1 , ... , >.p)' is any solution to the system (Q'Q)>. =J, ancl ).* =(m - l)>..
192
Pro o J
Following the statement of Lemma 3 it is enough to express the estimator
in the desired form. Let us denote by ,\ = (Q'Q)- J, where the matrix (Q'Q)-is an arbitrary g-inverse ofthe matrix Q'Q. -- --
Let us concentrate now on the vector Q'(z ® z), which we denote by the symbol <J..· The i-th entry of the vector <¡_is then
(23) (vecMoUoW;Uo'Mo)'(M 0 Uoy_ ® M 0 Uoy)
(vec Uo' M 0 Uo W;Uo' M 0 Ua)'vec yy'
y_'(MWoM)+W;(MWoM)+y_,
due to the fact that
(24) Uo'M 0 Uo = (MToM)+ = (MWoM)+.
Substituting (20) for M in (24) we get
(MWoM) = Mm ®Va+ Pm ® (MVoM)
and consequently
From that we get directly
<J..¡ y_'(Mm ® v0+V;v0+ + Pm ® (MVoM)+V;(MVoM)+)y_
(m - l)tr v0+V;v0+íf + my'(MVoM)+V;(MVoM)+y
(m - l) (tr V/V;v0+v +m 1:_ 1
y'(MVoM)+V;(MVoM)+y).
The i, j-th element of the matrix Q' Q can be expressed as
{Q'Q};,j (vec M 0 Uo W;Uo' M 0 )'(vecM0 Uo WjUo' M 0 )
tr (MWoM)+W¡(MWoM)+wi
(m - l)tr v0+V;v0+Vj + tr (MVoM)+V;(MVoM)+Vj
(m - l) [tr v0+V; V0+Vj +(m - 1)- 1 tr (MVoM)+V;(MVoM)+Vj] .
It means that (25) Q'Q =(m - l)(Go +(m - 1)-1Q'Q],
193
where (26) ( Ga )i,i = tr Va+ V; Va+ Vj
(27) (Q'Q)i,i = tr (MVoM)+V;(MVaM)+Vj.
Then the solutions of the systems Q'Q>.. =J and (Ga +(m - 1)- 1Q'Q)>..* =J are connected by the relation >.=(m= 1)-1>.*. The statement of the Lemma is straightforward.
•
In case that there are linear restrictions on the vector rJ we shall refer to the model (28) (z ® z, QrJIRrJ =e, I:(rJa))
which can be treated as a linear model (in rJ) with restrictions. The natural reparametrization of the model (28) is as follows: let rJ = R- e + Er¡ be the general solution to the equation RrJ = e, where the matrix E fulfils RB = O. Hence we get (29) (z®z-QR-c, QEr¡, I:(rJ0 ))
It is clear that according to the relation
!' {) = !'R- C+!' Er¡
the estimability of the function J' rJ is equivalent to the estimability of the function J' Er¡ in the model (29).
The MINQUE ofthe function f'rJ would be then the estimator f'íJ =J' R-e+ ¡ljjr¡, where ¡ljjr¡ is the MINQUE derived in the reparametrized model (29).
The procedure avoiding the reparametrization is presented below.
The model (28) can be interpreted in the form
(30)
We shall take into account Definition 3 and Lemma l . The following two theorems will conclude our considerations.
Theorem 2
The linear function J' rJ is unbiasedly and invariantly estimable in model (16) iff J E R(U), where the matrix U is given as U = (Ga +(m - 1)-1 (Q'Q+
194
R' R)). The MINQUE of an estimable function f''l'J is then fiJ = j'J, where J is the solution to the system
((m - l)G0 + Q'Q)'l'J + R'v = q
(31) R'l'J = C
The vector v is the vector of the Lagrangian multipliers and the vector q is given by (4).
Proof
The linear function f''l'J is linearly (in (z' 0 z', e')') unbiasedly estimable in
model (30) iff f E R( Q', R') ( ~ ) = R( Q' Q+ R' R). The i, j-th entry of the
matrix Q'Q +R' R is given from (25), (26), and (27) as
(32) {Q' Q+ R' R};,j = (m - l) [Goi,i +(m - 1)- 1( {Q'Q}i,i +{R' R};,j )] .
It is enough to denote U = Q' Q + R' R and the first part of the theorem is proved. --
Consider now two models:
(z 0 z, Q'l'JIR'l'J =e, I) and (z 0 z, Q'l'JIR'l'J =e, ~('l'Jo)).
According to Definition 3 it is enough to find an estimator which is unbiased and minimizes the variance at 'l'Jo under the normality assumption of the vector y. The invariance is obvious since each estimator based on the vector z 0 z is a ~iatistic which is a function of the maximal invariant.
As it was shown in the proof of Lemma 3, under the normality of the vector y the equality ~( '13o)Q = 2Q holds. Hence the minimization of the form (z 0 z -Q'l'J)' (z©z-Q'l'J) under the restriction R'l'J = C is equivalent to the minimmization of(z©z-Q'l'J)'~('l'Jo)-(z©z-Q'l'J)' under R'l'J =c. The statement ofthe theorem is then straightforward. -
•
Theorem 3
One special choice ofthe MINQUEin model (16) ofthe MINQUE-estimable function J' '13 is
(33)
195
where the vector y and the matrix V are given by (15), and the matrices G(R)
and A (R) by the relations
p
c(R) =L K,¡ vo+Vivo+, i=l
p
A(R) =L "';(MVoM)+V;(MVoM)+, i=l
respectively, where "' ("'li ... , "'P )' is any solution to the system (MR1UMR1)+"' = f, and the vector¡ is given by ¡ = (RU-R')-Ru-¡. The matrix U is given in Theorem 2, and the matrix MR' is defined by MR' = I - R'(RR')- R.
Proof
The statement is a direct consequence of Lemma 3 taking into acount the special structure of the matrix Q' Q and the criterion matrix U as well.
•
3. GROWTH CURVE
In the following we shall concentrate our attention on the multivariate model often referred to as the growth curve model, in the special form:
(34) Y=XBZ+e,
where Y is the n x m-matrix with expectation X BZ. The random matrix e satisfies the assumptions
p
E(vec e)= O, E ((vec e)(vec e)')= W(i9) =L i9;(V; 0 E). i=l
Both the matrices X, Z of the type n x r and q x m, respectively are known, and the matrix B is an r x q-matrix of unknown parameters of the expectation. The matrices V;, i = l, ... , p and E are known and symmetric, and the parameter space 0 C JRP for i9 E 0 is such that the matrix W(i9) is p.s.d. for all i9 E 0. At first we shall present the MIN QUE of an estimable function f' 1'J. We shall proceed analogously as in the replicated model.
196
Denote by W; the matrices V; ® .E
Using the operation 'vec' we create the model
(35) vec Y = (Z' ® X)vec B + vec e
Let us use the notation y = vecY, and € = vece. Then the model (35) is in the vector form given as (36) y = (Z' ® X)vec B + €
and together with the properties
p
E(€)= o, E(€€1) =L t9;W;
i=l
it forms a special form of a linear model with variance-covariance components as given in (1).
Fix the value t9o. Let the matrix W(t9o) be denoted by Wo. Let us use the notation To = W0 + (Z' Z ® XX'). Transform the model (36) by the matrix Uo, a square root of the matrix T0 , analogously as in the previous section. The resulting equality is
Uoy = Uo(Z' ® X)vec B + Uo€.
If we are interested in invariant estimation with respect to the translations of the type Uoy i-. Uoy + Uo(Z' ® X)vec B the maximal invariant is the statistic MoUoy, with
Mo= I - Uo(Z' ® X) ((Z ® X')T0+(z' ® X))- (Z ® X')Uo'
Lemma 5
The matrix M 0 can be expressed as
(37)
where the matrix
M +' =I - P +i , v 2z1 v ºZ' o o
and analogously the matrix
197
with
Denote S= M 0 U0 y. Then the corresponding linear model will be considered in the form (38) (vec SS', E(vec SS'), :Eo(vec SS')),
where :Eo(vec SS') is the covariance matrix of the vector vec SS' fixed at the point 1'Jo.
Lernrna 6
The expectation of the vector E(vec SS') is
E(vec SS') = Q1'J,
where the columns of the matrix Q are given by the relation
Q.,j
+
+
+
As before we want to utilize the general results of the theory derived for model (13).
Lernrna 7
The linear function of the parameters of the form f'1'J is estimable in model (38) iff J E R(Q'Q). The orclinary least squares estimator off'¡') is given as
f'1'J = J'(Q'Q)-Q'vecSS'.
Using the same argumentation as in the previous section it is easy but tedious to show that the OLSE of f'1'J given in Lemma 7 is the MINQUE defined in Definition 3.
Consider the linear restrictions R1'J = e on the parameter ¡'}. Then we get the model (39) (vec SS', Q1'JIR1'J =e, :Eo(vec SS')).
198
Denote ij = Q'vec SS'. The next two lemmas give the expressions for the en tries of the vector ij and the matrix Q' Q.
Lemma 8
The i-th element of the vector ij is given as
(40)
Proof
The result is the consequence of the following calculations. Let us denote by U¡ the matrix
Then ij¡ = Q'.,¡vecSS' = (vecU¡)'vecSS'.
For any two matrices A, B with appropriate dimensions the relation
(vecA)'vec B = tr A' B
holds. From that we get
if¡ = trU/SS' = trS'U;S.
Substituting the vector M 0 U0 y for S we get
ij¡ = y'UoMoU¡MoUoy = (vecY)'UoMoU¡MoUovecY,
what after substitution for M, To , and U¡ leads to
if¡ tr ~+yv0+v;v0+y1
-2tr ~+ X(X'~+ X)-X1~+yv0+ Z'(ZV0+ Z')- zv0+v; v0+y'
+tr ~+ X(X1 ~+ X)-X1~+yv0+ Z 1(ZV0+ Z')- zv0+
xv;v0+ Z'(ZV0+ Z')- zv0+y':¿;+ X(X':¿;+ X)- X'.
If we denote by Y 0 the estimator of XBZ which is given by
XBZ = X(X'~+ x)- X 1I:+Yv0+ Z 1(zv0+ Z')- z,
199
the resulting formula follows from
•
By the analogous procedure we get the result of the following lemma
Lemma 9
The i,j-th entrie ofthe matrix Q'Q is given by
Q'Qi,j
+
+
( 41) +
The staternent of the next theorern leads to the MINQUE of the estimable function J' 13 in the growth curve model with linear restrictions on 13.
Theorem 4
The linear function f'13 is unbiasedly and invariantly estimable under the model (39) iff J E R(Q'Q +R' R). The MINQUE of an estimable function f 1 13 is then j'J, where J is any solution to system of equations
Q'Q13 + R'v ij
Rv c.
The matrix Q'Q and the vector ij are given by (41) and (40), respectively. The vector v is the vector of Lagrangian multipliers.
The proof of the theorem goes on the same lines as the proof of Theorem 2. The last theorem gives the explicite form of the MINQUE in case that the matrix R is offull rank in rows and the relation R(R') Ç R(Q'Q) holcls, what is equivalent to the existence of a matrix, say C, for which the equality R= CQ'Q
200
is valid. The statement of the theorem is then the direct consequence of the linear theory applied to model (39).
Theorem 5
The MIN QUE of a MIN QUE-estimable function f' ¡J in model (39) under the assumptions given above is given by
f'iJ =N+ f'(Q'Q)- R' (R(Q'Q)- R')- 1 (e - Cq),
where N is the MINQUE of f'iJ in model (38).
REFEREN CES
[l] Rao, C.R. (1971). "Estimation of variance and covariance components - MINQUE theory". Journal of Multivariate Analysis, l, 257-275.
[2] Rao, C.R. and Kleffe, J. (1988). Estimation of Variance Components and Applications. Volume 3 of Statistics and Probability. North-Holland, Amsterdam, New York, Oxford, Tokyo, first edition, 1988.
[3] Seely, J. (1972). "Completeness for a family of multivariate normal clistributions". Annals of Mathematical Statistics, 43, 1644-1647.
[4] Verdooren, L.R. (1988). "Least squares estimators ancl non-negative estimators of variance components". Communications in Statististics -Theory and Methods, 17(4), 1027-1051.
[5] Volaufova, J. ancl Witkovsky, V. (1992). "Estimation of variance components in mixed linear models". Applications of Mathematics, 37(2), 139-148.
201
QÜESTIIÓ, Vol 17, 2 pp. 203-219, 1993
NUEVOS ESTIMADORES DE LA VARIANZA EN POBLACIONES FINITAS
M. RUIZ ESPEJO*
Universidad Complutense de Madrid
Obtenemos una expresión de la varianza de una población finita en función de los tamaños relativos, varianzas y medias de los estratos o conglomerados en que puede ser dividida la población. Como consecuencia de esta nueva expresión, podemos desarrollar varios estimadores consistentes y no negativos de la varianza poblacional en muestreo estratificada y muestreo por conglomerados con o sin submuestreo. En cada caso, los estimadores de la varianza poblacional son insesgados o conservativos (en el sentida de Wolter, 1985). También se derivan dos nuevos controles de la estimación de la media poblacional en la línea de Ruiz {1987). Finalmente, comparamos los estimadores de la varianza de las estrategias intermedias propuestas por Ruiz y Santos {1989} con respecto al clasico estimador de grupos aleatorios (Wolier, 1985). El primera resulta asintóticamente mas preciso si el tamario n de cada muestra parcial independiente crece suficientemente, cuando el tamaño poblacional N es muy grande.
New estimators of the variance in finite populations.
Key words: Control de la estimación, estrategias intermedias, insesgación, muestreo de poblaciones fini tas, propieclades de los estimadores, varianza.
AMS Classification: 62 D 05.
*M. Ruiz Espejo. Departamento de Estacüstica e Investigación Operativa. Facultad de Ciencias Económicas y Empresariales. Universidad Complutense (Campus de Somosaguas). 28223 Madrid.
-Article rebut el setembre de 1992. -Acceptat el juny de 1993.
203
INTRODUCCIÓN
Usualmente las técnicas de muestreo se enfocan a la estimación de la media poblacional. Aunque se han dedicado menos espacios a la estimación de la varianza poblacional o de la varianza de los estimadores de la media poblacional, los avances recientes en este campo prometen un mayor aprovechamiento de la información proporcionada por muestreo.
En este artículo presentamos avances metodológicos en la estimación de la varianza poblacional en el muestreo estratificado y por conglomerados de poblaciones finitas (una referencia bibliografica del tema es el trabajo de Ruiz y Ruiz, 1992), en la sección l.
También en la sección 2 justificamos la utilidad del estimador de la varianza para estrategias intermedias sugerido por Ruiz y Santos (1989) que asintóticamente sera mejor en precisión que el estimador clasico por grupos aleatorios (una referencia útil de estimadores de la varianza es la de Wolter, 1985).
l. ESTIMACIÓN DE LA VARIANZA POBLACIONAL
l.l. Planteamiento
A lo largo de la historia matematica y estadística se han ido ofreciendo varias expresiones de la varianza de una población finita. Una de ellas, debida a Ruiz (1987), es concretamente
L L - l
172 = 2:Ph17K+ 2:Ph
h=l h=l
(l. l) don de L es el número de estratos o conglomerados, P1i = N1i /N es el peso relativo del estrato h, N1i es el tamaño del estrato h y N el tamaño de la población finita. También flh y p representau la media del estrato h y de la población global respectivamente. Finalmente 171, es la varianza del estrato h.
Esta nueva relación, (l.l), permitió diseñar un control o comprobación de la estimación de la media poblacional en el muestreo estratificado estandar.
204
Ademas, ahora podemos desarrollar una nueva fórmula de la varianza poblacional inspirandonos en una relación clasica,
(1.2) N
N2<T2 = LL(X¡ -Xj)2 i<j
que puede verse por ejemplo en Murthy (1963) o Chaudhuri (1978), donde N es el tamaño de la población finita, y <T 2 es la varianza de la población finita.
La anterior relación clasica (1.2) permitió a Murthy (1963) proponer un estimador de la varianza poblacional, insesgado y no negativo, razonando de un modo similar a como se hace con el estimador Horvitz-Thompson (1952),
a-2 =_l ~~(X¡ -Xj)2 N 2 L..J L..J 7r ..
i<jEs 'J
siendo s la muestra seleccionada de acuerdo con un diseño p no ordenado (Casse! et al., l 977) y 7rij es la probabilidad de inclusión de las unidades i y j en la muestra; la admisibilidad de este estimador fue justificada por Sankaranarayanan (1980). Posteriormente Liu y Thompson (1983) trataron de nuevo este problema.
1.2. Nueva expresión de la varianza poblacional
Como es bien conocido, la varianza de una población finita admite la descomposición usual de la varianza total en variación dentro de estratos y variación entre estratos siguiente
L L
(1.3) <T 2 = LPh<T~ + 'LPh(µh - µ) 2.
h=l h=l
De (1.2) tenemos
y ahora de (1.3) podemos sustituir la última relación para conduir que
L L
(1.4) <T 2 = 2=Ph<T1 +L ¿PhPiJ(µh - flg)2
.
h=l h<g
205
Como consecuencia de esta nueva descomposición del analisis de la varianza, podemos construir varios estimadores consistentes, no negativos y conservativos de la varianza poblacional, así como insesgados; en la sección siguiente 1.3 damos dos controles de la estimación de la media poblacional en muestreo estratificada usual.
1.3. Dos nuevas expresiones de la media poblacional
Igualando los segundos miembros de (l.l) y de (1.4), tenemos
L
LLPhP9 (µh - µ9 )2 =
h<g
De aquí, tenemos despejando
l {L-1 µ = 1- p LPh/lh-=f
L h=l
(1.5) y, como en Ruiz (1987), si el orden de las medias de los estratos es creciente, o mas simplemente si
l L-1 µL > l _ p LPhµh,
L h=l
omitiremos el signo menos previo a la raíz cuadrada de (1.5). Otra expresión valida para la media poblacional es
L L
(1.6)
206
fórmula mas sencilla que (1.5), porque (1.6) no requiere los calculos tan complejos como (1.5). Obviamente la relación mas simple es la clasica
(1.7)
No obstante, las fórmulas (1.5) y (1.6) pueden ser consideradas como nuevos controles del calculo de la media poblacional µ, y por tanto de su estimación al sustituir µh por µh en (1.5), (1.6) ó (1.7) en el sentido propuesto por Ruiz (1987).
1.4. Estimación de la varianza en muestreo por conglomerados
1.4.1. UN ESTIMADOR INSESGADO EN MUESTREO POR CONGLOMERADOS SIN
SUBMUESTREO
Si tenemos a la población finita de tamaño N clasificada en L conglomerados de tamaños Nh(h =l, 2, ... , L) con
L
N= "¿Nh, h=l
un estimador insesgado y no negativo de la varianza poblacional 172 en muestreo por conglomerados sin submuestreo es
(1.8) a-;I = L ph 17~ +L "¿PhPg (µh - µg)2
,
hEs1 1fh h<gEs1
1fhg
donde s1 es la muestra de unidades primarias, y 7rh y 1fhg(> O) son las probabilidades de inclusión de las unidades primarias h y h, g respectivamente en la muestra. El estimador (1.8) es exactamente insesgado, pues si introducimos la variable aleatoria auxiliar
si h E s 1
si h (j_ S¡,
entonces E( e1i) = 1fh, y E( e1i e9 ) = 1fhg, y consecuentemente
L 2 L ( )2 "¿Ph
17h E(e1i)+"¿"¿PhPg µh-µg E(e1ie
9)=
h=l 1r}¡ h<g 1fhg L L
"¿P1il7~ + "¿ "¿P1iP9 (µh - µ9 )2 = 17
2,
h=l h<g
debido a (1.4).
207
1.4.2. UN ESTIMADOR CONSERVATIVO, CONSISTENTE Y NO NEGATIVO EN
MUESTREO POR CONGLOMERADOS CON SUBMUESTREO
Puede verse directamente que el estimador no negativo de 0"2 (si à-~ son no
negati vos),
(1.9)
es consistente si à-~ y µh son consistentes respectivamente para O"~ y µ¡,. Hemos denotado s1 a la muestra de conglomerados o unidades primarias, y 1í¡, y 1íhg son las probabilidades de inclusión de unidades primarias en la muestra. Seguidamente, à-~ y µh se calculau a partir de las unidades secundarias obtenidas por muestreo, asumiendo que estos estimadores son insesgados respectivamente para O"~ y µh. Entonces, a-;1, sobreestima a 0"
2 ,
E(à-?1J E1E2 [tph:~eh + ¿L¿PhPg (P,h :P,9)2
e1ie9] = h=l h h<g hg
E1 [tP1i E2(à-~) eh+ ¿L¿PhPg E2(P,1i - /tg)2 eheg] > h=l 1íh h<g 1íhg
> E1 [tph O"~eh + ¿L¿P1iP9 (µ¡, -µ 9)2
eheg] = 0"2 ,
h=l 1íh h<g 1íhg
porque E1 (eh) = 1íh y E1 (eh e9) = 1íhg en la última igualdad, aplicando previamente la desigualdad de Jensen. Ademas, a-;1, generaliza a a-;
1 dado en (1.8).
1.5. Estimación de la varianza en muestreo estratificada
1.5.1. ESTIMADORES CONSERVATIVOS Y CONSISTENTES EN MUESTREO ESTRA
TIFICADO
El estimador no negativo (cuando sonà-~ no negativos),
L L
(1.10) a-?. = ¿Phà-~ + ¿ ¿PhP9(P,h - [1,9 )2
h=l h<g
208
es consistente para estimar la varianza poblacional a-2 , si los estimadores µh y 0-1. son consistentes. Por ejemplo, siendo
l ni.
-I::Xh;, y nhi=l
donde nh es el tamaño muestral en el estrato h, y donde las observaciones obtenidas en este estrato por muestreo aleatorio simple sin reemplazamiento (mas) son Xh1,Xh2, ... ,Xhnn· Si ademas, como en el ejemplo, µh y 0-1. son insesgados, el estimador a-;, es conservativa en el sentida de que sobreestima a-2 .
En efecto,
E( a-?.)
L L
Lph E(0-1.) +L LPhPg E(P,h - P,g) 2 2 h=l h<g
L L
> l:::Pha-1. + LLPhPg(/lh - /lg) 2 = o-2
,
h=l h<g
porque E(O-Ü = a-{. y E(P,h - P,9 )2 2 [E(P,h) - E(P,9 )]
2 = (¡th - µ 9 )2, por la
desigualdad de J ensen.
Otro estimador diferente, consistente y no negativo ( cuando 0-1. son no negativos) es
L L
(1.11) A 2' ~p A 2 ~p (A A )2 a-,. = L.J hO"h +L.J h /lh - ¡t,,
h=l h=l
el cual es conservativa en las mismas hipótesis que el anterior dado en (1.10).
Los estimadores (1.10) y (1.11) son mucho mas simples en la practica que los dados por Miras (1985) y Hedayat y Sinha (1991), si bien estos son insesgados y todos ellos aplicables en muestreo estratificada.
1.5.2. ESTIMACIÓN INSESGADA EN MUESTREO ESTRATIFICADO
U na visión integrador a de estimadores insesgados de la varianza poblacional en muestreo estratificada puede derivarse de la relación (1.4). En efecto, si xh
209
es la media muestral en el estrato h, tenemos que si h # g, con diseño de muestreo aleatorio simple con reemplazamiento (masr) o sin reemplazamiento (mas) dentro de los estratos,
por lo que un estimador insesgado de la varianza poblacional es
L L
(1.12) a-;,11 = 2:Pha-~ + ¿ 2:PhPu { (xh - x9 )
2 - [ V(xh) + V(x9 )]},
h=l h<g
si en do
con diseño masr
con diseño mas
y
con diseño masr
con diseño mas
siendo s~ la cuasivarianza muestral en el estrato h.
El estimador insesgado (1.12) es el mismo propuesto por Minis (1985), y reformulado por Hedayat y Sinha (1991), aunque mas simple que ambos desde un punto de vista operacional.
2. ESTIMACIÓN DE LA VARIANZA PARA ESTRATEGIAS INTERMEDIAS
2.1. Planteamiento
En un reciente trabajo, Ruiz y Santos (1989) han introducido las llamadas "estrategias intermedias de muestreo" que permiten estimar la media de una población finita con una precisión y un coste esperada intermedio a las estrategias
210
clasicas masr y mas del mismo tamaño muestral. La técnica propuesta consiste en seleccionar m(m 2: 2) muestras aleatorias simples sin reemplazamiento (independientes) de tamaño n(n 2: 2) cada una, de manera que mn :S N. Si llamamos X h a la media muestral de la h-ésima muestra aleatoria simple sin reemplazamiento, h = l, 2, ... , m, entonces el estimador insesgado propuesto para la media poblacional (de la población finita de tamaño N), µ, ser a
l m -
P,= -I:xh. m
h=l
Llamando s!, a la cuasivarianza muestral en el diseño h-ésimo, h= l, 2, ... , m, entonces se propuso como estimador insesgado de la varianza poblacional, 17'2, a
(2.1) A2 l~N-12 17'; = m L.t -¡.¡-sh.
h=l
Con este diseño intermedio la varianza V(µ) se sitúa entre las varianzas clasicas V(X~) y V(Xs), siendo §_la muestra ordenada de tamaño nm obtenida por diseño masr, y s es la muestra de tamaño efectivo nm seleccionada por diseño mas. Las expresiones X s y X s corresponden a las medias muestrales. Ademas, como se justifica en Ruf; y Santos (1989), el coste esperada de la estrategia intermeclia propuesta se sitúa entre los costes esperados cie las estrategias clasicas anteriores.
Una ventaja del "cliseño intermedio" es que permite estimar la varianza poblacional 17' 2 , sin moclificaciones en cuanto a la recogicla de información dada por el cliseño propuesto. Una sugerencia hecha en el mismo trabajo es que llamando p al diseño intermedio, su varianza es
, N - n 2
V(p,µ) = m(N - l)n 17'
por lo que al poder estimar 17' 2 por o} clado en (2.1), es obvio que un estimador insesgaclo de V(p, {l) sera
, N-n l~N-l 2 N-n~ 2 (2.2) V1(p,¡J,) = m(N - l)n. mL..t-¡.¡-sh = m2NnL..,,sh.
h=l h=l
Por otro lado, en las condiciones de selección muestral propuesta vemos que ésta se ajusta a las hipótesis clasicas del método de estimación de la varianza por "grup os aleatorios" en la simbología americana o de "muestreo interpenetrante" en la notación tradicional índia. Desde esta perspectiva un estimador insesgado,
211
diferente del propuesto en (2.2) para V(p, fi,) e históricamente anterior, sería (véase Wolter, 1985)
(2.3)
La pregunta que surge de modo natural es qué estimador insesgado de la varianza V(p, fi,) es mas preciso o deseable. El propósito de las siguientes secciones ser a dar una respuesta satisfactoria a esta pregunta.
2.2. Variauza de i\
Directamente, de (2.2), debido a la independencia de las m muestras parciales,
, (N-n)2 ~ 2 V(V1) = 4N2 2 L • .Y(sh), m n
h=l
(2.4)
y como V(sh) es constante independientemente del valor que tome h(h = l, 2, ... , m) y su valor viene recogido por Hansen et al. (1953), concluímos que asintóticamente (para N muy grande)
siendo
A o l 4 2 V(V1) = 32 0" V8 2,
mn
aproximación útil bajo los diseños masr y mas (Hansen et al., 1953), si N es muy grande y n( < N) suficientemente grande. Así resulta que asintóticamente
(2.5)
cloncle hemos despreciado los infinitésimos de órdenes superiores a m- 3 n- 3 ,
y sienclo µ4 el momento central de orden 4 para la variable de interés en la población finita,
l N
µ4 = -l:(X; - µ) 4.
N. •=l
212
2.3. Varianza de V2
De la fórmula (2.3) deducimos que
l V(X1t) l N-n0" 2
m 2 -----;;--- m 3 N - l~
que asintóticamente se comporta ( cuando N es muy gran de),
(2.7)
2.4. Comparaciones
A 0 l 2 V(V2) = -
3-0" .
mn
Para comparar V(V1) y V(V) tendríamos que hacerlo con sus expresiones exactas (2.4) y (2.6), lo cual resulta ciertamente complicado a la vista de sus desarrollos. No obstante podemos predecir sus comportamientos usando sus expresiones asintóticas (2.5) y (2.7). Efectivamente, para valores de N muy grandes, V(V1) es un infinitésimo de orden m- 3 n-3 mientras que V(V2) lo es de m-3 n- 1 . Esto quiere decir que aumentando el tamaño muestral, n, de cada muestra parcial h= (l, 2, ... , m), el estimador V1 tiene una varianza que tiende a cero de modo mucho mas rapido que V(V2 ), concretamente converge con un orden de n- 2 mas rapido, lo cual hace de la varianza o dispersión de V1 que sea mas pequeña, por lo que el estimador v1 es mas deseable y preciso que el c!asico V2.
Sin embargo conviene destacar un hecho; para valores de n pequeños, V(V2) puede resultar mas pequeña que V(V1 ) pues µ 4 - 0" 4 puede ser superior a !72 •
Por tanto, el tamaño muestral parcial n debe ser suficientemente grande para que el infinitésimo n- 2 haga de su factor (µ 4 - !74 )/!72 un valor inferior a l, y
consecuentemente V(V1) < V(V2) y así el estimador sugerido por Ruiz y Santos (1989) sera superior en precisión al clasico estimador de grupos aleatorios o muestreo interpenetrante, para estrategias intermedias.
Finalmente, el incremento de m (número de muestras parciales), para n fijo, no altera asintóticamente las preferencias por uno u otro estimador de la vananza.
213
3. CONCLUSIONES
Hem os propuesto dos nue vos controles (en el senti do de Ruiz, 1987) para el estimador usual de la media poblacional en muestreo estratificado.' Ademas (1.8), (1.9), (1.10), (1.11) y (1.12) son nuevos estimadores de la varianza poblacional que en determinadas condiciones··son todos no negativos, consistentes y conservativos en el sentida de Wolber (1985); ademas los estimadores recogidos en (1.8) y (1.12) son exactamente insesgados para estimar la varianza poblacional CT 2 • Su interés en la practica es amplio pues son controles o estimadores aplicables en muestreo estratificada convencional o muestreo por conglomerados, a los que sin modificar el diseño muestral es posible añadir estimaciones complementarias aprovechando la información muestral ya obtenida y no siendo necesario otros estudios independientes para su estimación, con sus consecuentes nuevos presupuestos que del modo explicada se economizan.
En la sección segunda, se presenta la superioridad asintótica cuando N es muy grande y n( < N) crece suficientemente, frente al método de grupos aleatorios, del estimador de la varianza para estrategias intermedias propuestas por Ruiz y Santos (1989).
AGRADECIMIENTOS
Expreso mi agraclecimiento a los evaluadores por sus constructivos y valiosos consejos que han permitido mejorar la calidad del artículo.
214
REFERENCIAS
[l) Cassel, C.M., Sarndal, C.E. y Wretman, J.H. (1977). Foundations of Jnference in Survey Sampling. Nueva York: Wiley.
(2) Chaudhuri, A. (1978). "On ~stimating the variance of a fini te population". Metrika, 25, 65-76.
(3) Hansen, M.H., Hurwitz, W.N. y Madow, W.G. (1953). Sample Survey Methods and Theory. (Volumen II). Nueva York: Wiley.
(4) Hedayat, A.S. y Sinha, B.K. (1991). Design and Jnference in Finite Population Sampling. Nueva York: Wiley.
[5) Horvitz, D.G. y Thompson, D.J. (1952). "A generalisation of sampling without replacement from a finite universe". J. Amer. Statist. Assoc., 47, 663-685.
[6] Liu, T.P. y Thompson, M.E. (1983). "Properties of estimators of quadratic fini te populations functions: the batch approach". Ann. Statist., 11, 275-285.
(7) Mir as, J. (1985). Element os de Muestreo para Poblaciones Finitas. Madrid: l.N .E.
(8) Murthy, M.N. (1963). "Generalised unbiased estimation in sampling from finite populations". Sankhya Ser. B, 25, 245-262.
(9) Ruiz, M. (1987). "A control in stratified sampling". Statistics, 18, 287-291.
[10] Ruiz, M. y Ruiz, M.M. (1992). "Equilibrated strategy for population variance estimation". Test, l, 79-91.
(11) Ruiz, M. y Santos, J. (1989). "Estrategias intermedias de muestreo". Estadíst. Española, 31, n'!. 121, 227-235.
(12) Sankaranarayanan, K. (1980). "A note on the admissibility of some non-negative quadratic estimators". J. Roy. Statist. Soc. B, 42, 387-389.
(13] Wolter, K.M. (1985). Introduction to Variance Estimation. Nueva York: Springer-Verlag.
215
ENGLISH SUMMARY:
NEW ESTIMATORS OF THE VARIANCE IN FINITE POPULATIONS
M. Ruiz Espejo
INTRODUCTION
Although the sampling techniques for finite populations are usually applied to estimate the population mean, attention has recently focused on estimating variances, obtaining greater benefit from the information supplied by the sampling.
l. ESTIMATION OF POPULATION VARIANCE
l.l. Planning
Formula (l.l) expresses the finite population variance alreacly given by Ruiz (1987), arrel in (1.2) a known relation is also given.
1.2. New expression of population variance
From the usual clecomposition ofthe total variability within and among strata given in (1.3), we can clecluce the following expression (1.4)
L L
u2 = LPhu~ +L LPhPg(µh - µg) 2
,
h=l h<g
where u 2 is the population variance, u~ the variance of stratum h, µh the mean of stratum h, Ph the relative size of stratum h and L the number of strata.
216
1.3. Two new expressions of population mean
Formulas (1.5) and (1.6) can be considered as new controls for obtaining the population mean µ, together with the classical formula (1.7).
1.4. Estimation of variance in cluster sampling
1.4.1. AN UNBIASED ESTIMATOR IN CLUSTER SAMPLING WITHOUT SUBSAM
PLING
From (1.8),
where s1 is the sample of primary units, and 7íh and 1íhg(> O) are the inclusion probabilities of the primary units h and h, g respectively in the sample.
1.4.2. A CONSERVATIVE, CONSISTENT AND NON-NEGATIVE ESTIMATOR IN
CLUSTER SAMPLING WITH SUBSAMPLING
From (1.9),
where O-~ ancl f11i are consistent estimators of u~ and µ1i respectively.
1.5. Estimation of variance in stratified sampling
1.5.1. CONSERVATIVE AND CONSISTENT ESTIMATORS IN STRATIFIED SAMPLING
When O-~ are non-negative (h= l, 2, ... , L), and {11i ancl O-~ are consistent, the estimator (1.10)
L L
o-;, = Lphq~ + L l:P1iPg (flh - Jlg )2
h=l h<g
217
is consistent for a- 2 . Moreover, if µh and 8-~ are unbiased, then a-;, is conservative for a- 2 . Another estima tor with similar characteristics is (1.11),
where µ,, is the usual estimator of µ in stratified sampling.
1.5.2. UNBIASED ESTIMATION IN STRATIFIED SAMPLING
This estimatoris (1.12)
L L
a-;:'= l::Pho-~ + ¿ L:PhPg { (xh - x9 )2
- [v(xh) + V(x9 )]},
h=l h<g
where 8-~ and V(x1i) are unbiased for o-~ and V(x1i) respectively.
2. VARIANCE ESTIMATION FOR INTERMEDIATE STRATEGIES
2.1. Planning
The theory ofintermediate sampling strategies due to Ruiz and Santos (1989) is revised so as to estimate the population mean. We also give two unbiased variance estimators, V1 (2.2) and V2 (2.3).
2.2. Variance of i\
This can be obtained asymptotically (if l « n « N),
218
2.3. Variance of V2
Similarly
A 0 l 2 V(V2) = - 3-cr .
mn
2.4. Comparisons
Asymptotically, if l << n << N, then
although the other inequality can appear for small values of n.
219
QÜESTIIÓ, Vol 17, 2 pp. 221-233, 1993
UN CONTRASTE DE NORMALIDAD BASADO EN LA ENERGÍA
INFORMACIONAL
M!!. DEL CARMEN PARDO*
Universidad Complutense de Madrid
En este trabajo se presenta un contraste de normalidad basada en la Energía Inforrnacional de forma paralela al obtenido por Vasicek (1976) basandose en la Entropía de Shannon. Se estima la potencia de este contraste para diversas alternativas comparandola con la de atros contrastes de normalidad. Estos resultados permiten afirmar que este contraste es preferida en algunos casos a algunos contrastes clasicos.
A test for normality based on the information energy.
Key words: Contraste no paramétrico, Energía Informacional, Contraste de normalidad.
Clasificación AMS: 62G10, 62B10, 94A17.
l. INTRODUCCIÓN
La medida de certidumbre Energía Informacional, fue introducida en la literatura de la Teoría de la Información por Onicescu (1966), como la suma de las
*María del Carmen Pardo. Departamento de Estadística e I.O. Escuela Universitaria de Estadística. Universidad Complutense de Madrid. 28040. Madrid.
-Article rebut el gener de 1993. -Acceptat el setembre de 1993.
221
probabilidades al cuadrado en caso de una variable aleatoria discreta y como la integral de la función de densidad al cuadrado a lo largo del soporte de la misma en caso de una variable aleatoria continua. Este concepto tiene su apoyo físico en la Energía Cinética de la Mecanica Clasica.
Desde que Onicescu propusiera construir una Teoría de la Información basada en la Energía Informacional en paralelo a la Teoría de la Información bêSà'da en la Entropía de Shannon han sido muchas e importantes las aportaciones que en esta línea han realizado diversos autores. Asi Theorodescu (1977) presenta una caracterización axiomatica y estudia diversas propiedades de la misma. Estas propiedades fueron ampliadas en el trabajo de Pardo (1977) en donde se hace la adaptación del concepto de Energia Informacional a todas aquellas situaciones en las que es necesario distinguir la importancia de los diversos resultados del experimento con respecto a un fin determinado: Energía Informacional Útil. Esta nueva medida que tiene en cuenta tanto la probabilidad de ocurrencia de los diversos resultados asociados al experimento en cuestión como su importancia con respecto a un fin determinado fue caracterizada axiomaticamente por Pardo (1985).
La adaptación del concepto de Energía Informacional al contexto bayesiano como medida de la información que un experimento se espera proporcione acerca de la cantidad de interés fue realizado por Pardo (1982). Esta adaptación permitió a García-Carrasco (1982) definir un criterio de comparación de experimentos para elegir aquel que se espera proporcione una mayor cantidad de información. Una regla de muestreo secuencial utilizando la Energía Informacional fue definida y estudiada en los modelos normal y binomial en Pardo (1987). Un estudio para el modelo exponencial fue realizado por Quesada, Pardo y Morales (1985). Estos mismos autores analizaron la Energía Informacional contenida en un Proceso Puntual y estudiaran sus propiedades.
Gil (1989) estudió el estimador analógico de la Energía Informacional y obtuvo su distribución asintótica, en términos de una distribución normal, tanto en muestreo aleatorio simple como estratificado. En el caso que la población de partida sea uniforme la varianza asintótica de la distribución normal se anula y en este caso Ménendez, Pardo y Pardo (1991) obtuvieron como distribución asintótica en el muestreo aleatorio simple una Ji-Cuadrado. Tan to la distribución asintótica a la normal como a la Ji-Cuadrado, permiten construir diversos contrastes de hipótesis así como intervalos de confianza asintóticos.
Petrica y Stefanescu (1982), disdpulos de Onicescu, han escrita un libro en donde se presentan diversas aplicaciones y propiedades de la Energia Informacional. Otro interesante libro sobre aplicaciones de la Energía Informacional es el escrito por Onicescu y Stefanescu (1979). Finalmente una recopilación de los
222
resultados mas importantes obtenidos con la Energía lnformacional puede verse en la monografia acerca de la misma publicada por Pardo y Taneja (1992).
En este trabajo se presenta una nueva aplicación de la Energía Informacional: la construcción de un contraste de normalidad. Es conocida la importancia que ha tenido la construcción de estos contrastes en Estadística. En Mardia (1980) se analizan los siguientes contrastes de normalidad: los basados en medidas descriptivas, el de Shapiro-Wilk y sus modificaciones, los de aproximación de verosimilitud, los de bondad de ajuste y varios mas. En esta línea Landry y Lepage ( 1992) presentau una interesante recopilación de 20 diferentes tests de normalidad. Ademas en este trabajo, a través de la simulación, obtienen, por una parte, el nivel de significación empírica de los tests considerados y, por otra, camparan la potencia empírica de algunos de ellos frente a diversas alternativas.
El contraste que se presenta en este trabajo se realiza de forma analoga al contraste de normalidad de Vasicek (1976) basada en la Entropía de Shannon y se lleva a cabo un estudio comparativa de este procedimiento con los de Kolmogorov-Smirnov D, Cramér-Von Mises W 2 , Kniper V, Watson U2 ,
Anderson-Darling A2 y Shapiro-Wilk W. Este estudio se hace para las alternativas:
a) Exponencial,
b) Gamma (1,2),
c) Uniforme (0,1),
d) Beta (2,1) y
e) Cauchy con parametros de localización O y escala l (Cauchy (0,1)).
Por última se calcula la potencia de este contraste para la distribución Jicuadrado con diferentes grados de libertad.
2. CONSTRUCCIÓN DEL CONTRASTE DE NORMALIDAD BASADO EN LA ENERGÍA INFORMACIONAL
En este apartada se construye un contraste de normalidad basada en la Energía Informacional. Sea x1, x2, ... , Xn, n ~ 3, la realización de una muestra aleatoria simple de tamaño n de una población con función de densidad f(x) y función de distribución F(x). Sea <I> la función de distribución de una población normal de media µ y varianza <T2 , se trata de construir un procedimiento, basandose en la Energía Informacional, que permita analizar si hay
223
evidencia o no de que las observaciones x 1 , ... , Xn procedan de una población normal. Es decir, si las observaciones x 1, ... , Xn son consistentes con la hipótesis nul a
H0 : F(x) = <I>(x).
La Energía Informacional de una distribución F con una función de densidad f se define como
(1)
Esta expresión escrita en términos de p-l adopta la siguiente forma
j co jco ( l )-1 {l ( d )-1 <= (!) = -co f(x)2 dx = -co f(x) f(x) dx =Jo dp p-l(p) dp,
(2) donde en el último paso hemos hecho el cambio de variable p = F(x) o equivalentemente p-1(p) =x.
Reemplazando la función de distribución F por la distribución empírica Fn y utilizando el operador diferencia en lugar del operador diferencial se puede construir un estimador de (2). La derivada de p-1(p) se estima por (x(i+m) - X(i-m)) n/(2m) para (i-1)/n < p ~ i/n, i= m+l, m+2, ... , n-m, donde X(l) ~ x( 2 ) ~ • • • ~ X(n) son los estadísticos de orden y m es un entero positivo menor que n/2. Las diferencias del tipo x(i+m) - X(l) o X(n) - X(i-m)
se utilizan en lugar de x(i+m) - X(i-m) cuando p ~ m/n, p > (n - m)/n respectivamente.
Entonces se obtiene un estimador &mn de <= (!) de la forma
l n 2m &mn = -2: ( ) ' n i=l n X(i+m) - X(i-m)
donde X(i) = X(1), i< l, y X(i) = X(n), i> n.
La Energía Informacional de una distribución normal con varianza a-2 viene dada por
l leo ( l ) ( (x-µ)2) --- --- exp - ---,.--o-27í1/2 -co ()7íl/2 a-2
224
Ademas bajo la hipótesis nula, Ha: F(x) = <P(x), se sigue que
l Emn __!!___,,
2cnrl/ 2 cuando n-+ oo, m-+ oo, m/n-+ O.
A partir de este resultado y con el fin de definir un estadístico que no depende de cr se considera el estadístico Tmn definido por
2ms2112 n l Tmn = L( )
n2 i=l X(i+m) - X(i-m)
n
con s 2 = n- 1 ¿(x¡ - x")2. i=l
Es claro que bajo la hipótesis nula, se tiene
p --+
l --~ cuando n -+ oo, m-+ oo, m/n -+ O. (27í)l/2
Se puede probar que
con lo cual, utilizando el estadístico Tmn, la reg10n crítica para contrastar Ha: F(x) = <P(x) vendra dada por Tmn 2: T,;;,n(a) donde T,;;,n(a) son los puntos críticos para un nivel de significación a. El calculo analítico de estos valores es difícil por lo que se obtienen por el método de Monte Carlo.
Para cada n ::=; 50 se simularan 2000 muestras de tamaño n de una población normal de media O y varianza l por el método de Box-Muller y para cada una de las muestras se calcula el valor del estadístico Tmn· En la tabla l se muestran los valores T,,';n (a) para valores de m y n dados y a= 0.05. Cada uno de éstos se ha estimaclo por el valor del estadístico de orden que deja a su clerecha el 5% cie las 2000 observaciones de la variable Tmn· Es decir, se calculan los estaclísticos correspondientes a cada una de las 2000 muestras y una vez ordenaclos el valor cie T,,';n (0.05) es el que corresponde al estadístico que ocupa el lugar 1900.
225
Tabla l
Valores de T,,';n(a) para a = 0.05
1n = l 7n = 2 7n = 3 7n = 4 1n = 5
n=3 3.81 4 7.18 5 2.12 1.38 6 6.89 1.42 7 4.77 1.45 0.99 8 4.55 1.22 0.95 9 3.73 1.12 0.71
10 3.70 0.93 0.87 12 2.83 0.91 0.88 14 2.31 0.87 0.73 16 2.01 0.79 0.66 0.65 18 1.62 0.69 0.57 0.54 20 1.77 0.64 0.56 0.55 25 0.70 0.59 0.53 0.51 30 0.52 0.50 0.49 0.48 35 0.61 0.55 0.52 0.50 40 0.56 0.52 0.50
3. ESTUDIO COMPARATIVO CON OTROS PROCEDIMIENTOS
En este apartada el objetivo es doble. Por un lado se calcula la potencia del contraste introducido en el apartada anterior para diversas alternativas y por otro se utilizan estos valores de la potencia del contraste para compararla con la de atros contrastes de normalidad.
La potencia del contraste fue calculada para diversas alternativas. Para cada alternativa la potencia del contraste ha sido estimada por la frecuencia relativa con que 1000 muestras caen dentro de la región crítica. Las alternativas que se han investigada son las distribuciones Exponencial, Gamma (1,2), Uniforme (0,1), Beta (2,1) y Cauchy (0,1).
En relación con la comparación de este nuevo contraste de normalidad con atros ya introducidos en la literatura se han considerada, para las alternativas citadas anteriormente, los contrastes de Kolmogorov-Smirnov D, Cramér-Von Mises W 2 , Kniper V, Watson U2 , Anderson-Darling A2 y Shapiro-Wilk W.
226
La tabla 2 muestra las potencias para un contraste de tamaño a = 0.05 con tamaño muestral n = 20 y m = 4. Se comprueba que para n = 20 los diversos valores de T;;.n (0.05) vienen dados por
m l 2 3 4 5 6 7 8 9
T/:i 2 0 (0.05) 1.77 0.64 0.56 0.55 0.55 0.56 0.56 0.57 0.58
La razón de elegir el valor m = 4 para el tamaño muestral 20 es que el estadística correspondiente tiene una región crítica mayor que si consideramos cualquier otro m. De esta forma, desde un punto de vista intuitivo, conseguiríamos mayor potencial del contraste.
Los valores para los estadísticos D, W 2 , V, U2 , A 2 y W, basados en la función de distribución empírica, contra las alternativas propuestas provienen del artículo de Vasicek (1976).
Tabla 2
Potencias de contrastes a nivel a = 0.05 (n = 20)
Alternativa D w2 V u2 A2 W Tmn
Exponencial 0.59 0.74 0.71 0.70 0.82 0.84 0.99
Gamma (1,2) 0.33 0.45 0.33 0.37 0.48 0.50 0.41
Uniforme 0.12 0.16 0.17 0.18 0.21 0.23 0.29
Beta (2,1) 0.17 0.23 0.20 0.23 0.28 0.35 0.65
Cauchy (1,0) 0.86 0.88 0.87 0.88 0.98 0.88 0.95
Es claro que ningún contraste es mejor para todas las alternativas que otro pero el contraste basada en el estadística Tmn es mejor para tres de las cinco alternativas que cualquier otro contraste lo que indica que en muchos casos sera preferida.
Por última, en la tabla 3 aparecen las potencias del contraste basada en el estadística Tmn para una distribución x2 con l, 3 y 5 grados de libertad para n = 10, m= 3 y n = 20, m= 4. Al igual que antes, el seleccionar de entre todos los valores posibles de m para n = 10 el valor 3 se debe a que parece razonable esperar que proporcione mayor potencia al contraste.
227
Tabla 3
Potencias para distribuciones x 2 (a = 0.05)
n = 10 n = 20
0.815 l
4. APLICACIÓN NUMÉRICA
o 0.778
0.148 0.26
En este apartada se analiza un ejemplo con datos reales sacados del libra de Mardia et al. (1979).
Ejemplo
Analizar si los siguientes 50 valores
5.1, 4.9, 4.7, 4.6, 5.0, 5.4, 4.6, 5.0, 4.4, 4.9, 5.4, 4.8, 4.8, 4.3, 5.8, 5.7, 5.4, 5.1, 5.7, 5.1, 5.4, 5.1, 4.6, 5.1, 4.8, 5.0, 5.0, 5.2, 5.2, 4.7, 4.8, 5.4, 5.2, 5.5, 4.9, 5.0, 5.5, 4.9, 4.4, 5.1, 5.0, 4.5, 4.4, 5.0, 5.1, 4.8, 5.1, 4.6, 5.3, 5.0
que indican la longitud del sépalo de flores de la especie Iris Se tosa son normales.
El contraste se realizara con el estadística Ti 1 50 ya que éste es el menor de los puntos críticos, T,;;n(a), para n = 50 y a= 0.05 que vienen dados por:
m l 2 3 4 5 6 7 8 9
T,;; 5 0(0.05) 0.78 0.56 0.52 0.49 0.48 0.47 0.47 0.46 0.45
m 10 11 12 13 14 15 16 17 18
T,;; 5 0(0.05) 0.45 0.44 0.45 0.46 0.47 0.47 0.48 0.48 0.49
m 19 20 21 22 23 24
T,~50(0.05) 0.49 0.50 0.50 0.51 {).51 0.52
228
y como Ti 150 = 0.4269 < 0.44 aceptamos la hipótesis nula, es decir, nuestros datos provienen de una normal.
REFERENCIA S
(l] García Carrasco, M.P. (1982). "Criterio bayesiano para la comparación de experimentos basado en la maximización de la ganancia de energía informacional". Actas XIII Reunión Nacional de Estadística, 2, 65-72.
(2] Gil, M.A. (1989). "A note on stratification and Gain in precision in estimating diversity from large Samples". Commun. Statist. (Theory and Methods), 18 (4), 1521-1526.
(3] Landry, L. y Lepage, Y. (1992). "Empirical behaviour of some tests for normality". Commun. Statist.-Simula, 21 ( 4), 971-999.
[4] Lindley, D.V. (1956). "On a Measure of Information provided by an Experiment". Ann. Math. Statist., 27, 986-1005.
(5] Mardia, K.V. (1980). "Tests of Univariate and Multivariate Normality". P.R. Krishnaiah, ed., Handbook of Statistics, Vol. l. NorthHolland Publishing Company, 279-320.
(6] Mardia, K.V.; Kent, J.T. y Bjbby, J.M. (1979). "Multivariate Analisis". Academic Press.
(7] Morales, D.; Pardo, L. y Quesada, V. (1986). "La Energía Informacional como Medida de Información en un Proceso Puntual". Estadística Española, 107, 5-14.
[8] Onicescu, O. (1966). "Energie Informationelle". C.R. Acad. Sci. Paris. Ser. A, 841-842.
[9] Onicescu, O. y Stefanescu, V. (1979). Elemente de Statistica informationala eu aplicatii. Editura Technica. Bucarest.
[10] Pardo, L. (1977). "La Energía lnformacional como fundamento de una Teoría de la Información". Memoria presentada en el Instituta Universitario de Estadística e I.O. Madrid.
[11] Pardo, L. (1982). "Algunas consideraciones acerca de la Energía lnformacional". Estadística Española, 94, 113-122.
(12] Pardo, L. (1984). "Plan de muestreo secuencial basado en la Energía lnformacional en el modelo de Bernouilli". Estadística Española, 104, 27-49.
[13] Pardo, L. (1987). "Plan de muestreo Secuencial basaclo en la Energía Informacional". Real Academia de Ciencias Exactas, Físicas y Naturales de Madrid, LXXXI l, 102-115.
229
(14]
[15]
(16]
[17]
[18]
[19]
[20]
Pardo, J .A. (1985). "Caracterización Axiomatica de la Energía Informacional Útil". Estadística Española, 108, 107-116. Pardo, L. y Taneja, I.J. (1991). "Information Energy and its Applications". In: Advances in Eelectronic and Electron Physics, 90, 165-241. Pardo, L.; Pardo, J.A. y Menéndez, M.L. (1991). "Unified (r,s)-Entropy as an idex of Diversity". Jour. of the Franklin Jnstitute, 329, 907-921. Petrica, l. y Stefanescu, V. (1982). Aspecte noi ale teorie informatiei. Editora Academiei Republicii Socialiste Romania. Quesada, V.; Pardo, L. y Morales, D. (1985). "Plan de Muestreo Secuencial basado en la Energía Informacional para una población Exponencial". Trabajos de Estadística y de Investigación Operativa, 36, 233-242. Theodorescu, A. (1977). "Energie Informationelle et notions apparentees". Trabajos de Estadística e J. O., 27, 276-298. Vasicek, O. (1976). "A test of normality based on sample entropy''. J. Roy. Statist. Soc., B 38, 54-59.
ENGLISH SUMMARY:
A TEST FOR NORMALITY BASED ON THE INFORMATION ENERGY
M!?:. del Carmen Pardo
Let X1, x2, ... , Xn, n ;:::: 3, be drawn at random and with replacement from a population of size n with density function J ( x) and distribution function F( x). Let <P be the mean µ and variance 0"
2 normal distribution function. We are interested in finding a statistic based on the Information Energy to test whether the X1, ... , Xn observations are consistent with the null hypothesis H 0 : F(x) = <P(x).
The Information Energy of a distribution F with a density function J is defined as
(1) Cl:(!)=¡: f(x)2 dx
230
If we express (1) in the form
(2)
an estimate of (2) can be constructed by replacing the distribution function F by the empirical distribution function F, and using a difference operator in place ofthe differential operator. The derivative of F- 1(p) is then estimated by (x(i+m) - X(i-m)) n/(2m) for (i - 1)/n < p ~ i/n, i= m+ l, m+ 2, ... , n - l, where X(l) ~ x(2) ~ · · · ~ X(n) are the order statistics and m is a positive integer smaller than n/2. One-sided differences ofthe type X(i+m)-X(l) or X(n)-X(i-m)
are used in place of X(i+m) - X(i-m) when p ~ m/n, p > (n - m)/n respectively.
This produces an estimate Emn of <!: (!)
l n 2m Emn = -2= ( ) ,
n i=l n X(i+m) - X(i-m)
where X(i) = X(1), i< l, and X(i) = X(n), i> n.
by The Information Energy of a normal distribution with variance <T
2 is given
l <!: (!) = ~/2 .
2<T1T
Under the null hypothesis H 0 , we have
l Emn ....!!....+
2<T7rl/ 2 when n--+ oo, m --+ oo, m/n --+ O.
Then defining the statistics Tmn as
2ms2 112 n l Tmn = 2 L( )
n i=l X(i+m) - X(i-m)
we have
n
with s2 = n- 1¿ (x; - x")2 i=l
when n--+ oo, m--+ oo, m/n--+ O.
231
Furthermore, it can be shown
l Tmn ~ (211")1/2,
then using the Tmn statistic, the critica! region for testing H0 : F(x) = <P(x) is Tmn ~ T,;';n (a) where T,;';n (a) are the critica! points for the significance level a. It is difficult to calculate these values analytically so the Monte Carlo simulations were used to obtain them.
Table l
T,;;n(a) values for a= 0.05
m= l m= 2 m= 3 m= 4 m= 5
n=3 3.81 4 7.18 5 2.12 1.38 6 6.89 1.42 7 4.77 1.45 0.99 8 4.55 1.22 0.95 9 3.73 1.12 0.71
10 3.70 0.93 0.87 12 2.83 0.91 0.88 14 2.31 0.87 0.73 16 2.01 0.79 0.66 0.65 18 1.62 0.69 0.57 0.54 20 1.77 0.64 0.56 0.55 25 0.70 0.59 0.53 0.51 30 0.52 0.50 0.49 0.48 35 0.61 0.55 0.52 0.50 40 0.56 0.52 0.50
Next, on the one hand the power of the test is estimated against severa! alternatives: Exponential, Gamma (1,2), Uniform (0,1), Beta (2,1) and Cauchy (0,1). And on the other hand the power of the Tmn test was compared with the power of other tests of normality against the same alternatives. The tests considered are: Kolmogorov-Smirnov D, Cramér-Von Mises W 2 , Kniper V, Watson U2 ,
Anderson-Darling A 2 and Shapiro-Wilk W.
232
Table 2 lists power estimates of 0.05 size tests with sample size n = 20. We choose m = 4 because the maximum power is typically attained there.
Table 2
Powers of 0.05 test against some alternatives (n = 20)
Alternative D w2 V u2 A2 W Tmn
Exponential 0.59 0.74 0.71 0.70 0.82 0.84 0.99 Gamma (1,2) 0.33 0.45 0.33 0.37 0.48 0.50 0.41 Uniform 0.12 0.16 0.17 0.18 0.21 0.23 0.29 Beta (2,1) 0.17 0.23 0.20 0.23 0.28 0.35 0.65 Cauchy (1,0) 0.86 0.88 0.87 0.88 0.98 0.88 0.95
It is apparent from this table that none of the tests considered performs bet ter than all other tests against all alternatives. Compared with any other test, however, the Tmn test shows higher power against three of the fi.ve alternative distributions. These results suggest that this test may be preferred in many situations.
Finally, Table 3 lists power estimates of 0.05 size tests against a chi-squared distribution with l, 3 and 5 degrees of freedom. We choose m = 3 for n = 10 and m= 4 forn= 20.
Table 3
Powers for x 2 distributions (u = 0.05)
n = 10 n = 20
0.815 l
233
o 0.778
0.148 0.26
QÜESTIIÓ, Vol 17, 2 pp. 235-244, 1993
AN APPROXIMATION OF THE JC-FUNCTION FOR THE STUDY OF
BINARY IMAGES
GUILLERMO AYALA GALLEGO* AMELIA SIMÓ VIDAL t
Jensen et al. {1990} gave an exact expression for the K-function in non-overlapping Boolean models. The present study proposes and evaluates an approximate expression for the K-function in overlapping isotropic Boolean models based on an approximation of the covariogram of the primary grain. We study the suitability of a Boolean model for two binary images using this approximate expression.
Key words: Boolean model, K-function, reduced moment measure, image analysis.
l. INTRODUCTION
The Boolean model, a kind of random closed set (Matheron, 1975), has, in recent years, proved to be sufficiently versatile for modelling binary images from very varied sources and is of particular interest for biological and geological images (Stoyan et al., 1987). Its use for modelling three-dimensional objects is also of considerable interest. A recent contribution in this area is Bindrich and Stoyan (1991).
* Guillermo Ayala Gallego. Departamento de Estadística e I.O. e Instituta de Robótica de la Universidad de Valencia. Spain.
t Amelia Simó Vidal. Departamento de Matematicas. Universidad Jaume I. Castellón. Spain.
-Article rebut el febrer de 1993. -Acceptat el setembre de 1993.
235
A Boolean model is: Let x = { x1 , x 2 , ... } be a stationary Poisson point process in IP'. with intensity .À. Let Z1 , Z2 , ... be a sequence of almost surely compact, convex, independent, random closed sets called grains, identically distributed (as Z0 ), distributed independently ofx and satisfying E>.d(Zo+L) < oo for every compact L in IP'.d where L = {-k : k E L} is the symmetric of L about the origin, Z 0 + L = { z + k : z E Z 0 , k E L} the Minkowski addition and Àd stands for the Lebesgue measure in the Euclidean space ffii:d. Then:
(1) Z = LJ Zn +zn n~l
is a Boolean model with primary grain Zo and intensity .À.
Given a stationary random closed set <t> in IP'.d, we can define a random measure which we will call the measure of coverage associated with <t> as: vq.(B) = >.d( <t> íl B), B being a Borel set in IP'.d. In the following, Àr with r = O, ... , d denotes the r-dimensional Hausdorff measure in IP'.d. It has been shown that under certain very general conditions vq,, which is obviously determined by <t>, in turn determines the random set <]), Ayala et al. (1991a). In any case, characteristics of V.I> provide partial descriptions of <D which are of practical interest, particularly the K-function. If p = P(O E <t>) denotes the volume fraction of the random set, then
l l K(t) = -E0 (vq,(B(O, t)))= -E(vq,(B(O, t)) l O E <t>)
p p
where E 0 is the expectation with respect to the Palm distribution Pa of v.r. (Daley and Vere-Jones, 1988) and B(O, t) the ball with the origín as center and with radius t. lntuitively,
K(t) = l (expected Lebesgue measure for the intersection of <D and the ball p with radius t ancl center at a typical point of <t>).
It can easily be proved (J ensen et al., 1990) that
(2) K(t) =-;. f C(x)dx P ÍB(O,t)
where C(x) = P(O, x E <t>) is the covariance function of the ranclom set <D. Assuming an isotropic random set, i.e., distribution invariant uncler rotations, then the covariance function depends on the moclulus of x and (2) is
(3) A it K(t) = --f rd- 1C(r)dr p o
where Ad= Àd-1(So), and So is the unit ball surface in IP'.d.
236
An approximation of /C for isotropic Boolean models is proposed in the following section. The third section is devoted to studying its errors. This approximation is used in the fourth section for a goodness-of-fit problem: for two different binary images we test the suitability of the Boolean model.
2. THE APPROXIMATION
For a Boolean model Z in JRª as described above in (1), it holds (Matheron, 1975) that:
(4)
where 1z0 (x) = E>.a(Zo íl(Zo + x)), the geometric covariogram of the primary grain Z0 and p = 1- ewd with Va= E>.a(Z0 ). Matheron (1975) shows that the function g(r·u) = >.a(L íl(L+ru)) with r> O, u E So and L convex and compact, is differentiable from the right at r= O and its derivative is Àa-1(II,,L), where IT,,L denotes the projection of L onto the hyperplane whose normal vector is u. Bearing in mind that we assume the primary grain Zo to be almost surely convex, compact and isotropic, by applying Cauchy's formula (Santaló, 1976) it follows that:
(5)
where oZ0 denotes the boundary between Zo and Sa-1 = E>.a-1(8Zo) and /3a= 1 r( a/ 2) C l h fi d . . f l .
211" 172 r((d+l)/ 2). onsequent y t e rst or er approx1mat10n o t ie geometnc covariogram of the primary grain near r = O is
(6)
From (4) and (5) it is easy to obtain the first derivative of the covariance function, C'(O).
The approximation which we propose consists in using (3), and performing the Taylor expansion up to the order d +l of the /C-function. It is verified that this method is equivalent to replacing the covariance function in equation (3) with its development at the origín to order one: C(r) '.::::'. p + C'(O)r. For higher order clevelopments we need to know the second, ... derivatives at the origín of the covariance function whose general expression is unknown. For any random set (not necessarily Boolean) the approximation is as follows:
237
(7)
If the random set is a Boolean model then (7) is
(8) ~~ Ad d l - P d+ i A-(t) ~ Ki(t) = pdt ->.Ad/3dSd-1(d+ l)p2 t
For d = 2:
(9) K() K () _ 7r 2 2..\S1(l - p) 3 t ~ l 2 t - -t - 3 2 t '
' p p
S1 being the mean perimeter of the primary grain.
3. ERRORS
Two different models are considered in order to evaluate the approximation.
l. A 2-D Boolean model: the primary grain is a random disc with uniform radius in [O,p].
2. A 3-D Boolean model: the primary grain is a random ball with uniform radius in [O,p].
The covariance function is known for both models (Stoyan et al., 1987) and we can evaluate K using numerical integration. (9) (d = 2) and (8) (d = 3) provide us with the first approximation for these models. The values chosen for the parameters were p = O.l with three different volume fractions, p = O.l, 0.5, 0.9 (or equivalently, three ,\ values).
Each volume fraction corresponds to two plots of the same row. In the plot on the left, we have shown the K-functions (thick line) and K1 -functions (fine line) within a row. In the column on the right we have shown K/Ki. For r> p, C(r) = p2 as shown Ayala et al. (199lb) and so we have evaluated the approximation up to r = p. Figure l corresponds to the 2-D case and Figure 2 to the 3-D one.
Globally, we can say that the approximation proposed, (8), is fairly good, improving, though not greatly, as the volume fraction increases.
238
k,kl O.lS
0.12S
o. l
o.O?S
o.os
0.02S
k,kl
o. 04
0.03
0.02
O.Ol
k,kl
0.03
0.02
o.oo
0.02 0.04 0.06 0.08
Figure l
239
k l kl
l. 2
1. lS
l. l
l. os
0.02 0.06 0.08 o. lt
k l kl
1.2
1. lS
l. l
l.OS
0.02 o.o4 0.06 0.08 o.f
k l kl l. l
l. 08
1.06
l. 04
l. 02
0.02 0.04 0.06 0.08 o.f
k,k2
0.015
0.0125
O ,Ol
0.0075
0.005
o .0025
k,k2
0.005
º·ºº' o .003
o .002
o .001
k,k2
o .003
o. 0025
o .002
o .0015
0.001
0.0005
0.02
Figure 2
240
k l k2
1.2
1.15
l. l
1.05
k l k2
1.3
1.25
1.2
1.15
l.l
1.05
k l k2
1.12
l.l
1.08
1.06
1.04
1.02
0.02 0.04 0.06 o.oe O.l t
o .06 o.oe O.l t
4. SOME APPLICATIONS
We shall analyse two binary images in order to demonstrate the use of the approximation. The first image, Figure 3, represents the clistribution of heather in the countryside (it is a centred square from Diggle's image, 1981). The second image, figure 4, is a cross-section of fibres within a nerve fascicule in the sciatic nerve of a male rat (Ruiz, 1986). In order to test the suitability of the Boolean model we use the following method: first, we shall estimate p ancl S1 (see (9)) by means of a method not related with the covariance function (we assume a Boolean model.) This provides us with the first approximate version of K, K1,2 . Then using the usual estimator (see Ripley, 1988), we shall estimate the covariance at the points belonging to a grid. In this way, we will have, using (3), a second approximation for K, Jê. Note that in this second case we are not assuming any hypothesis about the model. We have chosen Kellerer's methocl (Kellerer, 1983 and 1985) to estimate the parameters in the first case. This methocl uses only three quantities: area and Euler-Poincaré characteristic of the image ancl perimeter of the image without its intersection with the edges of the winclow. From these quantities we can estimate the intensity of the Poisson paint process, the mean area ancl the perimeter of the primary grain. Assuming a unit square as sampling window for both images, the estimated intensity for the heather is 217.36, the mean area is 0.00373 ancl the mean perimeter is 0.22256. For the nerve fascicule, the values observed were: 272.9242, 0.00138 ancl 0.13646. From these values we will obtain two versions of K1,2. We have plottecl (Figure 5) two curves, one for each binary image, representing K1,2 against Jê, and the line x = y. From this figure, we can formulate the following conclusions:
l. Boolean model cloes not seem suitable in either case. This may, of course, be due to the quality of the approximation, although, as we can see in Figure 5, near the origin there is a clear difference between the estimate based on the real images and the approximations, which argues against this supposition. It may also be due to the estimator used to obtain the approximations. Although the problem has been studied fairly extensively for the paint processes, this is not the case for ranclom closed sets. This line of stucly neecls further exploration. (Doguwa and Upton, 1989, ancl Ripley, 1988).
2. The mean area for the intersection of the heather ancl a ball with raclius t ancl centre at a typical paint of the set is smaller than might be expected for the acljustecl Boolean model. The clifference decreases with t.
3. The mean area observed for the nerve fascicle is also less than the mean area when we assume a Boolean model, but the opposite is true as t increases.
241
Figure 3
Figure 4
242
.. _.,,. •• ,p• .. .. ..... .. ...
.rP
·• • •
• •
•• •• • rP
• •
,p
•
• • •
:..•::-·.,,. O.J.C--.-~~,._.._... __ _,___,,._......_,. __ ._! o .025 .05 .075 .l .125 .15 .175 .2
K-function estimated from the image
Figure 5
5. FINAL REMARKS
.225 .25
• Nerve D Heather
In the foregoing section we have shown an application of the approximation proposed with a view to establishing whether two images can be considered as realizations of an isotropic Boolean model. We believe this might be its main application. If a model of this kind is considered suitable a priori, it is clear that our approximations provide fairly good estimators with a much lower computation cost than if we calculated Ripley-type estimators for random sets.
6. ACKNOWLEDGEMENT
For the final version of this paper we are indebted to the interesting and detailed comments of the referee.
243
REFEREN CES
[l] Ayala, G., J. Ferrandiz and F. Montes (199la). "Random set and coverage measure". Adv. Appl. Prob., 23, 972-974.
[2] Ayala, G., J. Ferrandiz and F. Montes (199lb). "Sparse sampling and maximum likelihood estimation for Boolean models." Biom. J., 33, 237-245.
[3] Bindrich, U. and D. Stoyan (1991). "Stereology for pores in wheat bread: statistical analyses for the Boolean model by serial sections". J. Microsc., 162, 231-239.
[4] Daley, D.J. and D. Vere-Jones (1988). An Introduction to the Theory of Paint Processes. Springer-Verlag, New York.
[5] Diggle, P.J. (1981). "Binary mosaics and the spatial pattern of heather." Biometries, 37, 531-539.
[6] Doguwa, S.I. and Upton, G.J.G. (1989). "Edge-corrected estimation for the reduced second moment measures of point processes." Biom. J., 31, 563-575.
[7] Jensen, E.B., Kieu, K. and Gundersen, H.J.G. (1990). "On the stereological estimation of reduced moment measures." Ann. Inst. Statist. Math., 42, 445-461.
[8] Kellerer, A.M. (1983). "On the number of clumps resulting from the overlap of ranclomly placed figures in a plane." JAP, 20, 126-135.
[9] Kellerer, A.M. (1985). "Counting figures in planar random configurations. JAP, 22, 68-81.
[10] Matheron, G. (1975). Random sets and Integral Geometry. Wiley, Lonclon.
[11] Ripley, B. (1988). Statistical Inference for Spatial Processes. Cambridge University Press, Cambridge.
[12] Ruiz, A. (1986). Estudio de la conducción y morfometría del nervio ciatico de la rata albina en un modelo de neuropatía alcohólica experimental. PhD thesis, Universidad de Valencia.
[13] Santaló, L.A. (1976). Integral Geometry and Geometric Probability. Addison-Wesley, Reading, Mass.
[14] Stoyan, D., Kendall, W.S. and J. Mecke (1987). Stochastic Geometry and its applications. Wiley, Berlin.
244
QÜESTIIÓ, Vol 17, 2 pp. 245-264, 1993
ESTRATEGIAS ÓPTIMAS DE UN JUEGO BIPERSONAL DE SUMA CERO Y PUNTOS DE ENSILLADURA DEL CAMPO ESCALAR
ASOCIADO
J. FREIXAS BOSCH*
Universitat Politècnica de Catalunya
Definimos el campo escalar asociado a un juego bipersonal de suma cero. Estudiamos la existencia y unicidad de puntos estacionarios y obtenemos la forma general de los mismos en el caso de unicidad. Se establece que todo punto estacionaria es de ensilladura. La importancia del estudio anterior queda refiejado al establecer la equivalencia entre las estrategias óptimas simples de un juego y los puntos estacionarios del campo escalar asociado. El teorema de Shapley-Snow {2} proporciona un método sistematico para encontrar todas las estrategias óptimas de un juego, a partir del calculo de las estrategias óptimas simples para cada submatriz regular. Combinando la equivalencia vista y el Teorema de Shapley-Snow, podemos obtener todas las estrategias óptimas de un juego simple, a partir del calculo de los puntos estacionarios para cada submatriz regular. Para establecer algunos resultados hemos utilizado la matriz n-asociada en lugar de la matriz adjunta, puesto que la tenemos definida inclusa para matrices no cuadradas y generaliza los resultados que pueden obtenerse utilizando matrices adjuntas.
Optima! strategies for a two-person zero sum game and saddle-points of the scalar field associated with the game.
Key words: Juegos bipersonales de suma cero. Calculo de estra-tegias óptimas.
* J. Freixas Bosch. Dpt. Matemàtica Aplicada III. Escola d'Enginyers Tècnics de Manresa. Av. Bases de Manresa, 61-73. 08240 MANRESA.
-Article rebut el gener de 1992. -Acceptat l'abril de 1993.
245
l. INTRODUCCIÓN
En el presente artículo definimos el campo escalar asociado a un juego bipersonal de suma cero, calculamos sus puntos de ensilladura, estableciendo en el caso matricial cuadrado condiciones para la existencia y unicidad de los mismos.
Dado un juego matricial no necesariamente cuadrado demostraremos que todo punto de ensilladura perteneciente a Xn x Ym es solución simple del juego. Analizaremos la situación recíproca viendo que toda solución simple del juego es punto de ensilladura del campo escalar asociado perteneciente a Xn x Y m.
Extenderemos los resultados obtenidos y deduciremos un método basado en el calculo de puntos de ensilladura para determinar todas las estrategias óptimas del juego.
Un juego bipersonal de suma cero en forma normal viene descrito por la terna (N,I;1 x I;2,7r).
Donde N = {l, 2} simboliza a los dos jugadores. I;1 = {1,2, ... ,m}, I;2 = {1,2, ... ,n} representau los conjuntos de estrategias puras para cada jugador. 7r: :B1 x :B2 -+ IR2 'v'(i, j) E :B1 x :B2, con 7r1(i, j) + 7r2(i, j) =O.
(i,j) -+ (7r1(i,j), 7r2(i,j))
Tal situación puede representarse mediante una matriz A de orden m x n, siendo a¡j el pago que le corresponde al primer jugador, y -a¡j el pago que le corresponde al segundo jugador cuando el primer jugador escoge la alternativa i y el segundo jugador esco ge la alternativa j.
La extensión mixta del juego de suma cero dado en forma normal, se representa por (X, Y, K) donde X, Y, representau para cada uno de los jugadores, distribuciones de probabilidad sobre el conjunto de sus estrategias puras:
m n
donde lafunción de pagos K:X x Y-+IR es K(x,y) = LLX¡a¡jYj· i=lj=l
El teorema del minimax [VonNeumann-Morgenstern, 1944) asegura que la extensión mixta del juego tiene al menos un par de estrategias óptimas (xº, yº)
246
tal que: max minK(x, y) = K(xº, yº) =min maxK(x, y), siendo v = K(xº, yº) xEX yEY yEY xEX
el valor minimax del juego. Cada par de estrategias óptimas cumple: J{ ( x, yº) ~ K(xº,yº) ~ K(xº,y) siendo x,y elementos cualesquiera de X,Y respectivamente. Diremos que las estrategias óptimas son simples si K(x, yº) = K(xº, yº) = K(xº, y).
m
Dado que x = (x1, x2, ... , Xm-1, Xm) con LXi =l Y Y = (Y1, Y2, ... , Yn-1, Yn) i=l
n
con LYi = l, podemos expresar la caracterización de la función J{ en función j=l
tan sólo de las variables independientes, de esta forma J{ sera un campo escalar definido en Xm-1 x Yn-1, siendo:
{xEm;m-1:x;2:'.:0, ~x;~l}
{vE111.•-',v;:O:O, ~v;s;1}
Siempre que escribamos x 0 indicara un vector fila, mientras que yº indicara un vector columna sólo cuando usemos operaciones matriciales, en otras situaciones indicara un vector fila.
J{ sera un campo escalar definido en X X Y, o bien definido en Xm-1 x Yn-1 según en el contexto en el que nos encontremos.
2. PUNTOS DE ENSILLADURA DEL CAMPO ESCALAR ASOCIADO
Dada una matriz A= (a;j) cuadrada de orden n +l, con n >O, el campo escalar J{ asociado a la matriz A es:
n n n n
K(x1, ... ,xn,Y1, ... ,yn) =Ao+ LÀix;+ LBiYi + LLCijXiYj i=l j=l i=lj=l
247
donde: Ao = ªn+l n+l Àk = akn+l - ªn+l n+l Be = an+ll - ªn+l n+l
Ckj = ( akj + an+l n+l - ( ªkn+l + ªn+lj)) = ~ ( ~ n+l) n+l
j,k,f.= l, ... ,n
Lema 2.1
a)
dot (
C11 C1k-1 -A1 Clk+1 C1n ) n+l
Lbi,n-k+2 = Cn-k+2
Cn1 Cnk-1 -An Cnk+l Cnn i=l
C;' Clk-1 -B1 clk+i C1n ) n+l det Lbn-k+2,j = Ín-k+2
Cn1 Cnk-1 -En Cnk+1 Cnn j=l
donde k = l, ... , n., siendo b¡j el elemento situada en la fila i-ésima (!¡), columna j-ésima ( Cj) de la matriz n-asociada de A. La matriz n-asociada de A esta formada por todos los menares de orden n; dispuestos en orden lexicografico y cada elemento, multiplicada por (-l)i+j (siendo i y j la fila y columna que ocupan en la matriz).
b)
det ( C~1 ... · ..... C~n) Cn1 · · · · · · Cnn
~(ln+l) ln+l (
ln+l) ... ~ ln+l n+ln+l
= ¿¿bij i=lj=l ~(nn+l)
ln+l (n n+l) ... ~ nn+l
Demostración
a) Un el em en to cualquiera de la matriz C (apartada b) es de la forma:
luego el determinante de la matriz C, puede desarrollarse por columnas, quedando 2n determinantes, de los cuales 2n - ( n + l) son nul os, al tener la columna (A1, ... , A1,;, ... , An)t repetida al menos dos veces, el determinante
248
queda reducido a:
Cu C1j C1n
n detC = det Ck1 Cki Ckn det C+ ¿ det ( Cj)
j=l
Cni Cnn
siendo:
Cu . . . C1j-1 -A1 C1j+i ... C1n
ei = Ck1 . . . ckj-1 -Ak cki+i ... Ckn
Cn1 ... Cnj-1 -An Cni+1 · · · Cnn
Observamos que:
... clk-1 -A1 Clk+1 ••.. C;•)
... Cnk-1 -An Cnk+1 · · · Cnn
l) Calculo del determínante de C: Al ser los elementos de la matriz de la forma Ckj = ( akj - an+lj) y desarrollando el determinante de C por filas obtenemos de nuevo 2n determinantes de los cuales 2n - ( n + l) son nulos al tener repetida al menos dos veces la
n
fila (-an+ll, ... , -an+lj, ... , -an+1n), ahora det C= elet A+¿ elet Ak, k=l
sienelo:
A
249
au a1j a1n
ªk-U ªk-lj ªk-ln Ak -an+U -an+lj -an+ln
ªk+U ªk+lj ªk+ln
anl anj ann
De la última matriz, trasladando la fila k-ésima, al último lugar, utilizando propiedades usuales de los determinantes y teniendo en cuenta la definición de matriz n-asociada, obtenemos:
det A= b11 y
n+l
Entonces: det C= Lbn-k+2,1 = C1
k=l
2) Calculo del determinante de Cj
Cu
det Cj = det
Desarrollando el determinante de Cj en :filas, obtenemos 2n determinantes de los cuales 2n - ( n + l) son nulos al tener al menos dos veces repetida la fila (-an+ll, ... , -an+lj-l, ªn+l n+l, -an+lj +1, ... , -an+ln) ·
Trasladando la columna k-ésima al final y utilizando propiedades de determinantes, y la definición de matriz n-asociada resulta:
n+l
det Cj = Lbi,n-j+2 = Cn-j+2
i=l
donde j = l, 2, ... , n.
Con ello queda demostrado, la primera parte del apartado a). Analogamente se procedería para demostrar la segunda part e de a).
250
b) No hay mas que observar los resultados obtenidos en l) y 2) del apartada a).
n n n+l n+ln+l
det C= det C+ L det (Cj) = c1 + Lcn-j+2 = Lci = LLbij j=l j=l j=l i=lj=l
Teorema 2.2 EXISTENCIA DE PUNTOS DE ENSILLADURA
a) Existe un único punto de ensilladura del campo escalar J{ en ]Rn x JR'.n, si y sólo si, la suma de los elementos de la matriz n-asociada de A es distinta de cero.
En esta situación, el punto de ensilladura de K, puede determinarse a partir de la matriz n-asociada de A de la siguiente forma:
O_ Ín-k+2 xk - fi+··· Ín+l'
O Cn-k+2 Yk = donde k=l,2, ... ,n+l.
C1 + · · '+ Cn+l
b) El campo escalar J{ no tiene ningún punto de ensilladura en ]Rn x ]Rn si y sólo si, la suma de los elementos de la matriz n-asociada es cero y existe un índice i tal que f¡ =J O.
c) El campo escalar J( tiene infinitos puntos de ensilladura en ]Rn x ]Rn, si y sólo si la suma de los elementos de la matriz n-asociada es cero y para cada i = l, 2, ... , n +l f¡ =e¡ =O y el rango C= rango (C, -A) = rango (C 1
, -B).
don de
- ( C~1 : .. C~n -¿1) - ( C~1 : .. C~n -~1 ) (C, -A) - . . . . y (C, -B) - . . . . . . . . . . . .
Cnl ... Cnn -An Cnl · · · Cnn -Bn
Ello implica necesariamente que la matriz A es singular.
Demostración
a) Las condiciones de primer or den son:
n
Ak + LCkiYi = O j=l
n
Be + ¿c¡ex¡ = o i=l
251
para k = l, 2, ... , n.
para J!,= l, 2, ... , n.
resultau dos sistemas de n ecuaciones con n incógnitas. Si el determinante:
f:. O entonces el sistema es compatible determinada.
Si el juego matricial tiene la propiedad que la suma de los elementos de la matriz n-asociada no es cero, (apartada b, lema 2.1) entonces el sistema tiene solución única. Veamos ahora que el punto estacionaria encontrada es de ensilladura. Evaluemos la matriz hessiana:
o
o Cu
O Cu
O Cn1
Cn1 O
Cnn O
Cnn
o
o
Al ser la matriz hessiana de orden par (2n), para ver que el punto estacionaria encontrada, es de ensilladura es suficiente con ver que el determinante es negativo.
Det 1i = -( det C)( det et) = -( det C) 2 < O. Ya que por hipótesis detC f:. O
El punto de ensilladura encontrada aplicando la regla de Cramer en las condiciones de primer orden y utilizando los resultados obtenidos en el lema 2.1:
O Ín-k+2 xk =
fi+···+ Ín+l y y~ = Cn-k+2
c1 + · · · + Cn+l don de k=l,2, .. .,n+l.
b) Si:
= O y existe i tal que f; f:. O; entonces:
El rango de la matriz ampliada es n (apartada a, lema 2.1), mayor que el rango de la matriz C (que sera n - l) por tanta el sistema es compatible indeterminada, luego no admite solución.
252
c) Si:
=O y f¡ =e¡ =O para i= l, 2, ... , n +l.
Y ademas rang o e = rang o (e, -A) = rang o (et, B), enton ces el sistema es compatible indeterminada y recíprocamente.
Veamos ahora que todo punto estacionaria es de ensilladura, la matriz hessiana es de la forma:
e11 e1j e1n
1i= ( o e ); si en do e= eil e;i e;n et o
en1 eni enn Con r= rango e< n.
Dada la existencia de puntos estacionarios r > O, la matriz hessiana 1i es una forma bilineal simétrica. Veremos que su forma reducida tendra al menos un l y un -1, de lo cua! deduciremos que cualquier punto estacionaria es de ensilladura.
Dado que el signo del determinante de una forma bilineal simétrica es invariante por cambios de base y al ser todos los menares principales de 1i nulos, utilizaremos un cambio de base adecuado que permita asegurar que la forma reducida de la matriz hessiana admite al menos un l y un -l. Usando el teorema de Gundenfinger ([l] pagina 306), consideremos e;j #O, haciendo el cambio de base: e1 por e¡ y e2 por en+j, obtenemos l7i2I = -(eij)2 #O, con l7i1I =O y l7io l # O, luego la forma reducida tendra al menos un l y un -l.
Nota: Para matrices no necesariamente cuadradas la situación del apartada a) no puede darse y haciendo un cambio de base analogo al del apartada c) resulta que todo punto estacionaria es de ensilladura.
Veamos ahora que este caso tan sólo puede darse si A es singular.
Sea A una matriz de orden n + l. Sea Bn la matriz n-asociada de A con f¡ = Cj =O i,j = 1,2, ... ,n+ l. Entonces det A= O.
253
La relación entre los elementos de la matriz n-asociada y los de la matriz adjunta de A es: b;j = An-i+2,n-j+2·
n+l n+l
Ü = f; = Lbij = LAn-i+2,n-j+2 = Ü i=l,2, ... ,n+l. j=l j=l
n+l De -An-i+2,l = LAn-i+2,n-j+2 i= l, 2, ... , n +l deducimos que:
j=2
IAdjAI = O. Dado que A( adjA) = IAI· Id, luego IAdjAI = IAln-l, de ello IAI= o.
Proposición 2.3 UNICIDAD
Si existe un único punto de ensilladura de J{ en IRn x IRn, pertenece a Xn x Yn, si y sólo si, e¡ y f; tienen todos el mismo signo (cero con signo).
Demostrnción
El punto de ensilladura ( xº, yº) tiene por coordenadas:
O _ Ín-k+2 xk - fi+···+ Ín+l'
O Cn-k+2 Yk =
c1 + · · · + Cn+l donde k=l,2, ... ,n+l.
Si to dos los e¡ y f; tienen el mismo signo, es obvio que O :S x? :S l; O :S yf :S l.
n+l n+l F ~ o ~ Jn-i+l l ~X¡ = ~fi +'' '+ Ín+l = ; z=l z=l
Recíprocamente, basta observar que si: n
n+l n+l ¿ O _ ¿ Cn-i+2 _ l
Y; - - . i=l i=l C1 + ... + Cn+l
O :S x? para i= l, ... , n y ¿x? :S l debe suceder que: i=l
sg Un-i+2) = sg (fi + · · · + fn-i+2 + · · · f n+l)
lh + Í3 + " · + J n+i l :S lfi + Í2 + " · + Ín+i l' para i= l, ... , n.
de la desigualdad deducimos sg (!1) = sg (h + · · ·+J n+l). De las n igual dades deducimos sg (!;) = sg (fj) i, j = 2, ... , n + l. De las dos últimas expresiones resulta sg (!;) = sg (h+···+ fn+1) = sg (fi) para i= 2, ... , n +l.
Del mismo modo se obtiene que iodos los e; deben tener el mismo signo; ademas los signos de J¡ y e¡ deben coincidir, al ser los respectivos sumatorios de f; y e¡ iguales a la suma de todos los elementos de la matriz n-asociada de A.
254
Sea A un juego matricial no cuadrado de orden (m+ l)* (n+ l), cuyo campo escalar asociado es:
m n m n
K (x1, x2, ... , Xm, Y1, Y2, ... , Yn) = Ao + LÀïx; + LBiYi + LLC;jXiYj i=l j=l i=lj=l
k=l, ... ,m,C=l, ... n
n+ l) n+l
Teorema 2.4
Todo punto de ensilladura ( xº, yº) de K contenido en Xm x Yn, esta formado por estrategias óptimas y simples, es decir:
K(x,yº)=K(xº,yº)=K(xº,y) VxEXm y VyEYn.
Demostración
m m n
í.l.l(r: K(xº+h,yº)-K(xº,yº)= LÀïh;+ ¿¿c;ih;yJ = i=l i=lj=l
La última igualdad es consecuencia de las condiciones de primer orden. De la misma forma !.l.Ky =O.
Nota: Hemos utilizado la matriz asociada en lugar de la matriz adjunta, dado que ésta la tenemos definida induso para matrices no necesariamente cuadradas, su utilización nos permite ubtener información incluso cuando tratamos con juegos matriciales no cuadrados.
255
3. ESTRATEGIAS ÓPTIMAS SIMPLES
Vamos a caracterizar a las estrategias óptimas simples y obtendremos después una condición necesaria para encontrar las, este último resultado junto con el teorema 2.4 nos permitiran establecer la equivalencia entre las estrategias óptimas simples y los puntos de ensilladura del campo escalar asociado al juego.
Lema 3.1
( x 0, yº) es una estrategia óptima simple del juego, si y sólo si,
Vi E ¿:i K(e¡,yº) = K(xº,yº), Vj E ¿:2 K(xº,ei) = K(xº,yº),
siendo ek = (O, ... , l, ... , O) el l en el lugar k-ésimo.
Demostración
Sólo hay que ver la implicación recíproca, supongamos que K(xº, yº) K(xº, ei) j =l, 2, ... , n +l.
n+l n+l
K(xº,y) x 0Ay = L(xº · C})Yj = (xºA) = LYi(xºA)ej = j=l j=l
n+l n+l
LYi(x0Aej) = LYiK(x0 ,ej) = K(xº,yº) j=l j=l
(Por Cj designamos a la columna j-ésima de la matriz).
Teorema 3.2
Toda estrategia óptima y simple puede obtenerse a partir del calculo de los puntos de ensilladura del campo escalar J( asociado al juego.
Demostración
Sea (xº, yº) una estrategia óptima simple, por el lema anterior xº ser a solución del sistema.de n + l ecuaciones y m + l incógnitas siguiente:
m+l m+l m+l
LªiIXi = Lªi2Xi = · · · = Lªi,n+IXi i=l i=l i=l
m+l
LXj =l j=l
256
y0 sera solución del sistema m+ l ecuaciones y n + l incógnitas siguiente:
n+l n+l n+l
Lª1jYj = Lª2jYj = · · · = Lªm+l,jYj j=l j=l j=l
n+l
LYi =l j=l
Si n =fa m un sistema tiene mas ecuaciones que incógnitas y el otro al revés. Generalmente el sistema no tendra ninguna solución simple.
Despejando Yn+l en la última ecuación y sustituyendo su valor en la cadena de m igualdades, resulta: (igualamos cada una de las n - l ecuaciones con la última).
n+l n+l
LªkjYj - Lªm+ljYj =O j=l j=l
n+l
L(akj - ªm+lj)Yj =O j=l
n
L ( ( akj - ªm+lj) Yj) + ( ªkn+l - ªm+l n+i) j=l
agrupando convenientemente:
n
k=l,2,. . .,m
k=l,2,. . .,m
( l - tYi) =O J =l
k=l,2,. . .,m
L ( ( akj + ªm+l n+l) - ( ªm+lj + akn+l)) Yj = ªm+l n+l - akn+l j=l
e qui valen temen te:
n
¿ckiYi = -Ak k =l, 2, ... , m, j=l
k=l,2,. . .,m
obteniendo uno de los dos sistemas que surgieron al calcular las condiciones de primer orden de la función K, ya sea en el caso matricial cuadrado (m = n) o no.
Analogamente de K(e¡, y) = v para i = l, ... , n +l, obtendríamos el otro sistema.
257
4. CÓMO ENCONTRAR TODAS LAS ESTRATEGIAS ÓPTIMAS DE UN JUEGO A PARTIR DE LOS PUNTOS DE ENSILLADURA DE UN CAMPO ESCALAR ASOCIADO
El objetivo en la presente sección es determinar un método para encontrar todas las soluciones, de un juego bipersonaLde suma cero, calculando puntos de ensilladura de campos escalares asociados.
Definición 4.1
Sea A unjuego matricial cuadrado de orden n+l, no singular. Sea K(x, y) = xAy definida en n:kn x Itkn.
n
Con Xn+l = l - LXi i=l
n
Yn+l = 1- LYi i=l
Denotamos por E(A) el conjunto de puntos de ensilladura de la función J(
contenidos en Xn x Yn,
Teorema 4.2
Sea A una matriz de orden ( n +l) no singular y sea En la matriz n-asociada de A. Una condición necesaria y suficiente para que A tenga una solución simple es que las cantidades f;, Cj i, j = l, 2, ... , n + l tengan el mismo signo. ( considerando que si alguna de los f;, Cj toman el valor cero, entonces se les asigna el signo adecuado). Ademas tal solución simple es:
Demostración
xº = Un+1,Íni···iÍl). n+l
l:t; i=l
vº = ( Cn+l, Cn, · · · , C1) n+l ¿e; i=l
Necesidad. Si A admite una solución simple ( x 0 , vº) en X x Y; es solución del sistema de ecuaciones lineal del lema 3.1 que por el teorema 3.2 tiene las mismas soluciones que el sistema que proporciona los puntos estacionarios de la función K. Luego (xº,vº) es de E(A). Por ser A no singular por el apartada c) del teorema 2.2 E(A) = {(xº, vº)}. Ello sólo es posible si la suma de los elementos de la matriz n-asociada de A es distinta de cero. Por la proposición 2.3 f;, Cj
tienen todos el mismo signo.
258
Suficiencia. Supongamos que f;, Cj sean to dos del mismo signo pero no to dos nulos pues ello implicaría que A sería singular. ( c teorema 2.2). De ello deducimos que:
n+ln+l n+l
E:L)ij =Et; :F o i=lj=l i=l
por el teorema 2.2 apartada a) el sistema que proporciona los puntos estacionarios es compatible determinada. Sea (x, y) tal solución en JRn x JRn, por la proposición 2.3 admitiendo ahora coordenadas nulas, pertenece a Xn x Yn, al ser todos los f;, Cj del mismo signo. Por el teorema 2.4 (x, y) es una solución simple. Ademas usando las relaciones:
n
Xn+l = 1- Ex;; i=l
n
Yn+l = l - LYi obtenemos que: i=l
xº= Un+i,fn,···,fi) =x'; n+l
(cn+1,Cn,···•c1) n+l
= y'
¿¡¡ Ec¡ i=l i=l
siendo única.
Coralaria 4.3
Si una matriz cuadrada no singular admite estrategias óptimas simples, entonces las estrategias óptimas del juego son únicas.
Demostración
Toda solución simple satisface los dos sistemas de ecuaciones lineales del lema 3.1, si A es no singular existe un índice i tal que f¡ :j; O, dado que suponemos que la matriz cuadrada admite soluciones simples deducimos que la suma de los elementos de la matriz asociada es distin to de cero y ademas sg(f;) = sg( e¡) para todo i.
Estamos ya en condiciones de caracterizar las estrategias óptimas extremas para ambos jugadores (y por convexidad todas las estrategias óptimas). El teorema de Shapley-Snow ([2], Teorema 3.15, pag. 146), proporciona un método para encontrar todas las estrategias óptimas extremas a partir de las soluciones simples de submatrices regulares. Este teorema puede reformularse usando los resultados vistos que relacionan soluciones simples y puntos estacionarios del campo escalar asociado a cada submatriz regular B cuyo conjunto E(B) es no vacío.
259
Teorema 4.4
Sea :T un juego matricial de A de dimensiones (m) x (n) cuyo valor v sea distinto de cero. Entonces el conjunto de estrategias óptimas extremas para cada jugador es finito. Una estrategia óptima x0 = (x~, x~, ... , x~) es un punto extremo del conjunto de estrategias óptimas para el primer jugador, y una estrategia óptima y0 = (y~, y~, ... , y~) es unpunto- extremo del conjunto de estrategias del conjunto de estrategias óptimas para el segundo jugador, si y sólo si, A posee una submatriz cuadrada no singular B para la cual (x~, y~) es punto de ensilladura del campo escalar asociado a B contenido en Xn x Yn, en donde x~ es el vector que se obtiene del x 0 eliminando aquellas componentes que correspondan a las fi.las eliminadas al obtener B de A y y~ es el vector que se obtiene del yº eliminando aquellas componentes que correspondan a las columnas eliminadas al obtener B.
Ejemplo 4.5
A=(~;~) 2 o l
A es no singular y el campo escalar asociado a A es:
I<(x1, x2, Y1, Y2) =l+ x1 - x2 + YI - Y2 - 2x1Y1 - X1Y2 - X2Y1 + 4x2Y2
El único punto estacionario de J( es: (3/7, 1/7, 5/7, 3/7) no contenido en X2XY2.
Buscamos ahora submatrices de orden 2 no singulares y no estrictamente determinadas:
B=(~ ~) El campo escalar asociado a B es:
k(x, y) = 2x + 2y - 3xy;
siendo el único punto estacionario (x, y) = (2/3, 2/3) que pertenece a X1 x Y1; v = 4/3. Veamos ahora si es óptima: Es suficiente con ver que
(2/3, O, 1/3)A(O, O, l)t ~ 4/3. ( 4/3, 4/3, 5/3)(0, O, l)t = 5/3.
Yque: (O, l, O)A(2/3, 1/3, o)t::; 4/3. (O, 3,-0)(2/3, 1/3, o)t = l.
Luego el par {(2/3, O, 1/3); (2/3, 1/3, O)} son estrategias óptimas para cada jugador.
260
B=(; ~) El campo escalar asociado a B es:
k(x,y)= l+x+y-2xy;
siendo el único punto estacionario: (x, y) = (1/2, 1/2) que pertenece a X1 x Y1, V = 3/2.
(1/2, o, 1/2)A(o, 1, o)t = (3/2, 1, 3/2)(0, 1, o)t = 1 < 4/3.
Luego el par {(1/2, O, 1/2); (1/2, O, 1/2)} no es óptima.
B=(~ ~) El campo escalar asociado a B es:
k(x, y) = 3x + 2y - 5xy
El único punto estacionario que pertenece a X 1 x Y1 es (2/5, 3/5), v = 6/5.
(O, 2/5, 3/5)A(O, l, O)t = 3/5 < 4/3.
Luego el par {(O, 2/5, 3/5); (2/5, 3/5, O)} no es óptima.
B=(~ ~)
El campo escalar asociado a B es:
k(x, y) = l - x - y + 4xy
El único punto estacionario que pertenece a X 1 x Y1 es (1/4, 1/4), v = 3/4.
(o, 1/4, 3/4)A(l, o, o)t = (6/4,3/4, 3/4)(1, o, o)t
(1, O, O)A(O, 1/4, 3/4)t = (1, 2, 2)(0, 1/4, 3/4)t
3/2 > 4/3.
2 > 4/3.
Luego el par {(2/3, O, 1/3); (2/3, 1/3, O)} no es una estrategia óptima.
261
5. BIBLIOGRAFÍA
[l] Gantmacher, F.R. (1966). Théorie des Matrices. Dunod. París. [2] Jones, A.J. (1980). Game Theory. Mathematical models of confiict.
England. [3] Luce, R.D. and Raiffa, H. (1957). Games and Decisions. New York.
Wiley. [4] Moulin, H. (1979). Fondation de la Théorie des Jeux. París. Hermann. [5] Owen, G. (1982). Game Theory. New York. Academic Press. [6] Von Neumann, J. and Morgeenstern, O. (1944). Theory of Games
and Economic Behavior. Princeton U. Press.
ENGLISH SUMMARY:
OPTIMAL STRATEGIES FOR A TWO-PERSON ZERO SUM GAME AND SADDLE-POINTS OF THE SCALAR FIELD
ASSOCIATED WITH THE GAME
J. Freixas Bosch
In a two-person zero sum game defined in normal form for a m x n matrix A, we may define the mixed extension given by a bilinear function, whose domain is the cartesian product of the corresponding simplexes and is therefore included in m.m+n. The Von Neuman or Minimax theorem [l] establishes the existence of at least a couple of optima! strategies.
In this article we introduce the concep t of the scalar field associated with the matrix game that it is defined in a set included in m.m-l+n-l, since we omit the last component of every corresponding probability vector.
First of all we study the existence and uniqueness of the saddle points of the scalar field associated with a square matrix game, and we obtain the general form of the solution when this is unique. We will prove that in this kind of scalar field any stationary point is a saddle point. This fact will simplify later calculations considerably.
262
The relation between the stationary points and the optimal strategies becomes clear when we prove that in any matrix game there is an equivalence between the stationary points of the scalar field and optimal simple strategies.
The Shapley-Snow theorem [2] provides a systematic procedure to characterize all the optimal strategies just by finding the simple optimal strategies for each ·regular square submatrix, · and from here ·we can find all optimal strategies by forming all convex combinations of the extreme optimal strategies, and obtaining a polyhedric set.
We can obtain all the optimal strategies for a game from stationary points for each scalar field associated with each regular submatrix.
It is important to note that we have used the n-associated matrix instead of the adjoint matrix, since it is also defined for a matrix not square giving in this case information, which we would not have if only the adjoint matrix was use d.
l. INTRODUCTION
First we will define the scalar field associated with a two person zero sum game.
Then we introduce the notation that we will use and we will go over the fundamental concepts which we will use.
2. SADDLE-POINTS OF THE SCALAR FIELD ASSOCIATED
We will relate the concept of saddle-point for a scalar field with the concept of saddle point used in game theory.
We will then demostrate that all simple saddle points of the associated scalar field give simple optimal strategies.
3. SIMPLE OPTIMAL STRATEGIES
We will then demonstrate the opposite implication, which will therefore establish the equivalence of the two concepts.
263
4. HOW TO FIND ALL OPTIMAL STRATEGIES OF A GAME FROM THE SADDLE-POINTS OF THE ASSOCIATED SCALAR FIELD
We will propose a method based on calculations of saddle points of the scalar field which allow us to find all the optimal strategies of the game. It is sufficient to use the equivalence shown in section 3 and to use the Shapley-Snow theorem.
264
SECCIÓ DOCENT I PROBLEMES
La introducció de la nova "SECCIÓ DOCENT I PROBLEMES" a la revista QÜESTIIÓ es fa amb l'objectiu d'incloure·una sec-ció on es pul·liquen articles de caire docent, difícilment publicables en revistes de recerca. Alhora es continua amb l'antiga secció de problemes. A cada número de QÜESTIIÓ s'inclourà d'un a tres problemes i les solucions es donaran en el número següent.
Els lectors poden, si ho volen, proposar problemes amb les solucions pertinents i enviar-los a QÜESTIIÓ, que farà una selecció i en publicarà els més adequats, fent la corresponent referència a l'autor.
També seran ben rebudes solucions alternatives a les propostes fetes per l'autor dels problemes; l'editorial es reservarà, però, el dret a publicar-les.
PROBLEMES PROPOSATS
PROBLEMA Nº 49
Sea X una variable aleatoria que sólo toma valores positivos y tiene distribución absolutamente continua con densidad de probabilidad p(x). Dado un f3 > O cualquiera, sea
r ,6 = inf p( x) xE(0,,6)
Supongamos que O"; = var (X) existe y es finita. Se pide:
l) Comprobar que si X sigue la distribución uniforme en (O, /3) entonces
2) Probar que para cualquier otra variable aleatoria X se cumple la desigualdad
C.M. Cuadras
Universitat de Barcelona
PROBLEMA Nº 50
Sea X un vector aleatorio (3 x l) distribuido según una normal trivariante tal que:
E (X) ~O, cov (X) ~ ( :'.: ::: :n Calcular la probabilidad '.P (X1 2 O, X2 2 O, X3 2 O).
J. M. Oller
Universitat de Barcelona
267
.. LES CORRECCIONS DE CONTINUITAT EN DISTRIBUCIONS BINOMIAL I POISSON, I LA CORRECCIÓ DE YATES EN EL TEST
KHI-QUADRAT EN TAULES DE CONTINGÈNCIA 2x2
M.S. NIKULIN* C.M. CUADRASt
Aquest article desenvolupa i comenta diverses correccions de continuïtat a les aproximacions normal i khi-quadrat d'algunes distribucions discretes.
INTRODUCCIÓ
La correcció de continuïtat en les aproximacions a les distribucions binomial, Poisson i khi-quadrat relacionada amb les taules de contingència 2 x 2, és un tema sovint no ben conegut per professors, usuaris i estudiants d'estadística. Per exemple, la correcció de continuïtat de Yates tendeix a donar un estadístic khiquadrat baix i aleshores el test és conservador (tendència a acceptar la hipòtesi nul·la tot i no sent certa).
En aquest article es proporciona una justificació de la correcció de continuïtat en les distribucions esmentades, que és il·lustrada amb exemples.
l. CORRECCIÓ DE CONTINUÏTAT PER A LA DISTRIBUCIÓ BINOMIAL
Sigui v una variable aleatòria i considerem la hipòtesi Ho afirmant que v segueix una distribució binomial B(n,p) amb paràmetres n i p, (O < p < l). Aleshores sota H 0 tenim
*M.S. Nikulin. Mathematiques Stochastiques, Universite Bordeaux 2, France. Steklov Mathematical Institute, St.Petersburg, Russia.
t C.M. Cuadras. Departament d'Estadística. Universitat de Barcelona. Diagonal, 645. 08028, Barcelona.
269
Ev = np i Var v = np(l - p).
Com és ben sabut, pel teorema de Laplace-de Moivre tenim
(1) { v- np } lim P ' ~ xlHo = <I>(x),
n-+oo Jnp(l - p)
on <I> és la distribució normal N(O,l). És a dir, sota Ho la variable aleatòria v és asimptòticament normal amb paràmetres np i np(l - p). A més, el teorema Laplace-de Moivre ens diu que per a qualsevol p, O < p < l, essent n ---"* oo
(2) (
X - np + C ) ( l ) P{v:::; xlHo} =<I> +O e , Jnp(l - p) yn
on e és un número real que sovint és O. En la pràctica estadística hom agafa e igual a 0.5 i aleshores es parla de la correcció de continuïtat. És fàcil justificar l'elecció de c = 0.5 tenint en compte que la variable aleatòria n - v segueix la distribució binomial B(n, l - p), i atès que per a qualsevol x =O, l, ... , n
P{v:::; x} + P{v 2: x +l}= l
tenim P{v:::; x} + P{n - v:::; n - x - l}= l.
Aleshores de (2) obtenim que per n ---"* oo
(3) <I>(x-np+c) ( x-np+(l-c)) l o( l) Jnp(l - p) +<I> - Jnp(l - p) = + fa ·
Però sabem que (4) <I>(z) + <I>(-z) = l, z E m?.;
llavors, si e = 0.5, la suma a (3) val exactament l. Així, amb la correcció de continuïtat c = 0.5, de (2) tenim que per a n---"* oo
(5) P{v:::; mlHo} <I> (m-np+0.5) +o (-1) Jnp(l - p) fa '
P{v 2: MJHo} 1- P{v:::; M - lJHo} =
(6) <I> ( M - 0.5 - np) O ( l ) - Jnp(l - p) + fa .
270
on O < m, M :S n. De (5) i (6) se segueix que si volem tenir un criteri estadístic per contrastar el test d'hipòtesi Ho amb nivell de significació~ a (O< a< 0.5), aleshores cal rebutjar Ho si
(7) q> (v+0.5-np) < ~ ó Jnp(l - p) - 2
q> - < -( v - 0.5 - np) a Jnp(l - p) - 2'
on vés l'observació de la variable. Això significa que rebutgem Ho si es presenta un dels dos esdeveniments:
(8) v-np
< w (~) - l 2 2Jnp(l - p)' Jnp(l - p)
- w ( ~) + -;==;=l ==;:: 2 2Jnp(l - p)'
v-np > (9)
Jnp(l - p)
essent w(x) la funció inversa de <I>(x). De (8),(9) tenim que Ho ha d'esser rebutjada si
(10) X 2 _(v-np) .T,1
a l 2 [ l 2 - > 'i' -- + ,
n np(l-p)- ( 2) 2Jnp(l-p)
perquè w(z) + w(l - z) ::::: O, z E (O, l), on x; segueix asimptòticament la distribució khi-quadrat de Pearson amb un grau de llibertat. Així si escollim el valor crític
(11)
obtenim un criteri khi-quadrat per contrastar Ho amb un nivell aproximat de significació a. El segon terme que hi ha dins (11) és aleshores l'anomenada correcció de Yates, que és una conseqüència natural d'introduir la correcció de continuïtat a (5). Cal remarcar aquí que sovint a la literatura estadística la correcció de continuïtat de Yates és utilitzada incorrectament.
Exemple l
Suposem que tenim un generador de nombres aleatoris x 1 , x 2 , ... , Xn, •.• que són considerats (hipòtesi H 0 ) com a realitzacions de variables aleatòries independents X1, X2, ... , Xn, ... , amb distribució uniforme discreta sobre el conjunt S= {O, l, 2, ... , 9}, és a dir,
(12) P{X1 = ijHo} =O.l, i E S.
271
Ara suposem que tenim una mostraX = (Xi, X2, ... , Xn)T de grandària n=lOOOO, produïda per l'esmentat generador aleatori, i volem contrastar H 0 si la mostra X és acceptable, enfront de l'alternativa que no és acceptable com a provinent d'una distribució uniforme discreta (12). Si a la mostra els nombres x; no excedint 4 foren observats només 4901 vegades, a quin nivell de significació hem de rebutjar H 0 ?
Solució
Sigui µn = freq {X; ::; 4}. De les observacions tenim que
µn = 4901 = 0.490l n 10000 '
que és bastant pròxim a 0.5. Consegüentment, si la nostra suposició (hipòtesi H 0 ) és correcte aleshores µn té una distribució binomial B(n, p) amb paràmetres n = 10000, p = 0.5, i, sota H 0 ,
(13) Eµn = np = 5000 Var µn = np(l - p) = 2500.
Així, per a qualsevol x = l, 2, ... , pel teorema de Laplace-de Moivre tenim que (amb la correcció de continuïtat 0.5)
P{lµn - np¡ ::; xlH o} P { % - x::; µn ::; % + x} ~ ~<I> (0.5n + x + 0.5 - 0.5n) _<I> (0.5n - x - 0.5 - 0.5n)
vn . 0.5 . 0.5 vn . 0.5. 0.5
(14) = 2<1> (2~ l) - l.
Sigui a el nivell de significació, O < a < 0.5, del test amb regió crítica
(15)
En aquest cas, a un donat valor crític x correspon el nivell de significació
(16) (n = 10000)
com es dedueix de (14). En particular, si x = 98, aleshores tenim
(2x98+1)
(Y ~ 2 - 2<1> fa - l = 2 - 2<1>(1.97) = 0.049.
272
Fent ara inferència estadística, d'acord amb el test estadístic basat en la regió crítica
Kgs = {lµn - 50001 > 98},
la hipòtesi H 0 és rebutjada amb un nivell de significació a~ 0.05.
Considerem ara una situació diferent. Suposem que µn = freq { Xi :S 4} = 4999. Aleshores
µn = 4999 = O 4999 n 10000 ·
que és molt pròxim a 0.5, tan pròxim que aquest generador és "sospitós". Seguint Rao (1989), que ens diu que un ajust molt bo entre observacions i teoria postulada pot ser indici de manipulació (R. A. Fisher va concloure això amb els experiments de G. Mendel), considerem la regió crítica
Ara tenim que a cada x correspon un nivell de significació
(n = 10000).
Si x = l tenim, anàlogament
a ~ 2<1> ( Jn) - l = 2<1>(0.03) - l = 0.024.
Fent inferència estadística basada en la regió crítica
K~ = {lµn - 50001 :S l}.
La hipòtesi Ho és rebutjada amb un nivell de significació a~ 0.025.
N o tem la diferència entre les dues regions Kx, K~. La primera serveix per rebutjar Ho perquè és massa lluny del resultat esperat. La segona serveix també per rebutjar H 0 , però ara per ser-hi massa a prop. També succeeix en ciències experimentals l'anomenat "falsament de segon ordre", que consisteix a obtenir estadístics khi-quadrat que indiquin ser ni massa a prop ni massa lluny del model postulat. Però hi ha tests estadístics que permeten detectar aquest falsament (Rao, 1989, p. 48).
Per a més detalls sobre la correcció de continuïtat hom pot veure, per exemple, Cox (1970), Mantel (1976), Mantel i Greenhouse (1968), Bolshev i Smirnov (1968), Martín i Luna (1990), Huber i Nikulin (1991).
273
2. CORRECCIÓ DE CONTINUÏTAT PER A LA DISTRIBUCIÓ DE POISSON
Sigui í'm una variable aleatòria gamma amb m graus de llibertat, és a dir, podem escriure per a qualsevol À > O:
(17)
Per tant tenim
Àm
P{í'm ~ À} + r(m +l) e->.=
(18) P{í'm ~ À} + P{Z = ml.À},
on Z és una variable aleatòria que segueix una distribució de Poisson amb paràmetre .À:
Àm P{Z = ml.À} = -
1 e->., m= O, 1,2, ...
m.
Així hem provat que per a qualsevol m= O, l, 2, ...
(19) m Àk
P{Z ::=; ml.À} =l: k! e->.= P{í'm+l ~ À}. k=O
D'altra banda és ben conegut que
(20) 2/m = X~m> i per tant de (19) i (20) se segueix que
(21) P{Z:::; ml.À} = Phm+l ~ À} = P{x~m+2 ~ 2.À}.
Aquesta fórmula ens mostra les relacions existents entre les distribucions Poisson, gamma i khi-quadrat.
Recordem ara que la mitjana i variància de la variable aleatòria x; són
Ex~ = n i Var X~ = 2n.
274
Pel teorema central del límit tenim que per a valors grans de n
(22)
així és que per a n ---+ oo
(23) 2 . {x-n} . (l) P{xn:::; x} =q> ffn +O Vn .
Una altra aproximació normal per a la distribució khi-quadrat fou proposada per R. A. Fisher, segons la qual per a valors grans de n
(24) P{ y'2XI- ~:::; x} = q>(x)+O (Jn). A fi de provar (24) notem que
(25)
2x~ - 2n+ l
~+v'2n-1
~ (x~ - n - 0.5) v2n
l ( ~ + J1- l). 2 V fïXn 2n
Si n ---+ oo, aleshores
(26) l 2 ) -xn ---+ l (en probabilitat , n
¡:---1 ___.. l y1-c¡;;,
i així de (22),(25),(26) i el teorema de Slutsky es dedueix que per a qualsevol x fixat tenim (si n---+ oo) que efectivament
P { y'2XI - v'2n - l:::; x} = q)(x) +O ( Jn) . Fent ús d'aquestes relacions asimptòtiques aconseguim una altra aproximació normal amb la correcció de continuïtat.
Suposem que.\ és gran. Aleshores de (21) obtenim
P{x~m+2 2: 2.\} = l - P{x~m+ 2 :::; 2.\} =
l _ P { X~m+2 - (2m + 2) < 2.\ - 2m - 2} = v' 4m + 4 - v' 4m + 4
1- q> = (.\-m-1) v'm+ l
(27) q>(m+l-.\)· v'm+ l
275
És interessant de notar que si fem ús de l'aproximació de Fisher (24) aleshores tindrem
P{Z :S ml,\} P{x~m+2 2: 2,\} = 1- P{x~m+2 :S 2,\} = ~ l - <I> (V.U - v' 4m + 3) = <I> ( v' 4m + 3 - V.U) =
(28) <I> (J4(m + 0.5) +l - 2v'>:) .
El nombre 0.5 a (28) pot ésser considerat com la correcció de continuïtat de l'aproximació normal per a la distribució de Poisson. Aquesta fórmula implica que per a grans valors de ,\ (,\ 2: 25) l'estadístic
segueix aproximadament la distribució normal N(0,1). Aquesta aproximació és molt útil a la pràctica per contrastar la hipòtesi H 0 que diu que els elements Z; de la mostra ;z, = (Z1 , ... , Zn)T segueixen la mateixa distribució de Poisson amb paràmetre À, quan tot Z; és gran.
D'altra banda, com que la mitjana i la variància de la Poisson és À, és fàcil obtenir, si ,\ és gran, una altra aproximació normal estàndard de la distribució de Poisson,
(29) (m-À+0.5) P{Z :S ml,\}:= <I> V,\ .
Exemple 2
Un comptador assimilat a un procés de Poisson registra 150 pulsacions durant la primera hora, 117 pulsacions durant la segona hora. Podem suposar que la ràtio de pulsacions per unitat de temps és constant (hipòtesi H 0 )?
Si H 0 és certa, els valors observats 150 i 117 poden ésser interpretats com a realitzacions de dues variables aleatòries independents Z1 i Z2 seguint la mateixa distribució de Poisson amb paràmetre À, on el valor de ,\ és desconegut. Com que H o implica que les variables aleatòries
estan aproximadament distribuïdes segons la llei N(0,1) i són independents, perquè Z1 i Z2 ho són. Per tant si la hipòtesi H 0 és certa, aleshores, com que (Y1 - Y2)/../2 és aproximadament N(0,1),
(30)
276
està aproximadament distribuït segons la llei khi-quadrat amb un grau de llibertat, és a dir,
P{X2;::: xJHo} ~ P{xi 2: x}.
Les taules de la distribució khi-quadrat proporcionen el valor crític
Ca = Xi O 05 = 3.841 '.
pel nivell de significació a = 0.05, és a dir
P{xi 2: 3.841} = 0.05.
Ara, fent ús dels valors observats Z1 =150 i Z2 = 117, podem calcular el valor X 2 de l'estadístic (30) de contrast:
(31) X 2 = 0.5 (v4 x 150 + 3 - v4 x 117 + 3)2
= 4.071.
Com que X 2 = 4.071 > Ca = Xi o 05 = 3.841, '.
concloem que la H 0 (ràtio de pulsació constant) ha de ser rebutjada pel test khi-quadrat al nivell de significació a = 0.05.
3. SOBRE LA CORRECCIÓ DE CONTINUÏTAT EN TAULES 2x2
Seguint Bolshev i Smirnov (1968), considerem un exemple de Cramer (1946, p.444-445.), vegeu també Fleiss (1981). Suposem (la hipòtesi Ho) que N elements són dividits aleatòriament en dos grups de n i N - n elements i suposem que en el conjunt total dels N elements n'hi ha M posseint alguna propietat Y, i els restants elements no la tenen. La divisió resultant pot ser expressada en la forma d'una taula 2 x 2 , on µ és el nombre d'elements amb la propietat Y, pertanyent al primer grup:
l 11 amb la prop. y l sense la prop. y l total l
Mostra del lr grup µ n-µ n
Mostra del 2n grup M-µ N-n-M+µ N-n
Total M N-M N
277
Si la divisió dels elements en els dos grups és realment aleatòria i no depèn de la possessió de la propietat Y, en altres paraules, si H 0 és certa
nM . nM(N - n)(N - M) (32) Eµ= E{µJH 0 } = N i Varµ= Var {µJHo} = N 2(N _l) ·
Si N és suficientment gran i cap dels n, M, N - n, N - M són gaire petits, aleshores, sota H 0 , la variable normalitzada
(33) µ-Eµ .¡v¡;.rµ,
és aproximadament normal N(0,1), i sota Ho per a N gran el quadrat de la variable normalitzada
(34) X2=(µ-Eµ)2
Varµ
està distribuïda aproximadament com una xi. L'estadístic X 2 és sovint utilitzat com un criteri per contrastar la hipòtesi H 0 que diu que els N elements estan dividits aleatòriament en clos grups. Per a N petit està recomanat que, en lloc de X 2
' s'utilitzi l'estadístic
(35) z2 =(1x1- 1 )
2
2JVar µ
i seguir la regla següent:
si P(Z 2; l)~ a, aleshores rebutgem la hipòtesi H 0 ;
si P(Z2; l) 2:: a, aleshores hom pot concloure que els valors observats no
contradiuen la hipòtesi H0 , essent P(x; l)= P{xi 2:: x}.
A la fórmula (34) el terme l
2.jVar µ
és l'anomenada correcció de continuïtat per l'aproximació a la funció de distribució P(x; l).
Hi ha taules de valors crítics exactes de l'estadístic M - µ(criteri de Fisher) per a n = 3(1)20 i N - n = 2(1)n (vegeu Pearson i Hartley (1956)), Latscha (1953)). Si N 2:: 20 aleshores la regió crítica dels tests unilaterals aproximats estan definits (amb l'òbvia correcció de continuïtat) per les desigualtats (O < a< 0.5):
µ-Eµ ( ª) l > W 1-- + JVar µ 2 2JVar µ
(36) µ-Eµ
< -W ( 1 - ~) - 2J~ar µ' .¡v¡;.rµ,
278
on w(x) = <1>- 1 (x). Aquesta correcció difereix de la correcció de continuïtat proposada per Yates (1934), que no hauria d'esser utilitzada.
De (35) se segueix que la regió crítica del test bilateral aproximat amb nivell de significació a ve donada per la desigualtat
(37) x2 = (µ - Eµ)2 > [w (l - ~) + l J 2 Var µ - 2 2,,¡va_rµ
Ara podem veure que les fórmules aproximades per valors crítics del test exacte de Fisher, basat en (36), ens porten a resultats que són diferents dels basats en la fórmula (34). De fet, segons (34) l'estadístic Z 2 està distribuït (sota Ho) aproximadament com xi, i de (36) segueix que X 2 està distribuïda (sota H 0 )
com
(ç+2~)2, on Ç és la variable aleatòria N(0,1). En altres paraules, l'estadístic X 2 està distribuït (sota H 0 ) aproximadament segons la llei khi-quadrat no central xi(>.) amb paràmetre de no-centralitat,\= (4Var µ)- 1 . Si
V _ nM(N - n)(N - m) --+
ar µ - N2(N - l) oo
quan n--+ oo, aleshores les distribucions de X 2 i Z 2 són asimptòticament iguals.
Més detalls sobre la correcció de continuïtat de Yates es poden trobar a Cochran (1942), (1952), Conover (1974), Mantel (1974), Martin i Luna (1990), Mirvaliev i Nikulin (1992), Nikulin i Greenwood (1990), Plackett (1964), Yates (1934).
AGRAIMENTS
El primer autor està molt agraït als Professors S. Kotz (USA), A. l. Dale (South Africa) i T. Smith (Canada) per les observacions tan útils i l'encoratjament que li han proporcionat durant la preparació d'aquest article.
279
REFERENCIES
[l) Bolshev, L.N. and Smirnov, N.V. (1968). Tables of Mathematical Statistics. Nauka, Moscow.
[2) Cochran, W.G. (1942). "The 2x2 correction for continuity". Iowa State College Journal of Science, 16, 421-436.
[3) Cochran, W.G. (1952). "The x2 test of goodness of fit". Annals of M athematical Statistics, 23, 315-345.
[4] Conower, W.J. (1974). "Some reasons for not using the Yates continuity correction on 2x2 contingency tables". JASA, 69, 374-376.
[5) Cox, D.R. (1970). "The continuity correction". Biometrika, 57, 217-219.
[6] Cramer, H. (1946). Mathematical Methods in Statistics. Princeton Univ. Press, Princeton, NJ.
[7) Fleiss, J.L. (1981). Statistical Methods for Rates and Proportions. Wiley & Sons, New-York.
[8) Haber, M. (1980). "A comparison of some continuity corrections for the khi-quadrat test on 2x2 tables". JASA, 75, #371, 510-515.
[9] Huber, C. and Nikulin, M. (1991). Transformations des variables aléatoires. Application au eh o ix et à la réduction d'un model statistique. Le Rapport technique du Laboratoire de la Statistique médicale, l'Université Paris 5, 220p.
[10] Latscha, R. (1953). "Significance test in 2x2 contingency table". Biometrika, 40, 74-86.
[11] Mantel, N. (1974). "Some reasons for not using the Yates continuity correction on 2x2 contingency tables - Comment and suggestion". JASA, 69, 378-380.
[12] Mantel, N. (1976). "The continuity correction". The American Statistician, 30, 103-104.
[13] Mantel, N. and Greenhouse S.W. (1968). "What is the continuity correction?". The American Statistician, 22, #5, 27-30.
[14) Martín, A. y Luna, J. de D. (1990). Bioestadística para las Ciencias de la Salud. Ed. Norma, Madrid. Tercera edició.
[15] Mirvaliev M. and Nikulin M. (1992). "Goodness-of-fit tests of the chi-square type". Industrial Laboratory (Plenum Publishing Corporation), pp. 280-291.
[16] Nikulin M. and Greenwood P.E. (1990). "A Guide to Chi-Square Testing". Technical report #94, Department of Statistics, University of British Columbia, Vancouver, Canada.
[17) Nikulin M. (1991). Some recent results on chi-squared tests. Queen's papers in Pure and Applied Mathematics, #86, Queen's University, Kingston, Canada.
280
[18] Pearson, E.S. and Hartley, H.O. (1958). Biometric Tables for Statisticians. Vol. l. Cambridge University Press.
[19] Plackett, R.L. (1964). "The continuity correction in 2x2 tables". Biometrika, 51, 139-167.
[20] Rao, C.R. (1989). Statistics and Truth. Int. Co -op Pub. House, Fairland, Maryland.
[21] Yates, F. (1934). "Contingency tables involving small numbers and the x2 test". JRSS, Ser.B, Suppl.1, 217-235.
281
SOLUCIONS ALS PROBLEMES PROPOSATS AL VOLUM 17. Nº l
PROBLEMA Nº 47
l) La curva de regresión m(x) de Y = cY + d sobre X = aX + b, conocida m( x) y suponiendo a f= O, es
m(x) E (YJX = x) =E (cY + d/X = x)
cE (YfaX+b=x)+d=cE (YfX=x~b)+d cm((x- b)/a) + d
2) Dadas las distribuciones bivariantes H 0 , H1 con curvas de regresión mo(x), m 1(x) y las mismas marginales univariantes F, G, consideremos la siguiente distribución bivariante mixtura de Ho, Hi
Enton ces
H>.(x, y) = >.H1(x, y) +(l - >.)Ho(x, y) o ::; >. ::; l.
H>.(x, oo) H>.(oo, y)
>.F(x) + (1- >.)F(x) = F(x) >.G(y) + (1- >.)G(y) = G(y)
luego H>. tiene las mismas marginales F, G. La curva de regresión de la media m>.(x) para H>. existe y es
E>. (Y/X = x) = >. E1 (Y/X = x) + (1- >.) E0 (Y/X = x)
>.m1 (x) +(l - >.)mo(x), O::;>.::; l,
donde E>. indica esperanza matematica con respecto a H>..
3) El cambio de variables
U= F(X), V= G(Y),
siendo F(t) = G(t) = 1-e-t, t> O, transforma Xe Y en variables aleatorias uniformes sobre el intervalo (0,1 ). Sea C( u, v) la distribución bivariante de (U, V). Entonces la cur:va m( x) = E (Y / X = x) puede expresarse
283
(1)
pues Y = c- 1 (V), [U= u]= [X = x], siendo u= F(x).
Sea ahora O < a < l. Entonces
Considerando el suceso A = [U ~ a] de probabilidad P(A) = a se sabe que
l u ego
1 c- 1(v) dC( u, v) = 1ª 11
c- 1(v) dC( u, v) =a E [G- 1(V)/U ~a]
es decir
Por otra parte, para O< G(y) ~ a se tiene
P [G- 1 (V) ~ y/U ~a] = [V~ G(y)/U ~a]= C(a, G(y)) fa~ C (l, G(y)) = a
(2)
(3)
= G(y) = P[U ~ G(y)/U ~a]= a
= P [G- 1(U) ~ y/U ~a].
Esta desigualdad indica que c-1(V), condicionada a [U ~ a], es estadísticamente mas grande que c-1(U) condicionada a [U ~ a], luego el valor esperada sera mayor
E [G- 1(V)/U ~a]~ E [G- 1 (U)/U ~a] = r c-i(u) du } 0 a
Combinando (1) y (2) podemos simplificar a, resultando
1ªm (F- 1(u)) du~ 1ª a- 1(u)du
284
(4)
Como F- 1(u) = -Iog(l - u), O< u< l, calculando la integral de la derecha tenemos finalmente la desigualdad
foª m [- Iog(l - u)] du~ (1- a) log(l - a)+ a.
4) Es evidente que y = x es una posible curva de regresión de la media, cuya representación gra.fica junta con y = m( x) se ilustra en la siguiente figura
y y =x
y = m(x)
o x
Como F= G, el cambio u= G(x) convierte (3) en
1/3 m(x) dF(x) ~ 1/3 xdG(x)
siendo /3 = F(a), dF(x) = dG(x) = e-xdx. La desigualdad (4) puede interpretarse en el sentida de que el promedio de X (que aquí es variable aleatoria exponencial), desde O hasta /3, no puede ser mayor que el promedio de m(X) desde O hasta /3. Según la figura, esto es obvio para cualquier /3 < xo, siendo xo = m( xo), pues se tiene m( x) ~ x si x ::; xo.
285
Carles M. Cuadras Universitat de Barcelona
PROBLEMA Nº 48
Veamos que la función característica de U1 corresponde a una N(O, l):
<Pu1(t) EeitUi =E (E(eitUi /Z = z)) =E (<Px1¡..Ji+z2(t)<Pzx2Ni+z 2(t)) =
E(<Px1 (~) <Px2 (h))= E (exp (- 2(1 ~ z2)) exp ( 2(;~
2
z2))) =
E ( exp (-t: ) ) = exp (_t:) . Un calculo similar conduce a la distribución de U2 • Los argumentos utilizados pueden extenderse al caso de cualquier ley estable. De hecho, si X1,X2,X3 se distribuyen según leyes estables independientes con función característica <f;(t) = exp (-ltlª), con O< a::; 2, y Z es una variable aleatoria arbitraria, las nuevas variables:
X1 +IZIX2
(l+ IZlª) 11ª
X1 + IZIX2 + IZIª X3
(l+ IZIª + ¡z¡2a)1/a
son de nuevo leyes estables con exponente a.
286
J osé M~ Sarabia Universidad de Cantabria
COMENTARI DE LLIBRE
Michael J. Greenacre.
CORRESPONDENCE ANALYSIS IN PRACTICE
Academic Press, London, 1993, XI + 195pp + 89 tablas y graficos.
La obra de M. Greenacre es una traslación, al campo aplicada y practico, de cómo interpretar tablas de frecuencias, en especial las tablas de contingencia. A lo largo de sus 20 capítulos, se enseñan las posibilidades del Analisis de Correspondencias, que ha pasado de ser un "método multivariante casi ignorada" (como lamentaba M.O. Hill), a un método plenamente aceptado a partir de la década de los ochenta. Artífice de esta popularidad es la obra THEORY AND APPLICATION OF CORRESPONDENCE ANALYSIS, Academic Press, 1984, del mismo autor, que ayudó en gran manera a extender el método en el algo reacio pública anglosajón.
CORRESPONDENCE ANALYSIS EN PRACTICE esta orientada al usuario, en un formato que dista del usual. El énfasis no esta en las fórmulas (que hay pocas, la mayoría en un apéndice), sino en los conceptos, graficos, aplicaciones e interpretación, primandose la intuición sobre la formulación. En un lenguaje muy clara, cada capítula empieza con unos OBJETIVES y termina con un SUMMARY. Entre ambos se encuentran las definiciones, conceptos, tablas e interpretaciones. Al margen del texto se pueden leer anotaciones (Transforming the coordina tes before plotting, Contributions to total inertia, son dos ejemplos) que ayudan mucho a la comprensión del mismo.
Los 20 capítulos o "módulos", de extensión parecida, contienen cada uno un material con un contenido coherente y homogéneo. El autor sugiere que cada módulo se puede enseñar en 20 ó 30 minutos, por lo que el libra es apropiada para un curso de entre 10 y 20 horas. La única experiencia docente que conocemos (el libra acaba de ser publicada) tuvo lugar en la Universitat Pompeu Fabra (Barcelona) y el resultada fue muy positivo.
Ademas del analisis de correspondencias, tema principal, atros temas relacionados cubiertos por el libra son: representaciones graficas, escalas y clistancias, perfiles de una tabla de frecuencias, descomposición de la inercia, represen-
287
tación de la distanciaji-cuadrado, reducción de la dimensionalidad, escalamiento óptimo, contribución de filas y columnas de una tabla, biplots, "clustering" de filas y columnas (una interesante novedad del libro). Algunos módulos estan dedicados a ejemplos y aspectos suplementarios.
A partir del módulo 15, el libro trata de las correspondencias múltiples (MCA) y sus diferentes versiones (joint,correspondence analysis, adjusted MCA y analisis simple de la matriz de indicadores). El penúltima módulo se dedica a representar clasificaciones según una escala cualitativa (mediante desdoblamiento de la escala) de gran interés para el analisis de preferencias. El módulo 20 y último trata de la estabilidad de los graficos ( ejes significativos y regiones confidenciales). Tres apéndices, sobre bibliografia comentada, los fundamentos teóricos (con énfasis en la descomposición singular de una matriz) y un estudio comparada de software para analisis de correspondencia completan el libro. Este se apoya en el programa SimCa2, del propio autor, cuyas características se describen en la sección Novetats de Software de este mismo número.
El libro puede ser comprendido partiendo de una base estadística mínima. Por su orientación practica, excelente sentida didactico, sencillez de exposición y numerosos ejemplos ( especialmente sociología y marketing), es un libro totalmente recomendable a estudiantes de Estadística en general, de cualquier procedencia y a usuarios de todas las disciplinas científicas y técnicas que tengan que interpretar y manejar datos.
288
C.M. Cuadras Universitat de Barcelona
NOVETATS DE SOFTWARE
La introducció de la nova secció de "NOVETATS DE SOFTWARE" a la revista QÜESTIIÓ es fa amb la finalitat de promoure l'intercanvi d'informació relacionada amb programes d'ordinador disponibles, destinats a l'implementació de metodologia estadística, d'informàtica o d'investigació operativa.
A causa de l'important creixement que ha experimentat darrerament la utilització dels ordinadors a totes les àrees científiques i técniques i, a les esmentades més amunt, en particular, hi ha un bon nombre d'investigadors que han desenvolupat un software propi, l'existència del qual és desconeguda, de vegades, per a molts lectors que el podríeu aprofitar. Per això, creiem que és convenient i útil fer-lo conèixer mitjançant aquesta revista, amb el benentés que només actuaria com a mitjà de difusió.
Per tal d'uniformitzar la descripció del software, adjuntem una butlleta que ha de ser omplenacla i tramesa a l'editorial de QÜESTIIÓ.
Amb tota certesa, la vostra col.laboració serà d'utilitat per a molts lectors als qui facilitarà el treball i que, alhora, podràn ajudar els autors del programes suggerint-los possibles millores.
Nom del programa: SimCA2.
Area/ àrees d'aplicació (Estadística, Sistemes, etc.): Estadística, Analisis de Correspondencias.
Descripció del software:
• Llenguatge: Turbo/Basic.
• Ordinador/s: IBM PC y compatibles.
• Sistema operatiu: DOS.
Està disponible en els suports següents:
l Floppy l disk/ diskette. Assenyaleu:
Mida: 3.5 Densitat: DD una dues cares
Cinta magnètica. Assenyaleu:
Mida Densitat Codi
Distribuït per: Greenacre Research.
Configuració mínima de hardware requerida:
256K libres de memoria. IBM Color/Graphics Card (o compatible). También monocolor compatible.
Requereix l'ensinistrament de l'usuari: No. Esta disponible un tutorial escrito en BASIC.
Documentació SimCA2 User's Manual, Greenacre Research, Irene, South Africa, (36 paginas).
Llistat, font disponible: No.
Grau de desenvolupament: Producto acabado y verificado.
Es fa servir aquest software normalment? Si.
En cas afirmatiu
des de quan? 1987.
a quants llocs? diversas universidades y empresas.
L'autor d'aquest software està disponible per atendre les preguntes dels usuaris? Si.
Descripció del que fa l'esmentat software: (200 paraules aproximadament).
Correspondence Analysis, Analyse des Correspondances o Analisis de Correspondencias, es una técnica de analisis exploratorio de datos que representa graficamente filas y columnas de una tabla rectangular de frecuencias.
SimCA2 analiza una matriz.rectangular de.da.tos no.negativos, p:r.oporcionada por el usuario en ASCII, dando representaciones graficas de filas y columnas. Si el analisis se completa con éxito, hay varias posiblidades interactivas (proyección de filas o columnas, diferentes estandarizaciones, etc.) para explorar los resultados sin reiniciar el batch. El output es extenso y puede ser presentada sobre pantalla, impresora o un fichero especificada por el usuario.
SimCA2 viene adjuntada con ejemplos de datos reales. El usuario ¡mede acceder a una introducción, trabajar interactivamente o hacer carrer directamente el programa si el fichero ASCII esta debidamente preparada. Diversos Helps ayudan en todo momento. Toda la información esta en inglés.
La utilización se complementa perfectamente con el libra:
Michael J. Greenacre CORRESPONDENCE ANALYSIS IN PRACTICE Academic Press, London, 1993 ISBN 0-12-299052-8
Posibles usuaris: Cualquier usuario de estadística.
Camps d'interès: Estadística, Biología, Medicina, Economía, Marketing, Química, etc.
Nom de l'autor/s: Michael Greenacre.
Institució: University of South Africa.
Adreça: P.0. Box 567 Irene 1675 South Africa
Número de telèfon: 27 12 4296887 Fax: 27 12 4293221
E-mail: greenmj©risc1.unisa.ac.za
RESUMS EN ANGLÈS
JÚLIA VOLAUFOV A
Minque of variance components in replicated and multivariate linear model with linear restrictions.
The Mínimum Norm Quadratic Unbiased Invariant Estimator of the estimable linear function of the unknown variance-covariance component parameter ¡'} in the linear model with given linear restrictions of the type R'l'J = e is derived in two special structures: replicated and growth-curve model.
MARIANO RUIZ ESPEJO
New estimators of the variance in finite populations.
We obtain an expression of the finite population variance as a function of the relati ve sizes, variances and means of the strata or clusters in to which the population can be divided. We can thus develop severa! non-negative ancl consistent estimators of the population variance in stratified sampling and cluster sampling with or without subsampling. In each case, the estimators of the population variance are unbiasecl or conservative (in the sense of Wolter, 1985). In aclclition two new controls of the estimation of the population mean are derivecl following Ruiz (1987). Finally, we compare the variance estimator of the intermediate strategies given by Ruiz ancl Santos (1989) with the classical ranclom group estimator (Wolter, 1985). The first turns out to be asymptotically more precise if the size n of each independent partia! sample increases sufficiently, when the population size N is very large.
M~ DEL CARMEN PARDO
A test for normality based on the information energy.
In this paper a test for normality based on the Information Energy is cleveloped following Vasick (1976), based on the Shannon Entropy. The powers of the
293
proposed test are estimated and compared with those of other tests. These results indicate that in some cases this test is preferred.
GUILLERMO AYALA GALLEGO and AMELIA SIMÓ VIDAL
An approximation of the K-function for the study of binary images.
Jensen et al. (1990) gave an exact expression for the K-function in non-overlapping Boolean models. The present study proposes and evaluates an approximate expression for the K-function in overlapping isotropic Boolean models based on an approximation of the covariogram of the primary grain. We study the suitability of a Boolean model for two binary images using this approximate expression.
J. FREIXAS
Optima! strategies for a two-person zero sum game and saddle-points of the scalar field associated with the game.
In this paper we relate the concep t of saddle-point for a function of sever al real variables with the concept of saddle-point used in game theory. We present a method to find the optima! strategies for a two-person zero sum game based on the computation of saddle-points of the function associated with the game.
294
Butlleta de subscripció a la revista Qüestiió
Nom i cognoms------------------------
Empresa/Institució ______________________ _
Adreça __________________________ ~
Codi postal ______ ciutat _______________ _
Tel. _________ Fax _________ _
Data d'expedició ______ _
Signatura: DNI o NIF _______ _
Desitjo subscriure'm a Qüestiió per a l'any 1993. El preu de la subscripció és de 2. 700 PTA.
Forma de pagament
D Transferència al compte de la Caixa de Catalunya número 6985177, Agència 100, Comte d'Urgell 162, 08036 Barcelona
D Domiciliació bancària
D Taló nominatiu a l'Institut d'Estadística de Catalunya
D En efectiu
D Gir postal
Retorneu aquesta butlleta (o una fotocòpia) a:
Secretaria de Qüestíió: Institut d'Estadística de Catalunya Àrea R+D Estadístics Via Laietana, 58 08003 Barcelona
Autorització de domiciliació bancària per al pagament de les subscripcions anuals de la revista Qüesfüó
El sotasignat _________________________ _
autoritza el Banc/Caixa _____________________ _
Agència núm.
Codi postal
______ adreça _______________ _
_______ ciutat _______________ _
a abonar a la revista Qüesfí ió amb càrrec al meu compte número ____ _ ___________________ , les subscripcions a Qüestlió.
___________ ,a __ d ________ de 19
(Signatura)
El sotasignat _________________________ _
autoritza la revista Qüestiió a carregar al meu compte número ___________ , al Banc/Caixa _____________ _
Agència núm.
Codi postal
______ adreça _______________ _
_______ ciutat _______________ _
l'import de les tarifes vigents de les subscripcions a la revista Qüestíió.
___________ ,a __ d ________ de 19
(Signatura)