R kode som illustrerer test og konfidensintervall for sammenligning av to populasjonsgjennomsnitt ved store utvalg (avsnitt 10.1)

 

# Vi vil illustrere teorien på sidene 478-482 i læreboka ved å se på vekten til et tilfeldig utvalg av 2116 nyfødte gutter og 1950 nyfødte jenter.

 

# Vi vil (i) teste om det er forskjell på forventet fødselsvekt for gutter og jenter og (ii) bestemme et (tilnærmet) 95% konfidensintervall for forskjellen i forventet fødselsvekt.

 

# Vi leser inn datafilen som inneholder fødselsvektene (og mere til):

fvekt=read.table("http://www.uio.no/studier/emner/matnat/math/STK1110/h12/fvekt.txt",header=T)

 

# Vi trekker ut fødselsvektene for gutter og jenter:

fvekt.gutt=fvekt$vekt[fvekt$kjonn==1]

fvekt.jente=fvekt$vekt[fvekt$kjonn==2]

 

# Vi lager boxplott av fødselsvektene:

boxplot(fvekt.gutt,fvekt.jente,names=c("Gutt","Jente"))

 

# Vi betemmer testobservatoren  [jf side 479 i læreboka]

m=length(fvekt.gutt)

n=length(fvekt.jente)

s1=sd(fvekt.gutt)

s2=sd(fvekt.jente)

z=(mean(fvekt.gutt)-mean(fvekt.jente))/sqrt(s1^2/m+s2^2/n)

 

# Vi betemmer 95% konfidensintervall for forskjellen i forventet fødselsvekt mellom gutter og jenter [jf side 481 i læreboka]

l=mean(fvekt.gutt)-mean(fvekt.jente)-1.96*sqrt(s1^2/m+s2^2/n)

u=mean(fvekt.gutt)-mean(fvekt.jente)+1.96*sqrt(s1^2/m+s2^2/n)

print(c(l,u),2)