-
Considere os dados seguintes, correspondentes a amostras aleatórias independentes tomadas de duas populações normais.
Dados históricos anteriores forneceram os seguintes valores para as variâncias populacionais: \(\sigma^2_1 = 6\) e \(\sigma^2_2 = 5.5\). Podemos afirmar com 99% de confiança que as duas populações são diferentes?
-
A FedEx e a United Parcel Service (UPS) são dois dos principais serviços de entrega de encomendas em termos de volume e receita. De acordo com o Airports Council International, o Memphis International Airport (FedEx) e o Louisville International Airport (UPS) são dois dos maiores aeroportos de carga do mundo. As seguintes amostras aleatórias apresentam as toneladas de carga por dia manipuladas por esses dois aeroportos. Os dados estão expressos em milhares de toneladas.
Memphis
9,1-15,1-8,8-10,0-7,5-10,5-8,3-9,1-6,0-5,8-12,1-9,3
Louisville
4,7-5,0-4,2-3,3-5,5-2,2-4,1-2,6-3,4-7,0
Podemos afirmar que os dois aeroportos movimentam em média o mesmo volume considerando um nível de significância de 1%?
Resposta
No problema sugerido, não é fornecido nenhuma informação a cerca dos parâmetros da população. Logo, toda informação deve ser retirada das amostras. Portanto, trata-se de um caso típico de amostras independentes com variância desconhecida. O pesquisador quer comparar se os dois tipo de serviços possuem em média o mesmo volume. Desde modo, elaboremos uma hipótese do tipo bilateral.
\[
H_0: \mu_{mem} - \mu_{lou} = 0 \\
H_1: \mu_{mem} - \mu_{lou} \neq 0
\]
Importando os dados e apresentando um breve resumo.
dd = read.table('http://nbcgib.uesc.br/lec/download/R/dados/AndersonPg.txt',h=T)
dd
## aeroporto volume
## 1 mem 9.1
## 2 mem 15.1
## 3 mem 8.8
## 4 mem 10.0
## 5 mem 7.5
## 6 mem 10.5
## 7 mem 8.3
## 8 mem 9.1
## 9 mem 6.0
## 10 mem 5.8
## 11 mem 12.1
## 12 mem 9.3
## 13 louis 4.7
## 14 louis 5.0
## 15 louis 4.2
## 16 louis 3.3
## 17 louis 5.5
## 18 louis 2.2
## 19 louis 4.1
## 20 louis 2.6
## 21 louis 3.4
## 22 louis 7.0
summary(dd)
## aeroporto volume
## louis:10 Min. : 2.200
## mem :12 1st Qu.: 4.325
## Median : 6.500
## Mean : 6.982
## 3rd Qu.: 9.100
## Max. :15.100
Dividindo em subconjuntos apenas para visualização didádica dos cálculos que virão a seguir.
lo = subset(dd, aeroporto=='louis')
lo
## aeroporto volume
## 13 louis 4.7
## 14 louis 5.0
## 15 louis 4.2
## 16 louis 3.3
## 17 louis 5.5
## 18 louis 2.2
## 19 louis 4.1
## 20 louis 2.6
## 21 louis 3.4
## 22 louis 7.0
memp = subset(dd, aeroporto=='mem')
memp
## aeroporto volume
## 1 mem 9.1
## 2 mem 15.1
## 3 mem 8.8
## 4 mem 10.0
## 5 mem 7.5
## 6 mem 10.5
## 7 mem 8.3
## 8 mem 9.1
## 9 mem 6.0
## 10 mem 5.8
## 11 mem 12.1
## 12 mem 9.3
Calculando as estatísticas.
medlo = with(lo, mean(volume))
medlo
## [1] 4.2
deslo = with(lo, sd(volume))
deslo
## [1] 1.431394
medme = with(memp, mean(volume))
medme
## [1] 9.3
desme = with(memp, sd(volume))
desme
## [1] 2.542726
medlo_mem = medlo - medme
medlo_mem
## [1] -5.1
errdiff = sqrt(deslo^2/10 + desme^2/12)
errdiff
## [1] 0.862367
phi = function(var1,var2,n1,n2){
numerador = (var1/n1 + var2/n2)^2
denominador1 = 1/(n1-1) * (var1/n1)^2
denominador2 = 1/(n2-1) * (var2/n2)^2
res = numerador/(denominador1 + denominador2)
return(res)
}
glibb = phi(deslo^2, desme^2, 10, 12)
glibb
## [1] 17.80912
tcalc = (medlo_mem - 0)/errdiff
tcalc
## [1] -5.913956
pvalor = pt(tcalc, glibb)*2
pvalor
## [1] 1.40479e-05
Como o p-valor é menor que o nível de significância, então rejeita-se \(H_0\).
Usando uma função pronta do r
teríamos:
t.test(with(lo,volume), with(memp, volume))
##
## Welch Two Sample t-test
##
## data: with(lo, volume) and with(memp, volume)
## t = -5.914, df = 17.809, p-value = 1.405e-05
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -6.913159 -3.286841
## sample estimates:
## mean of x mean of y
## 4.2 9.3
-
(Estudo de caso) O Clearwater National Bank realiza um estudo idealizado para identificar as diferenças na utilização das contas correntes pelos clientes em dois de seus bancos filiais. Uma amostra aleatória simples de 28 contas correntes é selecionada da filial situada em Cherry Grove e uma amostra aleatória simples independente é selecionada de sua filial em Beechmont. O saldo atual da conta corrente é registrado para cada uma das contas. Podemos afirmar que há diferença no saldo médio bancário entre os dois bancos filiais considerando \(\alpha=0,01\)? Os dados estão disponíveis no seguinte link:http://nbcgib.uesc.br/lec/download/R/dados/AndersonPg_360.txt
Resposta
As hipóteses de interesse são:
\[
H_0: \mu_{cherry} - \mu_{beec} = 0 \\
H_1: \mu_{cherry} - \mu_{beec} \neq 0
\]
De maneira mais objetiva segue os resultados.
ban <- read.table('http://nbcgib.uesc.br/lec/download/R/dados/AndersonPg1.txt',h=T)
ban
## filiais saldo
## 1 cherry 1263
## 2 cherry 897
## 3 cherry 849
## 4 cherry 891
## 5 cherry 964
## 6 cherry 810
## 7 cherry 877
## 8 cherry 899
## 9 cherry 847
## 10 cherry 1070
## 11 cherry 1252
## 12 cherry 920
## 13 cherry 1256
## 14 cherry 1196
## 15 cherry 1150
## 16 cherry 1024
## 17 cherry 1016
## 18 cherry 1126
## 19 cherry 1289
## 20 cherry 1220
## 21 cherry 912
## 22 cherry 1026
## 23 cherry 786
## 24 cherry 989
## 25 cherry 1133
## 26 cherry 990
## 27 cherry 999
## 28 cherry 1049
## 29 beec 997
## 30 beec 897
## 31 beec 912
## 32 beec 895
## 33 beec 785
## 34 beec 751
## 35 beec 882
## 36 beec 1110
## 37 beec 907
## 38 beec 1226
## 39 beec 762
## 40 beec 836
## 41 beec 1048
## 42 beec 774
## 43 beec 807
## 44 beec 972
## 45 beec 980
## 46 beec 877
## 47 beec 943
## 48 beec 993
## 49 beec 704
## 50 beec 963
summary(ban)
## filiais saldo
## beec :22 Min. : 704.0
## cherry:28 1st Qu.: 878.2
## Median : 963.5
## Mean : 974.4
## 3rd Qu.:1048.8
## Max. :1289.0
chee = subset(ban, filiais=='cherry')
chee
## filiais saldo
## 1 cherry 1263
## 2 cherry 897
## 3 cherry 849
## 4 cherry 891
## 5 cherry 964
## 6 cherry 810
## 7 cherry 877
## 8 cherry 899
## 9 cherry 847
## 10 cherry 1070
## 11 cherry 1252
## 12 cherry 920
## 13 cherry 1256
## 14 cherry 1196
## 15 cherry 1150
## 16 cherry 1024
## 17 cherry 1016
## 18 cherry 1126
## 19 cherry 1289
## 20 cherry 1220
## 21 cherry 912
## 22 cherry 1026
## 23 cherry 786
## 24 cherry 989
## 25 cherry 1133
## 26 cherry 990
## 27 cherry 999
## 28 cherry 1049
beee = subset(ban, filiais=='beec')
beee
## filiais saldo
## 29 beec 997
## 30 beec 897
## 31 beec 912
## 32 beec 895
## 33 beec 785
## 34 beec 751
## 35 beec 882
## 36 beec 1110
## 37 beec 907
## 38 beec 1226
## 39 beec 762
## 40 beec 836
## 41 beec 1048
## 42 beec 774
## 43 beec 807
## 44 beec 972
## 45 beec 980
## 46 beec 877
## 47 beec 943
## 48 beec 993
## 49 beec 704
## 50 beec 963
t.test(with(chee,saldo), with(beee, saldo))
##
## Welch Two Sample t-test
##
## data: with(chee, saldo) and with(beee, saldo)
## t = 2.9546, df = 47.805, p-value = 0.004847
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 36.71815 193.19094
## sample estimates:
## mean of x mean of y
## 1025.0000 910.0455
Como o p-valor foi menor que \(\alpha\), rejeita-se \(H_0\).