def compare_results(name1, name2, r1, r2): print("---------------------") print(f"{name1},{name2}> Comparison statistics") print(normal_ad(np.array(r1))) print(normal_ad(np.array(r2))) d1 = DescrStatsW(r1) print(d1.get_compare(r2).summary(use_t=True, usevar='unequal')) print(f"{name1},{name2}>", ranksums(r1, r2)) f1 = frame_of(r1, name1) f2 = frame_of(r2, name2) frame = pd.concat([f1, f2]) plt.figure() sns.boxplot(data=frame, x="source", y="time") plt.savefig(f"output/fig{name1}x{name2}.png")
def calcula_teste(i): media = temp[0:i].mean() stat, p = ztest(temp[0:i], value = 3.4320503405352594) return (i,media, p) valores = np.array([calcula_teste(i) for i in range(2, len(temp))]) plt.plot(valores[:,0], valores[:,1]) plt.plot(valores[:,0], valores[:,2]) plt.hlines(y = 0.05, xmin = 2, xmax = len(temp), colors='r') """# Comparação de dois conjuntos de amostras""" print(ztest(notas1.rating, notas.rating)) zconfint(notas1.rating, notas.rating) print(ztest(notas.rating, notas1.rating)) zconfint(notas.rating, notas1.rating) from scipy.stats import ttest_ind ttest_ind(notas.rating, notas1.rating) descr_todas_as_notas = DescrStatsW(notas.rating) descr_toystory = DescrStatsW(notas1.rating) comparacao = descr_todas_as_notas.get_compare(descr_toystory) comparacao.summary() comparacao.summary(use_t=True)
# Descrição dos dados df.describe() """---------------------------------------------------------------------------- TESTE Z Hzero = As medias sao iguais (mu_1 = mu_2) """ diagnostico_m = df.query("diagnosis == 'M'") diagnostico_b = df.query("diagnosis == 'B'") # Efetuando o Zteste para a comparacao entre as médias ztest(diagnostico_m["mean_radius"], diagnostico_b["mean_radius"]) # Calculo do intervalo de confianca para a diferenca entre as medis zconfint(diagnostico_m["mean_radius"], diagnostico_b["mean_radius"]) """---------------------------------------------------------------------------- TESTE T Hzero = As medias sao iguais (mu_1 = mu_2) """ diagnostico_m = df.query("diagnosis == 'M'") diagnostico_b = df.query("diagnosis == 'B'") # Efetuando o Zteste para a comparacao entre as médias ztest(diagnostico_m["mean_radius"], diagnostico_b["mean_radius"]) # Calculo do intervalo de confianca para a diferenca entre as medis descr_stats_m = DescrStatsW(diagnostico_m["mean_radius"]) descr_stats_b = DescrStatsW(diagnostico_b["mean_radius"]) resultado = descr_stats_m.get_compare(descr_stats_b) print(resultado.summary(use_t=True))
# Teste Unicaudal # Rejeitar H_0 se z \geq z_{\alpha} z >= z_alpha # Critério do valor p # Teste Unicaudal # Rejeitar H_0 se o valor p\leq\alpha from statsmodels.stats.weightstats import DescrStatsW, CompareMeans test_setosa = DescrStatsW(setosa) test_virginica = DescrStatsW(virginica) test_A = test_setosa.get_compare(test_virginica) z, p_valor = test_A.ztest_ind(alternative='larger', value=0) print('O valor de z é ', z) print('O p-valor é ', p_valor) test_B = CompareMeans(test_setosa, test_virginica) z, p_valor = test_B.ztest_ind(alternative='larger', value=0) print('O valor de z é ', z) print('O p-valor é ', p_valor) p_valor <= significancia # Aceitamos a hipótese nula.
"""# Comparação de dois conjuntos de amostras""" print(ztest(notas1.rating, notas.rating)) zconfint(notas1.rating, notas.rating) print(ztest(notas.rating, notas1.rating)) zconfint(notas.rating, notas1.rating) from scipy.stats import ttest_ind ttest_ind(notas.rating, notas1.rating) descr_todas_as_notas = DescrStatsW(notas.rating) descr_toystory = DescrStatsW(notas1.rating) comparacao = descr_todas_as_notas.get_compare(descr_toystory) comparacao.summary() comparacao.summary(use_t=True) import matplotlib.pyplot as plt plt.boxplot([notas.rating, notas1.rating], labels=["Todas as notas", "Toy Story"]) plt.title("Distribuição das notas de acordo com filmes") import matplotlib.pyplot as plt plt.boxplot([notas.rating, notas1[3:12].rating], labels=["Todas as notas", "Toy Story (do 3 ao 12)"]) plt.title("Distribuição das notas de acordo com filmes") descr_todas_as_notas = DescrStatsW(notas.rating)