O comando margens, novo no Stata 11, pode ser uma ferramenta muito útil na compreensão e interpretação de interações. Nesta página, usaremos margens para um modelo de três fatores anova com uma interação de 3 vias significativa. Vamos ilustrar isso usando o conjunto de dados a seguir. Os dados serão analisados como anova fatorial 2x2x3. As variáveis aeb têm dois níveis cada, enquanto a variável c tem três níveis. Começaremos executando o modelo anova. Na verdade, é o caso que a interação de 3 vias é estatisticamente significativa. Aqui está o plano para interpretar essa interação. Em primeiro lugar, vamos executar o comando margens com a opção desequilibrada no termo de interação para obter a célula ajustada significa. Neste caso, o design já está equilibrado, mas a opção desequilibrada está incluída para aqueles casos em que os dados são desequilibrados para que não nos esqueçamos. Nós também usaremos a opção post porque estamos planejando fazer testes entre os meios de célula. A interação significativa de 3 vias sugere que há uma ou mais interações bidirecionais que são significativas. Selecionaremos algumas interações bidirecionais para testar cada um dos níveis da terceira variável. Se alguma das interações bidirecionais for significativa, testaremos o efeito principal de uma variável em cada nível da outra variável. Estes são conhecidos como testes de efeitos principais simples. Finalmente, se necessário, seguimos esses testes de efeitos principais simples com comparações par-wise entre os meios apropriados. Aqui está o comando margens. Como temos algum conhecimento prévio específico sobre as variáveis neste modelo, começaremos por plotar as médias das células para as interações b por c para cada nível de a. Fazemos isso colocando as estimativas do comando margens em uma média de matriz. Em seguida, criamos matrizes separadas para os níveis das três variáveis fatoriais, chamando-as habilmente a. B e c. Você pode olhar para qualquer uma dessas matrizes digitando lista de matrizes seguido pelo nome da matriz. Vamos combinar todas as matrizes juntas em uma matriz chamada gph. Usando o comando svmat vamos colocar os valores da matriz em dados na memória. Finalmente, traçaremos os meios usando o comando twoway line duas vezes, uma vez para cada interação bc. Os gráficos dos meios celulares sugerem que a interação bc em a1 será significativa enquanto a interação bc em a2 não. Usaremos o comando testar para testar as interações bidirecionais em para cada nível de a. Estes testes são dois graus de liberdade cada um e se referirão a meios específicos de células com sinais corretos para obter um efeito de interação. Essencialmente, estamos especificando uma interação em dois sentidos usando apenas os meios de célula. Isso não é difícil de configurar especialmente se usarmos uma tabela representando as seis células e mais com minuses para indicar os sinais apropriados. Aqui está a tabela para o primeiro grau de liberdade. O segundo grau de liberdade refere-se a esta tabela seguinte. Essas duas tabelas traduzem os comandos de teste mostrados abaixo. Cada parte do comando de teste entre parênteses é um grau de liberdade. Para simplificar ajustes para testes múltiplos, usaremos um ajuste de Bonferroni em todos os testes de efeitos principais simples e comparações par-wise. Tendo já executado através desta análise antes de escrever esta página web, eu sei que haverá sete desses testes. Portanto, incluí um comando de exibição dando os valores p ajustados para cada teste. Nossa suposição de olhar o gráfico dos meios da pilha era correta. O teste de bc em a1 foi significativo enquanto que bc em a2 não foi. Podemos acompanhar isso com testes de diferenças entre os níveis de c para cada nível de b, mantendo um em um. Cada um destes testes também terá dois graus de liberdade O teste para as diferenças entre os níveis de c para b1, mantendo um em um foi significativo. Nós seguiremos este teste significante acima olhando todas as comparações pair-wise entre os níveis de c para b1 e a1. Cada um desses testes usa um grau de liberdade. Parece que cada uma das comparações em pares entre os níveis de c para b1 e a1. Assim, finalmente chegamos ao final de nossa jornada e esperamos estar mais informados, então, no início. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site específico, livro ou produto de software pela Universidade da Califórnia. Bem-vindo ao Instituto de Pesquisa Digital e Educação Stata FAQ Como posso usar o comando margens para entender Múltiplas interações na regressão logística (Stata 11) O comando margens, novo em Stata 11, pode ser uma ferramenta muito útil na compreensão e interpretação de interações. Vamos ilustrar o comando para um modelo de regressão logística com duas interações categóricas contínuas. Começamos por carregar o conjunto de dados mlogcatcon. Neste conjunto de dados y é a variável de resposta binária e m e s são preditores contínuos. A variável f. Que significa feminino, é um preditor binário. Vamos interagir f com m e s. Aqui está o modelo de regressão logística. Você notará que a interação f por s é estatisticamente significativa enquanto a interação f por m não é. Como este é um modelo não-linear, teremos que levar em consideração os valores de todas as covariáveis para entender o que está acontecendo no modelo. Vamos começar com um comando de margens que olha para a discreta diferença de probabilidade entre machos e fêmeas para cinco níveis diferentes de s, mantendo m em seu valor médio. Obtemos a discreta diferença de probabilidade usando a opção dydx com o preditor binário. A variável m será mantida no seu valor médio usando a opção de meios. Embora os resultados do comando de margens acima sejam perfeitamente corretos, eles refletem a mudança discreta na probabilidade de apenas um único valor de m. Se removemos a opção de meios, obtemos o efeito marginal médio, isto é, a variação discreta na probabilidade para cada um dos valores de s média dos valores observados de m. Aqui está como o comando margens parece agora. Vamos seguir em frente e graficar esses resultados, incluindo os 95 intervalos de confiança. Começaremos colocando os valores necessários em uma matriz usando as técnicas mostradas no Stata FAQ: Como posso gráfico os resultados do comando margens. Os comandos de matriz serão seguidos por um gráfico de linha de dois tempos. O comando de margens eo gráfico acima nos dão uma boa idéia de como a discreta mudança na probabilidade varia entre diferentes valores de s, mas ainda não sabemos como isso muda com valores diferentes de m. Vamos tentar o comando margens mais uma vez, desta vez variando s e m. As primeiras cinco linhas dão a alteração discreta para os cinco valores de s, mantendo m em 30. Os próximos cinco mantêm m em 40. E assim por diante. Uma das características mais interessantes é como poucas das alterações discretas são estatisticamente significativas, mesmo que a interação global f por s tenha sido significativa. Agora podemos coletar os valores necessários em uma matriz em preparação para a representação gráfica. Vamos começar por graficar o efeito de diferentes valores de s com linhas separadas para cada valor de m. Embora não haja muitos valores significativos na tabela de margens acima, as linhas para cada um dos valores de m parecem bastante diferentes umas das outras. Enquanto a linha para m igual a 30 é bastante plana a linha para m igual 70 exibe muito mais variabilidade, primeiro caindo e, em seguida, subindo abruptamente em torno de s igual a 50. Agora que sabemos que diferenças em s para valores de m se parece, podemos Inverta as variáveis no comando de gráficos (twoway linha) para ver que diferenças em m para valores de s se parece. Naturalmente, nós estamos olhando os mesmos 25 valores que o gráfico precedente, organizado apenas diferentemente. Desta vez, a linha para s igual a 70 é a que se destaca dos outros. Se o seu modelo é mais complexo do que este, você tem que decidir o que fazer com cada uma das co-variáveis. Você pode mantê-los constantes em um ou mais valores ou você pode média sobre eles. Seja qual for a escolha que você faça, você precisa perceber que os valores de todas as covariáveis são importantes em modelos não-lineares. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico pela Universidade da Califórnia. Bem-vindo ao Instituto de Pesquisa e Educação Digital Usando Margens para Probabilidades Previsíveis O comando margens (introduzido em Stata 11) é muito versátil com inúmeras opções. Esta página fornece informações sobre como usar o comando margens para obter as probabilidades previstas. Permite obter alguns dados e executar um modelo logit ou um modelo probit. Não importa realmente desde que nós podemos usar os mesmos comandos das margens para um ou outro tipo de modelo. Usaremos logit com a variável de resposta binária homenageia com a fêmea como um preditor categórico e lemos como um preditor contínuo. Note que feminino. Que é categórica, é incluída como uma variável de fator (isto é, i. female) de modo que o comando margens irá tratá-lo como uma variável categórica, caso contrário, seria assumido como contínuo. Começaremos o nosso uso das margens, prevendo as probabilidades para cada nível de fêmea, mantendo constante na sua média. Você pode ignorar a parte do cabeçalho que dá a média para 0.female e 1.female porque margens vai calcular as probabilidades previstas para cada nível de fêmea. Nós vemos que a leitura será mantida constante em seu valor médio de 52.23. Os valores na coluna intitulada Margem são as probabilidades previstas para machos e fêmeas mantendo a leitura na sua média. Também obtemos erros-padrão z-statistics e p-values testando a diferença de zero e um intervalo de confiança de 95 para cada probabilidade prevista. Em seguida, usaremos margens para obter as probabilidades previstas para os valores de leitura de 20 a 70 em incrementos de 10, mantendo a média na média. Incluiremos também a opção pós para que possamos obter as estimativas e seus erros padrão com facilidade. Também incluiremos a opção vsquish para produzir uma saída mais compacta. A variável 1.female está sendo mantida pelo seu valor médio de 0,545. Você pode ignorar o valor médio para 0.female desde zero é o nível de referência da fêmea em nosso exemplo. A coluna Margem mais uma vez dá a probabilidade prevista. O cabeçalho acima da parte principal da tabela nos informa qual linha está associada com qual valor de read. Portanto, a linha 1 está associada com leitura igual a 20 e linha 6 com leitura igual a 70. É fácil dizer a partir desta tabela que como o valor de leitura aumenta a probabilidade de honras ser um também está aumentando a partir de uma probabilidade de 0,002 Para uma probabilidade de 0,75. Uma maneira alternativa de ver esses resultados é como um gráfico que inclui as probabilidades previstas juntamente com o intervalo de confiança. Faremos isso usando uma série de comandos de matriz Stata seguido de um gráfico twoway (note que o esquema lean1 está disponível em gr0002). O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico pela Universidade da Califórnia.
No comments:
Post a Comment