domingo, 26 de junho de 2011

A Natureza da Análise de Regressão

Essa é mais uma parte da introdução dessa matéria (econometria), também baseada no livro de Damodar Gujarat, em breve o blog terá material suficiente para  regredir dados assim como citado no post anterior. A introdução de qualquer matéria sempre foi e sempre será a parte mais chata do estudo, no entanto não menosprezem estas informações. A introdução sempre é uma base de fundamental importância.
Origem Histórica do Termo “Regressão”
O termo regressão remete-se a “regressão à mediocridade”. Francis Galton observou que quanto maior a altura de um grupo de pessoas comparado a outro grupo de menor estatura, a altura de seus descendentes tende a ser maior, no entanto menores que seus pais (em média). Dessa forma, os descendentes de pais altos, naturalmente também são altos, mas não tanto quanto seus pais. Os descendentes de pais baixos, naturalmente também são baixos, mas não tanto quanto seus pais. Desse modo, com o passar das gerações a estatura das pessoas tente a mediocridade, ou de outra forma, regressam à mediocridade.
A Interpretação Moderna da Regressão
Já a interpretação moderna da regressão é bem diferente. Nas palavras de Gujarat:
“A análise de regressão ocupa-se do estudo da dependência de uma variável, a variável dependente, em relação a uma ou mais variáveis, as variáveis explicativas, com o objetivo de estimar e/ou prever a média (da população) ou o valor médio da dependente em termos dos valores conhecidos ou fixos (em amostragem repetida) das explicativas.”
Relações Estatísticas versus Deterministas
Nas relações estatísticas lidamos com variáveis estocásticas ou aleatórias, nas relações deterministas lidamos com variáveis sem distribuição de probabilidade.
“A palavra estocástica provém da palavra grega stokhos, que significa “alvo”. O resultado do lançamento de dardos contra o alvo é um processo estocástico, isto é, um processo repleto de erros.”.
Nas relações estatísticas sempre haverá alguma variabilidade aleatória ou intrínseca que não poderá ser plenamente explicada, por mais variáveis explicativas que consideremos. Por isso o uso do termo de perturbação (u).
Como exemplo das relações deterministas, podemos citar as funções da física, da matemática e semelhantes.
Regressão versus Causação
Nas palavras de Kendall e Stuart, “uma relação estatística, por mais forte e sugestiva que seja, jamais pode estabelecer uma relação causal: nossas ideias sobre causação dever vir de fora da estatística, enfim, de outra teoria”.
Desse modo, se fizermos um modelo de regressão relacionando consumo e renda, temos que saber que a relação estatística, por si só, não pode logicamente implicar a causação de uma variação no consumo pela renda. Para isso devemos recorrer a teoria econômica.
Regressão versus Correlação
O objetivo básico da correlação é medir a intensidade ou o grau de associação linear entre duas variáveis.
Na regressão supõe-se que a variável dependente seja estocástica, isto é, que tenha uma distribuição de probabilidade. Supõe-se também que as variáveis explicativas tenham valores fixados. Temos assim uma relação assimétrica entre as variáveis.
Por outro lado, na análise de correlação tratamos quaisquer variáveis simetricamente. Não existe distinção entre as variáveis dependente e explicativa.
A Natureza e as Fontes de Dados para a Análise Econométrica
Dados de Série Temporal
Dados em serie temporal são o conjunto de observações dos valores de uma variável em diferentes momentos de tempo. Dados coletados dessa forma podem ser quantitativos ou qualitativos (homem e mulher, paz e guerra). Os dados qualitativos também são chamados de Variáveis Dummy.
Dados de Corte (Cross-Section)
São dados de uma ou mais variáveis coletadas no mesmo ponto no tempo.
Esse tipo de dados causa problemas no que se refere ao efeito escala. Se pegarmos os dados de diferentes estados brasileiros em determinado momento no tempo poderemos, talvez, verificar a heterogeneidade dos dados para cada estado. Ao traçarmos o gráfico desses dados poderemos nos deparar com dados muito dispersos.
Dados Combinados
Nos dados combinados há elementos tanto de séries temporais como de dados de corte.
Existe também um tipo especial de dados combinados, os dados de painel, onde a mesma unidade cross-sectional tem dados periódicos durante determinado período.

Isso aí, passando essa introdução já temos a base para novos conceitos que passam a ser mais interessantes. No entanto mesclarei os posts com materiais de economia do meio ambiente. Uma matéria também muito interessante que está em evidência ultimamente.

Um comentário:

  1. Oi sempre visito seu blog para consultas, por isso gostaria de saber quem é o autor que tanto nos ajuda para poder utilizar o que escreve e lhe dar o seu devido crédito.
    Obrigada, Cele.

    ResponderExcluir