LEITURA 05.1

RICHARDSON, Roberto Jarry. Pesquisa social: métodos e técnicas. São Paulo, Atlas, 1985.Capítulo 5. Variáveis. p. 62-82.


Variáveis

 

Seguindo as colocações de Fred Kerlinger (1973), o termo variável é fundamental nas Ciências Sociais. É um conceito e, como conceito, é um substantivo que representa classes de objetos, como, por exemplo, sexo, escolaridade, renda mensal, participação política etc. Evidentemente, existem variáveis fáceis de identificar, como sexo, que apresenta apenas duas categorias, masculino e feminino. Mas existem outras mais complexas, como participação política. Não é simples definir o conceito participação.

As variáveis apresentam duas características fundamentais: a) são aspectos observáveis de um fenômeno; b) devem apresentar variações ou diferenças em relação ao mesmo ou a outros fenômenos.

Baseando-se na primeira característica, as variáveis podem ser definidas como características mensuráveis de um fenômeno, que podem apresentar diferentes valores ou ser agrupadas em categorias. Por exemplo, a variável idade apresenta diversos valores: 10 anos, 15, 20 ... n, a variável estado civil, pode ser agrupada nas seguintes categorias: solteiro, casado, viúvo, desquitado e divorciado.

Conforme a segunda característica, as variáveis devem apresentar variações nos seguintes aspectos:

 

5.1 VARIAÇÕES EM RELAÇÃO AO MESMO FENÔMENO

Quando um pesquisador apenas deseja analisar informações univariadas (de uma variável), comparando elementos entre diferentes categorias. Nesse caso, deve assegurar número significativo de sujeitos em cada uma das categorias.

Por exemplo, um pesquisador deseja analisar a distribuição, segundo estado civil, de um grupo de trabalhadores. Após a coleta de dados, obtém informação apresentada na Tabela 5. 1.

Tabela 5. 1. Distribuição de trabalhadores, segundo o estado civil.
 
ESTADO CIVIL
F
   
Solteiros 
100
Casados 
60
Viúvos
40
Desquitados
40
   
Total
240
Nesse caso, o pesquisador pode comparar as categorias, sem maiores problemas.

Mas suponhamos que a informação obtida se distribua como na Tabela 5.2.

Tabela 5.2. Distribuição de trabalhadores, segundo o estado

civil.
 
ESTADO CIVIL
F
Solteiros 
130
Casados 
100
Viúvos
8
Desquitados
2
Total 
240
Nesse caso, as últimas duas categorias não apresentam número significativo de casos. Portanto, se se deseja comparar a variável com alguma outra característica, essas categorias devem ser reagrupadas, como na Tabela 5.3.

Tabela 5.3. Distribuição de trabalhadores, segundo o estado civil.
 
ESTADO CIVIL 
F
Solteiros 
130
Casados 
100
Outros 
10
Total 
240
A análise será feita comparando-se as categorias solteiros e casados, fazendo-se menção aos dez casos na categoria "outros".

Uma situação bastante comum nas Ciências Sociais é a concentração de casos em apenas uma categoria, sem que se apresentem variações entre as alternativas (Tabela 5.4). Esta é uma situação que deve ser corrigido, pois, de fato, não se tem uma variável (não varia), há uma constante (solteiros).

Tabela 5.4. Distribuição de trabalhadores, segundo o estado

civil.
 
ESTADO CIVIL
F
Solteiros
200
Casados
10
Viúvos 
-
Desquitados
-
Total 
210
Em casos como esse, o pesquisador deve decidir entre as seguintes estratégias:

1. Reformular as categorias

Desdobrando aquela que apresentou maior concentração. Exemplo:

Variável: Grau de escolaridade
 
GRAU DE ESCOLARIDADE
F
Primeiro Grau 
200
Segundo Grau
10
Terceiro Grau
5
Total 
215
Variável: (categorias reformuladas)

Grau de escolaridade

 
 
GRAU DE ESCOLARIDADE
F
Primeiro Grau Incompleto
120
Primeiro Grau Completo
80
Segundo ou Terceiro Grau
15
Total
215
No caso de persistir a concentração, a variável deve ser reformulada.

2. Reformular a variável

No exemplo anterior, grau de escolaridade, o pesquisador poderia reformular a variável, utilizando anos de escolaridade (1, 2, 3..... n) ou última série cursada (1a, 2a , 3a ...)

3. Eliminar, a variável

Existem casos em que as categorias não podem ser reagrupadas ou a variável não pode ser reformulada. Nessas situações, o pesquisador deve eliminar a variável, pois não serve como medida de variação, como, por exemplo, a distribuição da variável estado civil, já mencionada. Se, de uma amostra de 210 pessoas, 200 são solteiras, a variável estado civil não contribui para explicar diferenças em outras dimensões, pois a quase totalidade das pessoas é solteira. Assim, não existe variação no estado civil.

Considerando a importância das variações internas de uma variável, seguir são apresentadas algumas regras estabelecidos por James A. Davis.(1)

l . Assegure que as variáveis variem

O pesquisador deve dispor de grande número de casos que difiram na sua classificação.

2. Se uma das categorias for exageradamente maior em freqüência que as demais, use-a sozinha. Em outras palavras, transformes em uma variável. Por exemplo, no caso da variável grau de escolaridade, já mencionada, poder-se-ia dividir a categoria Primeiro Grau em séries (1a, 2a ...) e utilizá-la como mais uma variável.

3. Se tiver um grande número de categorias com pequenas freqüências, comece a agrupar em pares, até obter categorias significativas. Exemplo:

Tabela 5.5. Distribuição percentual de estudantes em uma universidade hipotética.
 
 
ORIGINAL
REAGRUPADA
 
ÁREA PERCENTUAL ÁREA PERCENTUAL
Engenharia 25 Ciências Matemáticas 40
Belas-Artes 5 Ciências Humanas 25
Humanidades 20 Ciências Sociais 35
Ciências Físicas 15
Ciências Sociais 15
Serviço Social 20
100 100
 
4. Evite alternativas que concentrem mais de 70% dos casos pois, como já foi visto, prejudicam a análise.

 

5.2 VARIAÇÃO EM RELAÇÃO A OUTROS FENÔMENOS

Conforme esta característica, a variável é um aspecto observável de um fenômeno ligado a outras variáveis em relação determinada. Dita relação pode ser de variação conjunta (covariação), associação, dependência, causalidade etc.

Exemplos: (2)

É importante dominar esses tipos de relações, pois a análise estatística dependerá das relações presentes entre as variáveis em estudo.

 

5.3 PRINCÍPIOS PARA A DEFINIÇÃO DE VARIÁVEIS

Existem alguns princípios aplicados a todas as variáveis; o não cumprimento deles leva a uma perda de informação essencial ou, pior ainda, à inutilidade completa da medição.

Primeiro, os valores de uma variável devem ser mutuamente excludentes. Isso significa que uma e só uma categoria da mesma classe (um valor da mesma variável) pode ser atribuída a cada um dos indivíduos em estudo. Por exemplo:

Variável: local de origem.

Classificação inadequada:

1. Povoado.

2. Local com menos de 3.000 habitantes.

3. Local entre 3.001 e 10.000 habitantes.

4. Local entre 10.000 e 50.000 habitantes.

5. Local com mais de 50.000 habitantes.

O problema radica-se na 1a e 2a alternativas, pois o povoado é um local de menos de 3.000 habitantes. Portanto, um sujeito pode ser classificado em qualquer dessas duas categorias. Não são excludentes.

Classificação Adequada:

1. Local com menos de 3.000 habitantes.

2. Local......

3. Local......

4. Local......

5. Local......

Variável: Religião.

Classificação lnadequada:

1. Católica.

2. Protestante.

3. Anglicana.

Um sujeito anglicano é protestante. Portanto, as categorias não são excludentes.

Classificação Adequada:

1 . Católica.

2. Protestante.

ou:

1. Católica.

2. Anglicana.

3. Adventista.

4. Presbiteriana.

5. Outras.

Logicamente, as categorias devem estar adequadas à realidade local ou regional. No Nordeste do Brasil, seria um absurdo trabalhar com a última classificação.

As regras da medição têm de assegurar que nunca haja dúvida, quando se aplica um dos valores possíveis a um caso específico. Ás vezes, precisam-se formular certas regras para garantir a validade deste princípio; por exemplo, o caso de arredondamento das decimais. Evidentemente, não se pode permitir que a um mesmo sujeito lhe sejam atribuídos mais de um valor da mesma variável, sendo isto equivalente a listá-lo duas vezes na distribuição de freqüências.

Segundo, o conjunto dos valores possíveis deve ser exaustivo, o que significa que todas as possibilidades empíricas devem ser incluídas no conjunto. Em outras palavras, todos os elementos da amostra, sejam pessoas, animais ou coisas, devem ser classificados em alguma das categorias estabelecidas. Por exemplo, a variável religião seria inútil, no contexto dos países latino-americanos, se contivesse as categorias muçulmana e budista (adequadamente definidas), mas não a categoria católica. Aqui, também, não é sempre fácil assegurar a validade do princípio; talvez se encontrem dificuldades em decidir se certa afiliação espiritual indica uma "religião" ou não. No entanto, o valor de uma pesquisa perderia muito se se utilizassem variáveis não exaustivas.

Um terceiro princípio, ocasionalmente mencionado neste contexto, refere-se à representatividade da variável. Neste caso, porém, pode ser omitido, pois a definição da variável como representante formal de um conjunto de valores possíveis, determinados por uma regra de medição comum, já está garantindo a validade deste princípio.

Em suma, uma representação, como imagem de um original, é basicamente um conjunto de M x N atributos. O valor M representa o número de variáveis levantadas simultaneamente e indicados no conjunto de N elementos que constitui o original.

Deve-se alertar que sempre se opera com construções fundamentais artificiais, porque as regras de atribuição dependem do conhecimento do investigador, da clareza do seu pensamento, das estruturas funcionais da linguagem científica e pré-científica e das finalidades programáticas ligadas à pesquisa. É nesse sentido que, finalmente, as representações científicas devem ser julgadas sobretudo em vista do critério da sua utilidade, sendo o critério da verdade ou da integridade científica aspecto do primeiro.

 

5.4 TIPOS DE VARIÁVEIS

As variáveis podem ser classificadas, entre outras formas, segundo o caráter escalar dos elementos em estudo e segundo a posição que ocupam na relação entre duas ou mais variáveis.

 

5.4.1 Segundo o caráter escalar dos elementos

Sendo os valores de uma variável atributos que se distribuem entre os elementos em estudo, é preciso distinguir diferentes tipos de variáveis. Ora, esta tarefa é fácil, pois se sabe que as relações formalmente definidas entre os valores possíveis de uma variável determinam as características da representação. Ainda sem grandes conhecimentos da teoria da informação, o leitor reconhecerá que uma mera classificação com as categorias oferece menos informação do que uma medição numérica.

Portanto, uma medição quantitativa representa um nível mais alto do que uma simples classificação.

Um termo freqüentemente usado é escala. Enquanto a variável simplesmente se refere à designação de um conjunto de valores, o termo escala é mais aplicado ao se falar das relações formalmente definidas sobre o conjunto dos valores. Evidentemente, a definição dessas relações depende das regras de medição. Assim, é possível relacionar tanto os tipos de escalas, quanto os tipos de variáveis, diretamente aos níveis de medição.

A - VARIÁVEIS NOMINAIS

O tipo de variável mais simples e, ao mesmo tempo, inferior em termos de informação é a variável nominal. Os elementos do conjunto original são agrupados em classes ou categorias (classificação) distintas, obedecendo a determinado critério classificatório. Por exemplo, sexo (masculino, feminino) e estado civil (solteiro, casado, viúvo, desquitado, outros). Ditas variáveis identificam-se como nominais pois as categorias apenas servem para nomear seres, atributos ou coisas. A ordem em que aparecem as alternativas não implica hierarquia, maior ou menor distância ou proporção entre elas. Conseqüentemente, a alocação de um código numérico a essas categorias é completamente arbitrária. Assim, a única operação matematicamente possível é o cálculo de freqüências e de percentagem nas classes.

Inquestionavelmente, o estabelecimento de categorias depende do tipo de população que se deseja classificar. Por exemplo, as categorias da variável religião dependem da região geográfica onde se quer aplicá-la. Entretanto, o princípio da exaustividade (classificação de todos os elementos de uma amostra ou população) tem de ser garantido. Isso se pode alcançar agrupando-se todos os valores "irrelevantes" em uma categoria residual (usualmente, indicada pela palavra outros). Também, devem-se indicar todos os casos com informação incerta ou em uma categoria sem informação, sem opinião, sem especificação, ou sem resposta.

Finalmente, é claro que são necessárias, pelo menos, duas categorias para comparar a informação. Se todos os casos tivessem um só valor possível, não seria necessário investigá-los empiricamente. Cada categoria adicional aumenta o potencial da informação a ser incluída na representação.

Possibilidades estatísticas

O coeficiente estatístico relevante nas escalas nominais é o número de casos, porém, uma vez que se tenham formado classes ou categorias contendo vários indivíduos, pode-se determinar a classe mais numerosa, o modo e, sob certas condições, pode-se testar, pelos métodos de contingência, as hipóteses concernentes à distribuição de casos entre as classes.

Em seguida, analisar-se-á cada um dos coeficientes estatísticos possíveis de serem utilizados:

1. Número de casos

A operação matemática básica é a contagem do número de casos no interior de cada categoria e a anotação de suas freqüências.

Uma vez determinada a quantidade de elementos com o atributo que está sendo estudado e com o objetivo de estabelecer comparações entre as categorias, utilizam-se três medidas .(3)

a) Com o objetivo de poder utilizar proporções, deve-se presumir que o método de classificação tem sido tal que as categorias são mutuamente exaustivas e excludentes. Dito em outros termos, cada indivíduo tem sido colocado em uma categoria e somente em uma. As proporções são obtidas dividindo-se o número de casos em cada categoria pelo total de casos contidos no universo. Dessa maneira, o somatório das frações ou freqüências relativas obtidas deve ser igual a um.

b) As percentagens podem ser obtidas multiplicando-se as proporções simplesmente por 100. Portanto, ao utilizar as percentagens, normalizam-se as proporções em relação ao volume, calculando-se o número de indivíduos que existiria em uma categoria determinada quando o número total de casos fosse 100, permanecendo inalterada a proporção em cada categoria. Dado que as proporções somam uma unidade, é óbvio que as percentagens somarão 100, a menos que as categorias não sejam mutuamente excludentes ou exaustivas.

Ao reproduzir os resultados, as percentagens empregam-se com maior freqüência que as proporções.

Se o número de casos é pequeno, o emprego de porcentagens pode induzir a erro. Por isso, é aconselhável:

c) Outra medida utilizada é a de razões. A razão de um número A com respeito a outro número B define-se como A dividido por B. A quantidade que precede é colocada no numerador enquanto a que segue forma o denominador.

É óbvio que as proporções representam um tipo especial de razão em que o denominador é o número total de casos e o numerador certa fração deste. Sem embargo, o conceito "razão" é utilizado geralmente para referir-se a casos em que A e B representam categorias separadas e distintas.

As razões podem expressar-se em qualquer base que resulte conveniente. A base da razão está indicada pela magnitude do denominador.

2. Hipóteses de contingência

Quando o número de casos é suficientemente grande, aplica-se a Lei dos Grandes Números.(4) Dessa maneira, pode-se abranger testes que comportam proporções e, no caso de dicotomias, tratar as escalas nominais como escalas de intervalo. Em outras palavras, é possível determinar a média e o desvio-padrão da população tratada; porém, somente no caso de variáveis dicotomizadas.

Quando o número de casos é pequeno, a distribuição binomial constitui o modelo mais apropriado.

As relações entre duas ou mais escalas nominais podem ser estudadas através da prova do quiquadrado e, como um caso especial desta, quando há escalas dicotômicas e atributos perfeitamente diferenciados, o Phi de Yule, considerando-se que se pode estabelecer uma em função da outra.

B - VARIÁVEIS ORDINAIS

A variável de tipo ordinal resulta da operação de ordenar por postos. Assim, além de classificar os elementos de um conjunto, como no caso anterior, estabelece-se uma ordem hierárquica entre as categorias. A ordem resulta da distinção dos elementos de acordo com o maior ou menor grau com que possuem determinada característica. Por exemplo, se a variável "nível socioeconômico" for dividida em duas categorias (rico e pobre), está-se classificando os elementos de um conjunto. Mas a mesma variável pode ser hierarquizada:

Nesse caso, tem-se uma variável ordinal que implica uma ordem quantitativa, numérica, só em termos de maior ou menor, sem se estabelecer com precisão quanto mais alto ou mais baixo é o nível socioeconômico de uma ou outra categoria.

Possibilidades estatísticas

Além dos coeficientes estatísticos mencionados para a escala nominal, podem-se utilizar os seguintes:

l. Mediana: permite localizar a posição do caso médio quando os dados seguem um ordenamento determinado, seja este crescente ou decrescente.

2. Decis, quartis, percentis: todas essas medidas indicam as posições dos dados ao longo do contínuo estabelecido.

3. Teste de hipóteses: quiquadrado, correlação de postos.

 

A análise de variância pode ser empregada sempre que se esteja verificando uma relação entre uma escala ordinal e uma de intervalo (sendo a sua aplicação questionável).

Os coeficientes estatísticos mais conhecidos, que incluem médias e desvios padrões, não deveriam ser usados nessas escalas, porque supõem o conhecimento de algo mais que a ordem de posto relativo dos dados, isto é, a igualdade de extensão dos sucessivos intervalos da escala.

Além disso, o rigor pode resultar comprometido, mesmo se utilizando coeficientes estatísticos que são normalmente apropriados para as escalas de tipo ordinal. Assim, por exemplo, o procedimento comum para atribuir valor a um percentil por interpelação linear dentro de um intervalo de classe supõe a linearidade da escala ordinal e esta é justamente a propriedade discutida.

A correlação no ordenamento por posto aplica-se às escalas ordinais, dado que os coeficientes resultantes (por exemplo, Spearman ou de Kendall) se interpretam somente como um teste em relação ao ordenamento dos valores.

C - VARIÁVEIS INTERVALARES

As variáveis intervalares possuem as características das escalas nominais e ordinais. Além disso, apresentam distâncias iguais entre os intervalos que se estabelecem sobre a propriedade medida. Isto é, requerem o estabelecimento de algum tipo de unidade física de medição que sirva como norma e que, portanto, possa aplicar-se sucessivamente com os mesmos resultados.

A estrutura matemática da variável permanece inalterada quando se efetua a soma algébrica de uma constante; essas operações, contudo, realizam-se com os valores da variável e não com as freqüências.

Nas variáveis deste tipo, podem-se comparar as diferenças numéricas que existem entre uma e outra categoria.

 

Possibilidades estatísticas

As variáveis intervalares podem utilizar todas as medidas estatísticas usuais a menos que estas impliquem o conhecimento de um zero absoluto (inexistência natural do fenômeno estudado).

Além das medidas já descritas anteriormente, é possível utilizar as seguintes:

1. Média aritmética.

2. Desvio-padrão.

3. Correlação de postos, correlação produto-momento de Pearson.

 

D - VARIÁVEIS DE RAZÃO

São variáveis que reúnem todas as propriedades dos números naturais: classificação, ordem, distância e origem. Supõem um zero absoluto, mesmo quando o referido valor não se dá em nenhum caso em certas variáveis. Por exemplo, número de habitantes de uma cidade: podem existir cidades sem habitantes, mas é muito difícil.

Possibilidades estatísticas

Nas escalas de razão pode-se aplicar todo tipo de medidas estatísticas. Além das referidas anteriormente, para as outras escalas tem-se:

1. Média geométrica.

2. Coeficiente da variação.

3. Transformações de decibéis.

Em suma, a classificação de variáveis aqui apresentada possui uma importante estrutura interna: (5)

 
 
 
Variáveis
Propriedades        
 
Nominais
Ordinais
Intervalares
Razão
Classificação
+
+
+
+
Hierarquização
-
+
+
+
Distância
-
-
+
+
Zero Absoluto
-
-
-
+
Pode-se constatar que as propriedades são acumulativas. As variáveis mais sofisticadas possuem todas as propriedades daquelas menos sofísticadas.

Tabela 5.6. Escalas de medição.

QUADRO COMPATARIVO
 
Escala Operações Empíricas Básicas Estrutura Matemática do Grupo Estatísticas Aplicáveis (Invariantes) Exemplos Típicos
Nominal Determinação da Similitude Grupo de permutações x' = f (x) onde f (x) 

significa qualquer 

substituição de um elemento por outro

Número de casos, 

modo, 

correlação.

Numeração de jogadores de futebol, atribuição de número de classes.
Ordinal Determinação de maior ou menor. Grupo isotônico 

x' = f (x) onde f (x) significa qualquer função monotônica crescente

Mediana, 

percentil, correlação de ordem (Tipo 0).

Dureza de minerais, 

qualidade do couro, madeira, etc.

De Intervalos Determinação da igualdade ou das diferenças de intervalos. Grupo linear geral x' = ax+b Média, 

desvio-padrão correlação de ordem (tipo I) correlação de produto momento.

Temperatura em centígrados ou Farenheit, energia, datas do calendário, 

escores padronizados em testes de aptidões.

De Razão Determinação da igualdadde de razões Grupo da semelhança x' = ax Média geométrica, 

coeficiente de variação. 

Transformação de 

decibéis.

Longitude, peso, resistência etc., escala de altura dos sons, graus de inclinação.
WAINERMAN, Catalina. Escalas de Medición en Ciencias Sociales. Buenos Aires. Nueva Edición. 1976. p. 62.

As possibilidades estatísticas aumentam de acordo com a natureza da variável; as variáveis mais complexas podem ser transformadas naquelas menos complexas. Isso, todavia, não é recomendável, pois se perdem informações.

Na Tabela 5.6 apresenta-se um quadro comparativo das escalas de medição.

5.4.2 Segundo a posição na relação entre duas ou mais variáveis

Além da caracterização das variáveis segundo as possibilidades escalares dos elementos, pode-se classificá-las de acordo com a relação temporal que existe entre elas. Assim, podem-se distinguir:

Essas só podem ser compreendidas quando as variáveis se relacionam entre si.

As variáveis independentes são aquelas que afetam outras variáveis, mas não precisam estar relacionadas entre elas. Por exemplo, a idade e o sexo podem influir nos desejos de migrar do camponês. As pessoas mais jovens e de sexo masculino tenderão a migrar das zonas rurais. Sem embargo, a idade não depende do sexo. Tampouco, o sexo depende da idade. São variáveis independentes entre si, mas que afetam uma variável dependente específica. Nesse caso, o desejo de migrar.

As variáveis dependentes são aquelas afetadas ou explicadas pelas variáveis independentes. Isto é, variarão de acordo com as mudanças nas variáveis independentes. Por exemplo, à medida que a idade passa, é menos provável a migração do homem do campo. Nesse caso, o desejo de migrar depende da idade. Assim, o "desejo de migrar" é a variável dependente e "idade" a variável independente.

Em muitos casos, devido à interação que existe entre as variáveis sociais, não se pode determinar, em termos absolutos, quais são as independentes e as dependentes. A distinção feita está em mãos do pesquisador e depende dos objetivos da pesquisa. Freqüentemente, as variáveis podem ser independentes em uma investigação e dependentes em outra. Por exemplo, o "aproveitamento escolar" de uma criança depende da "posição social dos pais". Nesse caso, aproveitamento escolar" é variável dependente e "posição social" variável independente. Outro exemplo: a "posição social" depende da "renda pessoal". Nesse caso, "posição social" passa a ser variável dependente.

Como o termo indica, as variáveis intervenientes são as que, no tempo, estão entre as variáveis independentes e dependentes. Para compreender a função dessas variáveis, apresenta-se o seguinte exemplo.

Suponha-se que se deseje analisar a relação existente entre o sexo de um aluno e o seu aproveitamento escolar. Usualmente, considera-se que as mulheres têm um melhor aproveitamento que os homens. Suponha-se, também, que se colete a informação necessária e as análises preliminares apóiem a crença geral. Os conhecimentos do pesquisador, contudo, fazem-no pensar que o aproveitamento escolar está influenciado, fortemente, pelas habilidades do aluno e pelas expectativas profissionais. Conseqüentemente, coleta a informação necessária e a relação inicial (sexo - aproveitamento escolar) é analisada à luz dessas novas variáveis intervenientes.

Os efeitos das variáveis intervenientes podem ser os seguintes:

1. Não existe efeito. A relação original entre sexo (X) e aproveitamento (Y) mantém-se invariável.

 

 

2. As variáveis têm efeito significativo. A relação original desaparece.

Logicamente, pode ser que apenas uma das variáveis intervenientes tenha efeito significativo.

3. As variáveis têm efeito significativo, mas a relação original não desaparece, apenas enfraquece.

Diversas técnicas, bastante sofisticadas, têm sido estabelecidos para determinar o impacto de mais de duas variáveis intervenientes. Por exemplo, a análise de correlação parcial e múltipla, a análise de regressão múltipla, a análise de trajeto (path analysis) etc. A nossa preocupação é que o leitor identifique bem as distinções básicas aqui mencionadas (variáveis independentes, intervenientes e dependentes), em lugar de explicar ditas técnicas mais complexas, o que supõe sólidos conhecimentos estatísticos.

5.4.3 Segundo as características de continuidade das variáveis

Uma classificação particularmente importante para as ciências é aquela que divide as variáveis em discretas e contínuas.

A - VARIÁVEIS DISCRETAS

Definir uma variável como discreta significa considerá-la constituída de partes ou categorias separadas e distintas. Assim, as pessoas ou coisas são categorizadas pela presença ou ausência da característica que define a variável. Os exemplos mais simples de variáveis discretas são as dicotomias: sexo (homem-mulher); alfabetizado-analfabeto; rural-urbano; governo-oposição etc. Nas ciências sociais, todavia, as politomias (mais de duas categorias) são bastante frequentes: crença religiosa, estado civil, grau de ensino etc.

As variáveis discretas também são conhecidas como variáveis nominais, pois correspondem a um nível de medição nominal: todos os elementos de uma categoria são considerados iguais e todos recebem o mesmo nome (nominal) e o mesmo valor. No caso da variável sexo, todos os homens são iguais e todos recebem o mesmo valor, por exemplo, um. No caso da variável graus de ensino, todas as pessoas com 1o grau são iguais e recebem o valor um, as pessoas com 2o grau recebem o valor dois e as pessoas com 3o grau, o valor três.

Não existe nenhuma regra para afirmar que uma variável é, inquestionavelmente, discreta. A sua qualidade de categorização é determinada pelo pesquisador, baseado na experiência, senso comum ou qualquer outro meio. No entanto, é errado assumir que a categorização é uma condição preestabelecida. Portanto, a definição de variáveis discretas exige que o pesquisador conheça muito bem a natureza científica do processo de pesquisa. Em conseqüência, nada impede o pesquisador de considerar como contínua uma variável previamente definida como discreta.

B - VARIÁVEIS CONTINUAS

De acordo com Kerlinger, uma variável contínua é aquela que pode assumir um conjunto ordenado de valores dentro de determinados limites. Isso significa que os valores de uma variável contínua pelo menos refletem uma ordem hierárquica (variáveis ordinais). Por exemplo: alto, médio, baixo; primeiro, segundo etc.; superior, médio, inferior etc. Além disso, os valores variam dentro de determinados limites e cada elemento recebe um "escore" entre esses limites. Por exemplo, a variável aproveitamento escolar, essencialmente, varia entre zero e 10 pontos; a variável idade, entre zero e 80 anos.

Exemplos de variáveis contínuas: idade, renda mensal, número de filhos, anos de escolaridade, produção de alimentos etc.

É importante que o leitor aprenda a distinguir variáveis discretas das contínuas. As possibilidades estatísticas de ambas são diferentes. As variáveis discretas, como foi mencionado, correspondem a variáveis nominais; as variáveis contínuas, às variáveis ordinais, intervalares e de razão.(6)

5.5 FORMAS DE DETERMINAR AS RELAÇÕES ENTRE VARIÁVEIS

Além dos princípios aplicados na operacionalização de variáveis e a determinação dos tipos de variáveis, o pesquisador tem mais um problema a considerar. Como se relacionam as variáveis? Não basta dizer que a variável X está relacionada com a variável Y. Isto diz muito pouco. Se X muda, pode-se esperar mudanças em Y? Aumenta Y, quando aumenta X? Diminui Y com um aumento de X? Aumenta e, após, decresce?

Essas preocupações se esclarecem analisando-se as formas de relações entre variáveis:

5.5.1 Relações lineaires

 

Uma relação linear supõe que uma mudança na variável X produza uma mudança semelhante na variável Y. Uma relação positiva ocorre quando um aumento de X produz um aumento de Y; uma relação negativa ocorre quando um aumento de X produz um decréscimo em Y.

 

 

5.5. 2 Relações curvilineares

Considera-se curvilinear a relação entre X e Y, quando Y muda devido à influência de X até certo ponto, após o qual a mudança se inverte.

As relações curvilineares são positivas quando um aumento de X produz um aumento de Y até certo ponto, a partir do qual Y começa a decrescer.

Um exemplo típico de relação curvilinear positiva é a relação entre tamanho de uma turma e seu aproveitamento escolar. À medida que o tamanho da turma aumenta, o aproveitamento escolar também aumenta; entretanto chega-se a um momento em que o aproveitamento começa a decrescer. Uma relação curvilinear negativa ocorre quando um aumento de X produz um decréscimo de Y, até certo ponto, após o qual Y começa a crescer.

5.5.3 Relações exponenciais

Uma relação exponencial supõe que as mudanças na variável X produzem mudanças na variável Y com uma aceleração crescente. Exemplo típico é a relação entre preços de um produto e sua procura ou oferta. Seguem exemplos nas Figuras 5.4 e 5.5:

A análise da forma de relação entre as variáveis permite que o pesquisador não permaneça em simples demonstração da existência ou inexistência de associação entre elas.

A análise das formas de relação aplica-se, particularmente, às variáveis intervalares e de razão, devido às suas características.

 

 

Notas

1. DAVIS, James. A. Levantamento de dados em sociologia. Rio de Janeiro, Zahar, 1976. Ditas regras são sugestões que o autor recomenda seguir.

2. Ao final deste capítulo, aprofundam-se as relações entre variáveis.

3. Para maior aprofundamento do assunto, recomenda-se consultar livros de Estatística.

4. Em geral, à medida que aumenta o tamanho da amostra, aumenta a probabilidade de a média amostral aproximar-se da média da população.

5. DAVIS, James A. Op. cit., p. 25.

6. Para determinados tipos de análise, por exemplo a análise de regressão múltipla, as variáveis nominais dicotômicas podem ser consideradas casos especiais de variáveis intervalares, com valores zero para uma alternativa e um para a outra alternativa.

 

5 - VARIÁVEIS E PROCESSO DE PESQUISA