La estadística, es la rama de las matemáticas que estudia la
variabilidad, así como el proceso aleatorio
que la genera siguiendo leyes de probabilidad.
Es la ciencia que utiliza
conjuntos de datos numéricos para obtener, a partir de ellos, inferencias
basadas en el cálculo de probabilidades.
Realiza un proceso de estudio que
reúne, clasifica y recuenta todos los hechos que tienen una determinada
característica en común, para poder llegar a conclusiones a partir de los datos
numéricos extraídos, o sea que su función es recopilar y ordenar datos de
fenómenos.
Esa recopilación se realiza a
través de encuestas, cuestionarios, etc.
Esos fenómenos son los que explican determinadas características o
comportamientos de una población o responden a preguntas sobre ella.
Experimento aleatorio es la reproducción controlada de un
fenómeno, existiendo incertidumbre sobre el resultado que se
obtendrá.
El concepto de aleatorio está relacionado a que podemos
conocer los resultados posibles, pero no exactamente podemos determinar la
ponderación de cada uno de esos resultados posibles respecto de la población
total, o sea que hay incertidumbre de los resultados a obtener.
Por ejemplo: si buscamos
determinar la composición de mujeres y hombres de una población, sabemos que
pueden ser de sexo masculino y femenino, pero no sabemos en qué proporción están
distribuidos los sexos en la población.
Se trata de explicar el
comportamiento de una población a través del estudio de unas muestras con las
cuales se hacen inferencias sobre el total de la población.
Una población está compuesta por
la totalidad de los individuos o casos que se quieren describir.
El individuo o unidad estadística es uno de los elementos que componen
una población.
Ejemplos de
una población:
1) los
habitantes de una barrio que se quiere estudiar donde los individuos son las
personas que viven en ese barrio,
2) los
individuos enfermos de dicho barrio,
3) de los enfermos totales del barrio cuales son
los que tienen gripe,
4) de los
votantes de un circuito, cuales votaron a tal candidato, etc.
No solamente hablamos de
población de humanos sino que podemos hacer inferencias sobre la población de
otros seres vivos o no u objetos, como por ejemplo: la población de animales de
un bosque, la cantidad de televisores de 30 pulgadas de un barrio, las máquinas
de una fábrica, cuantos fósforos de una producción prenden y cuantos fallan, etc.
Concepto de muestra
Una muestra es un conjunto representativo de la población o sea, el
mundo real que queremos interpretar.
Se pueden encontrar poblaciones
finitas o infinitas. Un ejemplo de finita es la cantidad de estudiantes de
corredor de seguros del año pasado. Infinita puede ser la cantidad de estudiantes
de la carrera pasados, presentes y futuros.
Se usan muestras representativas
cuando la población es muy grande y no se pueden estudiar a todos los
individuos.
La muestra está compuesta por datos.
Esos datos son cada uno de los
resultados obtenidos que ayudarían a explicar el comportamiento de una población.
La muestra es de cierta forma un modelo representativo de la realidad.
La importancia de la estadística
es la posibilidad de realizar inferencias a través de una muestra para sacar
conclusiones de una población.
Esto trae ventajas de ahorro de
tiempo, dinero, recursos, etc. al poder saber con un grado importante de
seguridad de como es el comportamiento de la población en una determinada
pregunta a responder.
Por ejemplo tenemos una población
de un millón de habitantes y queremos saber cuál será el candidato más votado.
A través de una muestra de un número
muy inferior de encuestas a individuos del total de la población, como por
ejemplo mil individuos, se podría saber con cierto grado de seguridad, o margen
de error, cuales son los candidatos con más probabilidades de ser los primeros.
La estadística trata de realizar
una generalización de los resultados de una muestra a una población mayor.
Para que eso sea posible esa
muestra debe cumplir determinadas condiciones para dar cierta seguridad de que
represente a la población.
Características de una muestra estadística:
En estadística, una muestra es un
subconjunto de casos o individuos de una población.
Se puede entender a la muestra
estadística como la porción o parte de una población estadística que se extrae
para determinado estudio. La muestra estadística suele ser una representación
de toda la población con el fin de conocer y determinar los aspectos de esta.
Es el método que se utiliza
cuando en diferentes poblaciones o universos no se puede aplicar un censo.
A través del muestreo se
puede establecer la porción de la realidad a estudiar.
En diversas aplicaciones interesa
que una muestra sea representativa y
para ello debe escogerse una técnica de muestra adecuada que produzca
una muestra aleatoria adecuada.
Se obtiene una muestra sesgada cuyo interés y utilidad
es más limitado dependiendo del grado de sesgos que presente.
Una muestra sesgada es una muestra estadística que ha sido falsamente
considerada como la típica de una población de la cual ha sido tomada.
En estadística se llama sesgo de un estimador a la diferencia
entre su esperanza matemática y el valor numérico del parámetro que estima. Un
estimador cuyo sesgo es nulo se llama insesgado o centrado.
El no tener sesgo es una propiedad deseable de los estimadores. Una propiedad relacionada con esta es la de la consistencia: un estimador puede tener un sesgo pero el tamaño de este converge a cero conforme crece el tamaño muestral.
La muestra debe poseer toda la
información deseada para tener la posibilidad de extraerla, esto solo se
puede lograr con una buena selección de la muestra y un trabajo muy
cuidadoso y de alta calidad en la recolección de datos.
Una muestra representativa se
llama muestra aleatoria.
La representatividad de la muestra
está asociada a la forma asociada para seleccionarla y no por la muestra
obtenida.
El número de sujetos que componen
la muestra suele ser bastante inferior a la población total, aunque suficiente
grande como para que la estimación de los parámetros determinados tenga un nivel
de confianza adecuado.
El espacio muestral del que se
toma una muestra concreta está formado por el conjunto de todas las posibles
muestras que se pueden extraer de una población mediante una determinada
técnica de muestreo.
Ejemplo de selección de muestras: supongamos
que un vendedor de feria tiene 100 tomates en un cajón, algunos de ellos están
en malas condiciones, supongamos que 10 están en esa condición y el resto está
bien.
En un primer
caso el vendedor elije para exhibir en el mostrador 20 de los buenos tomates.
El comprador que ve los tomates podría hacer una inferencia de que todos los
tomates están en buenas condiciones porque la muestra es 100% de tomates en
condiciones. Cuando va a entregar los tomates los saca del cajón donde están
los 80 tomates restantes. Allí la probabilidad de encontrar un tomate en malas
condiciones es 10/80 o sea 1/8. O sea que la muestra exhibida no representa la
población.
En un segundo
caso el vendedor extrae tomates al azar para exhibir los tomates al público. Allí
hay probabilidades de tener buenos y malos tomates y si es aleatorio su forma
de selección es probable que la muestra coincida con la población de tomates
total.
El comprador
realizará una inferencia de que de cada 20 tomates hay 2 en malas condiciones y
supondrá que la población total seguirá dicho comportamiento.
La muestra 1
es sesgada, la 2 es representativa, porque tiene más probabilidades de
representar la población total de tomates.
La segunda
forma de muestreo se llama muestreo aleatorio
simple.
A la hora de clasificar los
diferentes tipos de muestra estadística,
encontramos dos que se destacan:
Muestra
probabilística y no probabilística.
Muestra probabilística
El muestreo probabilístico es el
tipo más utilizado en las investigaciones, se caracteriza porque todos los
elementos de la población o universo tienen probabilidad de ser parte de la
muestra, por ejemplo, el censo poblacional de un país.
A su vez dentro de este tipo se
derivan los siguientes:
Muestreo aleatorio simple: El método de
selección más básico, en el que cada sujeto posee un número de identificación y
por medio de un sorteo aleatorio son seleccionados para la muestra. Para
realizarlo se debe tener claro la cantidad de sujetos que serán necesarios para
completar toda la muestra.
Muestreo sistemático: La población a
trabajar es enumerada y los investigadores se encargan de listar a cada
individuo en grupos de 10 de forma aleatoria. Luego se elige a uno de los
primeros de cada grupo al azar, formando de esta manera la muestra.
Muestreo estratificado: Se divide la
población en estratos o grupos donde se compartan características similares.
Luego se seleccionan proporcionalmente individuos de cada grupo.
Muestreo por conglomerados: Se da
cuando la población ya se encuentra dividida de forma natural en grupos. A
partir de esto se seleccionan individuos aleatoriamente de cada conglomerado o
sub-grupo para conformar la muestra.
Muestra no probabilística
En la muestra no probabilística,
los elementos se selecciona a través de procesos que no brindan a todos los
individuos de la población las mismas oportunidades de ser elegidos para la
muestra. A su vez, este deriva en los siguientes tipos de muestreo:
Muestreo por cuotas: A través de ella
los investigadores forman la muestra partiendo de determinadas características
con el fin de lograr en la muestra la misma distribución de características que
en la población. Por ejemplo, si en una población hay 70% hombres y 30%
mujeres, los individuos de la muestra deberían estar distribuidos de la misma
manera.
Muestreo de conveniencia: En esta, el
investigador suele elegir a los individuos de su muestra solo por proximidad a
este. Generalmente, el investigador no reconoce a esta muestra como
representación de toda una población, pero le permite conocer opiniones, datos
e información de forma rápida.
Muestreo por bola de nieve: Esta se
utiliza cuando el investigador requiere que un sujeto de su muestra ayude a
identificar otro con las mismas características, y estos a otros. Formando así
la muestra deseada.
Muestra discrecional: También conocido
como muestreo por juicio o criterio, es cuando el investigador selecciona los
individuos de su muestra en base a determinado conocimiento de la población.
Por ejemplo, si desea realizar una investigación de personas con problemas
psicológicos en el embarazo, seleccionará a aquellas mujeres que hayan pasado
por la experiencia del embarazo.
Ejemplo de muestra estadística:
Para entender
mejor esta definición de muestra, pondremos el siguiente ejemplo:
Se deberá
estudiar la cantidad de personas de un millón de habitantes de una ciudad que
poseen título de grado, para esto, se toma como muestra la situación de 1000
personas seleccionadas aleatoriamente entre las diferentes zonas de la ciudad.
A partir de
esas 1000 personas tomadas como muestra, se estimará un promedio y en base a
este se llegará a una conclusión final.