jueves, 11 de abril de 2019

Introducción a la Estadística



La estadística, ​ es la rama de las matemáticas que estudia la variabilidad, así como el proceso aleatorio que la genera siguiendo leyes de probabilidad.
Es la ciencia que utiliza conjuntos de datos numéricos para obtener, a partir de ellos, inferencias basadas en el cálculo de probabilidades.

Realiza un proceso de estudio que reúne, clasifica y recuenta todos los hechos que tienen una determinada característica en común, para poder llegar a conclusiones a partir de los datos numéricos extraídos, o sea que su función es recopilar y ordenar datos de fenómenos.

Esa recopilación se realiza a través de encuestas, cuestionarios, etc.

Esos fenómenos son los que explican determinadas características o comportamientos de una población o responden a preguntas sobre ella.

Experimento aleatorio es la reproducción controlada de un fenómeno, ​ existiendo incertidumbre sobre el resultado que se obtendrá.

El concepto de aleatorio está relacionado a que podemos conocer los resultados posibles, pero no exactamente podemos determinar la ponderación de cada uno de esos resultados posibles respecto de la población total, o sea que hay incertidumbre de los resultados a obtener.

Por ejemplo: si buscamos determinar la composición de mujeres y hombres de una población, sabemos que pueden ser de sexo masculino y femenino, pero no sabemos en qué proporción están distribuidos los sexos en la población.
Se trata de explicar el comportamiento de una población a través del estudio de unas muestras con las cuales se hacen inferencias sobre el total de la población.

Una población está compuesta por la totalidad de los individuos o casos que se quieren describir.

El individuo o unidad estadística es uno de los elementos que componen una población.
Ejemplos de una población:
1) los habitantes de una barrio que se quiere estudiar donde los individuos son las personas que viven en ese barrio,
2) los individuos enfermos de dicho barrio,
3)  de los enfermos totales del barrio cuales son los que tienen gripe,
4) de los votantes de un circuito, cuales votaron a tal candidato, etc.

No solamente hablamos de población de humanos sino que podemos hacer inferencias sobre la población de otros seres vivos o no u objetos, como por ejemplo: la población de animales de un bosque, la cantidad de televisores de 30 pulgadas de un barrio, las máquinas de una fábrica, cuantos fósforos de una producción prenden y cuantos fallan, etc.

Concepto de muestra
Una muestra es un conjunto representativo de la población o sea, el mundo real que queremos interpretar.

Se pueden encontrar poblaciones finitas o infinitas. Un ejemplo de finita es la cantidad de estudiantes de corredor de seguros del año pasado. Infinita puede ser la cantidad de estudiantes de la carrera pasados, presentes y futuros.

Se usan muestras representativas cuando la población es muy grande y no se pueden estudiar a todos los individuos.

La muestra está compuesta por datos.

Esos datos son cada uno de los resultados obtenidos que ayudarían a explicar el comportamiento de una población.

La muestra es de cierta forma un modelo representativo de la realidad.

La importancia de la estadística es la posibilidad de realizar inferencias a través de una muestra para sacar conclusiones de una población.

Esto trae ventajas de ahorro de tiempo, dinero, recursos, etc. al poder saber con un grado importante de seguridad de como es el comportamiento de la población en una determinada pregunta a responder.

Por ejemplo tenemos una población de un millón de habitantes y queremos saber cuál será el candidato más votado.

A través de una muestra de un número muy inferior de encuestas a individuos del total de la población, como por ejemplo mil individuos, se podría saber con cierto grado de seguridad, o margen de error, cuales son los candidatos con más probabilidades de ser los primeros.

La estadística trata de realizar una generalización de los resultados de una muestra a una población mayor.
Para que eso sea posible esa muestra debe cumplir determinadas condiciones para dar cierta seguridad de que represente a la población.

Características de una muestra estadística:
En estadística, una muestra es un subconjunto de casos o individuos de una población.

Se puede entender a la muestra estadística como la porción o parte de una población estadística que se extrae para determinado estudio. La muestra estadística suele ser una representación de toda la población con el fin de conocer y determinar los aspectos de esta.

Es el método que se utiliza cuando en diferentes poblaciones o universos no se puede aplicar un censo.
A través del muestreo se puede establecer la porción de la realidad a estudiar.

En diversas aplicaciones interesa que una muestra sea representativa y para ello debe escogerse una técnica de muestra adecuada que produzca una muestra aleatoria adecuada.

Se obtiene una muestra sesgada cuyo interés y utilidad es más limitado dependiendo del grado de sesgos que presente.

Una muestra sesgada es una muestra estadística que ha sido falsamente considerada como la típica de una población de la cual ha sido tomada.


En estadística se llama sesgo de un estimador a la diferencia entre su esperanza matemática y el valor numérico del parámetro que estima. Un estimador cuyo sesgo es nulo se llama insesgado o centrado.

El no tener sesgo es una propiedad deseable de los estimadores. Una propiedad relacionada con esta es la de la consistencia: un estimador puede tener un sesgo pero el tamaño de este converge a cero conforme crece el tamaño muestral.

La muestra debe poseer toda la información deseada para tener la posibilidad de extraerla, esto solo se puede lograr con una buena selección de la muestra y un trabajo muy cuidadoso y de alta calidad en la recolección de datos.

Una muestra representativa se llama muestra aleatoria.

La representatividad de la muestra está asociada a la forma asociada para seleccionarla y no por la muestra obtenida.
El número de sujetos que componen la muestra suele ser bastante inferior a la población total, aunque suficiente grande como para que la estimación de los parámetros determinados tenga un nivel de confianza adecuado.
El espacio muestral del que se toma una muestra concreta está formado por el conjunto de todas las posibles muestras que se pueden extraer de una población mediante una determinada técnica de muestreo.
Ejemplo de selección de muestras: supongamos que un vendedor de feria tiene 100 tomates en un cajón, algunos de ellos están en malas condiciones, supongamos que 10 están en esa condición y el resto está bien.
En un primer caso el vendedor elije para exhibir en el mostrador 20 de los buenos tomates. El comprador que ve los tomates podría hacer una inferencia de que todos los tomates están en buenas condiciones porque la muestra es 100% de tomates en condiciones. Cuando va a entregar los tomates los saca del cajón donde están los 80 tomates restantes. Allí la probabilidad de encontrar un tomate en malas condiciones es 10/80 o sea 1/8. O sea que la muestra exhibida no representa la población.
En un segundo caso el vendedor extrae tomates al azar para exhibir los tomates al público. Allí hay probabilidades de tener buenos y malos tomates y si es aleatorio su forma de selección es probable que la muestra coincida con la población de tomates total.
El comprador realizará una inferencia de que de cada 20 tomates hay 2 en malas condiciones y supondrá que la población total seguirá dicho comportamiento.
La muestra 1 es sesgada, la 2 es representativa, porque tiene más probabilidades de representar la población total de tomates.
La segunda forma de muestreo se llama muestreo aleatorio simple.
A la hora de clasificar los diferentes tipos de muestra estadística, encontramos dos que se destacan: 

Muestra probabilística y no probabilística.
Muestra probabilística
El muestreo probabilístico es el tipo más utilizado en las investigaciones, se caracteriza porque todos los elementos de la población o universo tienen probabilidad de ser parte de la muestra, por ejemplo, el censo poblacional de un país.
A su vez dentro de este tipo se derivan los siguientes:
Muestreo aleatorio simple: El método de selección más básico, en el que cada sujeto posee un número de identificación y por medio de un sorteo aleatorio son seleccionados para la muestra. Para realizarlo se debe tener claro la cantidad de sujetos que serán necesarios para completar toda la muestra.
Muestreo sistemático: La población a trabajar es enumerada y los investigadores se encargan de listar a cada individuo en grupos de 10 de forma aleatoria. Luego se elige a uno de los primeros de cada grupo al azar, formando de esta manera la muestra.
Muestreo estratificado: Se divide la población en estratos o grupos donde se compartan características similares. Luego se seleccionan proporcionalmente individuos de cada grupo.
Muestreo por conglomerados: Se da cuando la población ya se encuentra dividida de forma natural en grupos. A partir de esto se seleccionan individuos aleatoriamente de cada conglomerado o sub-grupo para conformar la muestra.

Muestra no probabilística
En la muestra no probabilística, los elementos se selecciona a través de procesos que no brindan a todos los individuos de la población las mismas oportunidades de ser elegidos para la muestra. A su vez, este deriva en los siguientes tipos de muestreo:
Muestreo por cuotas: A través de ella los investigadores forman la muestra partiendo de determinadas características con el fin de lograr en la muestra la misma distribución de características que en la población. Por ejemplo, si en una población hay 70% hombres y 30% mujeres, los individuos de la muestra deberían estar distribuidos de la misma manera.
Muestreo de conveniencia: En esta, el investigador suele elegir a los individuos de su muestra solo por proximidad a este. Generalmente, el investigador no reconoce a esta muestra como representación de toda una población, pero le permite conocer opiniones, datos e información de forma rápida.
Muestreo por bola de nieve: Esta se utiliza cuando el investigador requiere que un sujeto de su muestra ayude a identificar otro con las mismas características, y estos a otros. Formando así la muestra deseada.
Muestra discrecional: También conocido como muestreo por juicio o criterio, es cuando el investigador selecciona los individuos de su muestra en base a determinado conocimiento de la población. Por ejemplo, si desea realizar una investigación de personas con problemas psicológicos en el embarazo, seleccionará a aquellas mujeres que hayan pasado por la experiencia del embarazo.

Ejemplo de muestra estadística:
Para entender mejor esta definición de muestra, pondremos el siguiente ejemplo:
Se deberá estudiar la cantidad de personas de un millón de habitantes de una ciudad que poseen título de grado, para esto, se toma como muestra la situación de 1000 personas seleccionadas aleatoriamente entre las diferentes zonas de la ciudad.
A partir de esas 1000 personas tomadas como muestra, se estimará un promedio y en base a este se llegará a una conclusión final.

No hay comentarios:

Publicar un comentario