lunes, 29 de septiembre de 2008
Vinculos de Videos de Probabilidad
http://www.youtube.com/results?search_query=videos+de+probabilidad&search_type
http://es.youtube.com/watch?v=fFbY6dPOacMhttp://es.youtube.com/watch?v=wE7bheOS1pQ
http://es.youtube.com/watch?v=JJkRnso1sZs&feature=related
jueves, 25 de septiembre de 2008
TEORIA DE LA PROBABILIDAD
Es la teoría matemática que modela los fenómenos aleatorios. Estos deben contraponerse a los fenómenos determinísticos, en los cuales el resultado de un experimento, realizado bajo condiciones determinadas, produce un resultado único o previsible: por ejemplo, el agua calentada a 100 grados centígrados, a presión normal, se transforma en vapor. Un fenómeno aleatorio es aquel que, a pesar de realizarse el experimento bajo las mismas condiciones determinadas, tiene como resultados posibles un conjunto de alternativas, como el lanzamiento de un dado o de una moneda.
Los procesos reales que se modelizan como procesos aleatorios pueden no serlo realmente; cómo tirar una moneda o un dado no son procesos aleatorios en sentido estricto, ya que no se reproducen exactamente las mismas condiciones iniciales que lo determinan, sino sólo unas pocas. En los procesos reales que se modelizan mediante distribuciones de probabilidad corresponden a modelos complejos donde no se conocen a priori todos los parámetros que intervienen; ésta es una de las razones por las cuales la estadística, que busca determinar estos parámetros, no se reduce inmediatamente a la teoría de la probabilidad en sí.
En 1933, el matemático soviético Andréi Kolmogórov propuso un sistema de axiomas para la teoría de la probabilidad, basado en la teoría de conjuntos y en la teoría de la medida, desarrollada pocos años antes por Lebesgue, Borel y Frechet entre otros.
Esta aproximación axiomática que generaliza el marco clásico de la probabilidad, la cual obedece a la regla de cálculo de casos favorables sobre casos posibles, permitió la rigorización de muchos argumentos ya utilizados, así como el estudio de problemas fuera de los marcos clásicos. Actualmente, la teoría de la probabilidad encuentra aplicación en las más variadas ramas del conocimiento, como puede ser la física (donde corresponde mencionar el desarrollo de las difusiones y el movimiento Browniano), o las finanzas (donde destaca el modelo de Black y Scholes para la valuación de acciones).
Probabilidad
Mide la frecuencia con la que ocurre un resultado en un experimento bajo condiciones suficientemente estables. La teoría de la probabilidad se usa extensamente en áreas como la estadística, la matemática, la ciencia y la filosofía para sacar conclusiones sobre la probabilidad de sucesos potenciales y la mecánica subyacente de sistemas complejos.
COMENTARIO:
NOS SIRVE PARA REALIZAR EXPERIMENTOS Y ESTE EXPERIMENTO DEBE SER DE TIPO ALEATORIO ES DECIR QUE SE PUEDE PRESENTAR DE DIVERSOS RESULTADOS.
TIPOS DE CONJUNTOS
CONJUNTO VACIÓ O NULO: Es aquel que no tiene elementos y se simboliza por o { }.
A = {x2 + 1 = 0 x R}
El conjunto A, es un conjunto vacío por que no hay ningún número real que satisfaga a x2+1 = 0
CONJUNTO UNIVERSAL: Es el conjunto de todos los elementos considerados en una población o universo, en un problema en especial. No es único, depende de la situación, denotado por U o .
RELACIONES ENTRE CONJUNTOS
IGUALDAD DE CONJUNTOS
Considerando el conjunto A y el conjunto B, si ambos tienen los mismos elementos, es decir, si
cada elemento que pertenece a A también pertenece a B y si cada elemento que pertenece a B
pertenece también a A. A = B
SUBCONJUNTO
Si todo elemento de un conjunto A es también elemento de un conjunto B, entonces se dice que A es un subconjunto de B. Representado por el símbolo . A B o B A
SUBCONJUNTOS PROPIOS
Se dice que es un subconjunto propio de A sí todos los elementos de un conjunto B se encuentran
incluidos en él A, denotado por .
A B o B A
TEORIA DE CONJUNTOS
TEORÍA DE CONJUNTOS
CONJUNTOS Y TÉCNICAS DE CONTEO
DEFINICIÓN Y NOTACIÓN DE CONJUNTOS
El término conjunto juega un papel fundamental en el desarrollo de las matemáticas modernas;
Además de proporcionar las bases para comprender con mayor claridad algunos aspectos de la teoría de la probabilidad. Su origen se debe al matemático alemán George Cantor (1845 – 1918).
Podemos definir de manera intuitiva a un conjunto, como una colección o listado de objetos con
características bien definidas que lo hace pertenecer a un grupo determinado.
Para que exista un conjunto debe basarse en lo siguiente:
La colección de elementos debe estar bien definida.
Ningún elemento del conjunto se debe contar más de una vez, generalmente, estos elementos
deben ser diferentes, si uno de ellos se repite se contará sólo una vez.
El orden en que se enumeran los elementos que carecen de importancia.
NOTACIÓN
A los conjuntos se les representa con letras mayúsculas A, B, C, ... y a los elementos con letras
minúsculas a, b, c, ..., por ejemplo, el conjunto A cuyos elementos son los números en el
lanzamiento de un dado.
A = { 1, 2, 3, 4, 5, 6 }
En base a la cantidad de elementos que tenga un conjunto, estos se pueden clasificar en conjuntos
finitos e infinitos.
FINITOS: Tienen un número conocido de elementos, es decir, se encuentran determinados por su longitud o cantidad. El conjunto de días de la semana
INFINITOS: Son aquellos en los cuales no podemos determinar su longitud.
El conjunto de los números reales
Existen dos formas comunes de expresar un conjunto y la selección de una forma particular de
expresión depende de la conveniencia y de ciertas circunstancias siendo:
EXTENSIÓN: Cuando se describe a cada uno de los elementos.
A = {a, e, i, o, u}
TEORIA DE CONTEO
nos sirven para calcular la probabilidad de un evento cuando el numero de eventos posibles es demasiado grande.
COMENTARIO;
ESTE ES MUY IMPORTANTE YA QUE EN PERMUTACIONES Y COMBINACIONES NOS SIRVE Y ES DE MUCHA UTILIDAD PARA QUE SEAMOS MAS EXACTOS A LA HORA DE REALIZAR UN EVENTO.
TECNICAS DE CONTEO
Debes recordar la regla principal en las Técnicas de Conteo como lo es la ley de multiplicación:
Si se tienen n elementos de un tipo y m de otro, el número de parejas que se pueden formar tomando un elemento de cada tipo es
mxn.
Las permutaciones, las variaciones y las combinaciones, resultan de la regla de multiplicación.
COMENTARIO:
EN ESTA TECNICA LO MAS IMPORTANTE ES LA YAMADA LEY DE MULTIPLICACION.
martes, 23 de septiembre de 2008
AXIOMAS
Los axiomas de probabilidad son las condiciones mínimas que deben verificarse para que una función que definimos sobre unos sucesos determine consistentemente valores de probabilidad sobre dichos sucesos.
La probabilidad P de un suceso E, denotada por P(E), se define con respecto a un "universo" o espacio muestral Ω, conjunto de todos los posibles sucesos elementales, tal que P verifique los Axiomas de Kolmogórov, enunciados por el matemático ruso de este nombre en 1933. En este sentido, el suceso E es, en términos matemáticos, un subconjunto de Ω.
COMENTARIO:NOS SIRVEN PARA VER UN EVENTO EN SU RESULTADO POSIBLE O UN GRUPO DE RESULTADOS POSIBLES DE UN EXPERIMENTO, Y ES LA MINIMA UNIDAD DE ANALISIS PARA EFECTOS DE CALCULO PROBABILISTICO.
ESPERANZA MATEMATICA
Por ejemplo, en un juego de azar el valor esperado es el beneficio medio
COMENTARIO:
ESTA NOS SIRVE PARA CALCULAR EL PROMEDIO DE RESULTADOS O EXPERIMENTOS PONDERADOS POR LA PROBABILIDAD DE QUE SUCEDA CADA UNO DE LOS RESULTADOS POSIBLES Y ESTA PERMITE COMPARAR DOS O MAS ALTERNATIVAS.
viernes, 29 de agosto de 2008
COMBINACIONES
Las combinaciones son aquellas formas de agrupar los elementos de un conjunto teniendo en cuenta que:
NO influye el orden en que se colocan.
Si permitimos que se repitan los elementos, podemos hacerlo hasta tantas veces como elementos tenga la agrupación. Existen dos tipos: combinaciones sin repetición y combinaciones con repetición, cuyos símbolos son los siguientes.
sábado, 23 de agosto de 2008
DIAGRAMA EN ARBOL
jueves, 21 de agosto de 2008
DIFERENCIA ENTRE CONBINACION Y PERMUTACIO
miércoles, 20 de agosto de 2008
PERMUTACIONES CON REPETICION Y SIN REPETICION
Permutaciones CON repetición:
Llamamos a las permutaciones con repetición de n elementos tomados de a en a, de b en b, de c en c, etc, cuando en los n elementos existen elementos repetidos (un elemento aparece a veces, otro b veces, otro c veces, etc) verificándose que a+b+c+...=n.
COMENTARIO:
PARA SABER SI UNA PERMUTACION ES CON O SIN REPETICION ES MUY SIMPLE PORQUE SE DISE QUE ES CON REPETICION CUANDO ALGUN ELEMENTO SE REPITE VARIAS VECES Y ES SIN REPETICION PORQUE NO SE REPITE.
PERMUTACIONES
Las permutaciones o, tambien llamadas, ordenaciones son aquellas formas de agrupar los elementos de un conjunto teniendo en cuenta que:
Influye el orden en que se colocan.
Tomamos todos los elementos de que se disponen.
Serán Permutaciones SIN repetición cuando todos los elementos de que disponemos son distintos.
Serán Permutaciones CON repetición si disponemos de elementos repetidos. (Ese es el nº de vaces que se repite elemento en cuestión). Es por ello que también se llaman ordenaciones. Los símbolos que utilizamos son los siguientes
VARIACIONES
Las variaciones son aquellas formas de agrupar los elementos de un conjunto teniendo en cuenta que:
Influye el orden en que se colocan.
Si permitimos que se repitan los elementos, podemos hacerlo hasta tantas veces como elementos tenga la agrupación. Existe dos tipos: variaciones sin repetición y variaciones con repetición,
FORMULA DE VARIACIONES SIN REPETICION
FORMULA DE VARIACIONES CON REPETICION
COMENTARIO:
LAS VARIACIONES SON AQUELLAS OPERACIONES QUE FUNCIONAN CON EL VALOR DE OTRO FUNCION Y TAMBIEN NOS SIRVE EN PERMUTACION, YA QUE SI HAY PERMUTACION ENTONCES EXISTE UNA VARIACION.
Que es Combinatoria
La Combinatoria es la parte de las Matemáticas que estudia las diversas formas de realizar agrupaciones con los elementos de un conjunto, formándolas y calculando su número.
Vamos a aprender a realizar esas agrupaciones y calcular cuántas podemos hacer.
Existen distintas formas de realizar estas agrupaciones, según se repitan los elementos o no, según se puedan tomar todos los elementos de que disponemos o no y si influye o no el orden de colocación de los elementos:
Variaciones sin repetición.
Variaciones con repetición.
Permutaciones sin repetición.
Permutaciones con repetición.
Combinaciones sin repetición.
Combinaciones con repetición.
Una vez que averigüe de qué tipo son, puede realizar cálculos combinatorios, para calcular cuántas agrupaciones de ese tipo hay.
COMENTARIO:
ES A FORMA QUE NOS AYUDA A REALIZAR LAS AGRUPACIONES DE LOS ELEMENTOS DE UN CONJUNTO Y TAMBIEN NOS AYUDA A CALCULAR EL NUMERO DE CADA ELEMENTO Y TAMBIEN PODEMOS APRENDER A REALIZAR VARIAS AGRUPACIONES.
martes, 12 de agosto de 2008
Combinacion y permutacion
COMBINACIÓN:
Es todo arreglo de elementos en donde no nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo.
PERMUTACIÓN:
Es todo arreglo de elementos en donde nos interesa el lugar o posición que ocupa cada uno de los elementos que constituyen dicho arreglo.
Para ver de una manera objetiva la diferencia entre una combinación y una permutación, plantearemos cierta situación.
Suponga que un salón de clase está constituido por 35 alumnos. a) El maestro desea que tres de los alumnos lo ayuden en actividades tales como mantener el aula limpia o entregar material a los alumnos cuando así sea necesario.
COMENTARIO:
NOS SIRVEN PARA VER LA IMPORTANCIA DE UN LUGAR O POSICION Y PARA VER LA MANERA OBJETIVA DE DIFERENCIA QUE EXISTE ENTRE COMBINACION Y PERMUTACION
sábado, 9 de agosto de 2008
TEORIA DE CONJUNTOS
El concepto de conjunto es intuitivo y se podría definir como una "colección de objetos"; así, se puede hablar de un conjunto de personas, ciudades, lapiceros o del conjunto de objetos que hay en un momento dado encima de una mesa. Un conjunto está bien definido si se sabe si un determinado elemento pertenece o no al conjunto. El conjunto de los bolígrafos azules está bien definido, porque a la vista de un bolígrafo se puede saber si es azul o no. El conjunto de las personas altas no está bien definido, porque a la vista de una persona, no siempre se podrá decir si es alta o no, o puede haber distintas personas, que opinen si esa persona es alta o no lo es. En el siglo XIX, según Frege, los elementos de un conjunto se definían sólo por tal o cual propiedad. Actualmente la teoría de conjuntos está bien definida por el sistema ZFC. Sin embargo, sigue siendo célebre la definición que publicó Cantor
lunes, 30 de junio de 2008
Minimos cuadrados
es una técnica de optimización matemática que, dada una serie de mediciones, intenta encontrar una función que se aproxime a los datos (un "mejor ajuste"). Intenta minimizar la suma de cuadrados de las diferencias ordenadas (llamadas residuos) entre los puntos generados por la función y los correspondientes en los datos. Específicamente, se llama mínimos cuadrados promedio (LMS) cuando el número de datos medidos es 1 y se usa el método de descenso por gradiente para minimizar el residuo cuadrado. Se sabe que LMS minimiza el residuo cuadrado esperado, con el mínimo de operaciones (por iteración). Pero requiere un gran número de iteraciones para converger.
COMENTARIO:
NOS SIRVE PARA ENCONTRAR FUNCIONES QUE SE APROXIMEN ALOS DATOS Y DARLES UN AJUSTE MUCHO MEJOR, TAMBIEN INTENTA MINIMIZAR LA SUMA DE CUADRADOS DE LAS DIFERENCIAS ORDENANDAS.
TENDENCIA ESTOCASTICA
ES AQUELLA CUYO VALOR SOLO PUEDE SABERSE CON EXACTITUD UNA VEZ QUE ESTE SE HAYA OBSERVADO.
SIRVE PARA ANALIZAR LAS PROPIEDADES DE LOS METODOS DE PREDICCIÓN BAJO DOS ESQUEMAS DISTINTOS, ARTIFICIALMENTE, SU RELEVANCIA DEPENDE DEL REALISMO DE LOS DATOS ARTIFICIALES.
COMENTARIO:
ESTA NOS SIRVE PARA REPRESENTAR
PROCEDIMIENTOS ELEGANTES Y
SIRVE PARA DESCOMPONER SERIES
DE TIEMPO Y SU VALOR SOLO
PUEDE SABERSE CON EXACTITUD.
TENDENCIA CONSTANTE
COMENTARIO:
UNA TENDENCIA CONSTANTE TIENE
QUE SER IGUAL A CERO, CUANDO SE
OBTIENEN ESTIMACIONES Y ASI SERA
MUCHO MAS EXACTA SU TENDENCIA
Series temporales estacionarias
AUNQUE SUFRA OTRAS OSILACIONES EN TORNO A
ESE VALOR MEDIO FIJO O CONSTANTE.
ES CUANDO LA SERIE ESTACIONARIA Y LA
VARIAVILIDAD DE LA MEDIA SE MANTIENEN
CONSTANTES A LO LARGO DEL TIEMPO.
UNA SERIE ES ESTACIONARIA CUANDO SU
VALOR MEDIO SE MANTIENE ESTABLE.
COMENTARIO:
EN LA SERIE ESTACIONARIA LOS
DATOS VARIAN ALREDEDOR DEL
MISMO VALOR MEDIO Y SIEMPRE
TIENEN LA MISMA VARIAVILIDAD
Series de tiempo no estacionarias
Es aquella que sistematicamente crece odismiuye en el tiempo
Las relaciones entre si, pueden estar sesgadas.
La media y la variabilidad cambisn con el tiempo.
El cambio de la media se traduce en la presentia de una tendencia,
a la serie a crecer o decrecer.
COMENTARIO:
Las series temporales no estacionarias
son aquellas que varian conforme
al clima y al tiempo, estas disminuyen
sistematicamente.
miércoles, 11 de junio de 2008
SERIES DE TIEMPO
Series de Tiempo
Una serie temporal o cronologica es un conjunto e observaciones de una variable, ordenadas segu transcurre el tiempo.
En una serie de tiempo las observaciones no se deben ordenar de mayor a menor debidoa que se perderia el grueso de la informacion debido a que nos intersea detectar como se mueve la variable en el tiempo es muy importante respetar la secuencia temporal de las observaciones.
EJEMPLOS DE SERIES DE TIEMPO
Par realizar la reprsenyacion de una serie ytemporal se debe realizae mediante una gráfica de dispersión x-y
Componetes de una serie temporal
Tendencia
La tendencia es un movimiento de larga duración que muestra la evolucion general de laserie en el tiempo.
La tedencia es un movimiento que puede ser estacionario o ascendente, y su recorrido, una linea recta o una curva.
La tendencia es un movimiento que puede ser estacionario o ascendente o descendete
COMENTARIO:Ejemplo de Ecuaciones que representan varios tipos de regresion
REGRESION Y CORRELACION
La regresión y la correlación son dos técnicas estrechamente relacionadas y comprenden una forma de estimación.
En forma más especifica el análisis de correlación y regresión comprende el análisis de los datos muestrales para saber que es y como se relacionan entre si dos o mas variables en una población. El análisis de correlación produce un número que resume el grado de la correlación entre dos variables; y el análisis de regresión da lugar a una ecuación matemática que describe dicha relación.
El análisis de correlación generalmente resulta útil para un trabajo de exploración cuando un investigador o analista trata de determinar que variables son potenciales importantes, el interés radica básicamente en la fuerza de la relación. La correlación mide la fuerza de una entre variables; la regresión da lugar a una ecuación que describe dicha relación en términos matemáticos.
Los datos necesarios para análisis de regresión y correlación provienen de observaciones de variables relacionadas.
Regresión lineal
La regresión lineal simple comprende el intento de desarrollar una línea recta o ecuación matemática lineal que describe la reacción entre dos variables.
La regresión puede utilizadas de diversas formas. Se emplean en situaciones en la que las dos variables miden aproximadamente lo mismo, pero en las que una variable es relativamente costosa, o, por el contrario, es poco interesante trabajar con ella, mientras que con la otra variable no ocurre lo mismo.
La finalidad de una ecuación de regresión seria estimar los valores de una variable con base en los valores conocidos de la otra.
Otra forma de emplear una ecuación de regresión es para explicar los valores de una variable en término de otra. Es decir se puede intuir una relación de causa y efecto entre dos variables. El análisis de regresión únicamente indica qué relación matemática podría haber, de existir una. Ni con regresión ni con la correlación se pude establecer si una variable tiene “causa “ciertos valores de otra variable.
Ecuación Lineal
Dos características importantes de una ecuación lineal
la independencia de la recta
la localización de la recta en algún punto. Una ecuación lineal tiene la forma
y = a + bx
En la que a y b son valores que se determina a partir de los datos de la muestra; a indica la altura de la recta en x= 0, y b señala su pendiente. La variable y es la que se habrá de predecir, y x es la variable predictora.
COMENTARIO:
Nos sirve para comprender datos muestrales y saber en que y como se relacionan dos o mas variables de una poblacion, esto es util para cualquier tipo de investigacion cuando los investigadores tratan de determinar que variables son importantes.
lunes, 26 de mayo de 2008
Teorema de Sheppard
Al sacar el intervalo y amplitud puede haber un error a la hora del agrupamiento.
COMENTARIO:
Es uana tecnica muy buena aunque a veces no debe usarse ya que tiende a que no les de lo que en verdad se necesita.
Relacion del diagrama y la curva
COMENTARIO:
Los dos son muy importantes ya que en los dos se puede localizar la media, la mediana y los cuartiles
Caracteristicas del Diagrama
- Contiene dos bigotes a los lados del rectangulo.
- Mientras mas larga es la caja y os bigotes, mas larga es la dispersion de datos.
- Puede dibujarse de forma vertical y horozontal.
- La media tambien puede coincidir con los cuatiles.
Diagrama de Cajas
COMENTARIO:
Al Diagrama de cajas tambien se le conoce como BOXPLOT, este describe varias caracteristicas importantes de un conjunto de datos tanto como el alejamiento de una simetria y la identificacion de valores que se encuentran extremadamente alejados de la dispersion.
sábado, 19 de abril de 2008
Valores estandarizados (Z)
Describe la posicion de una observacion "X" relativa a la media en unidades de la desviacion estandar.
COMENTARIO:
Es la distancia que se encuentra por encima o por debajo de la media, en unidades de la desviacion estandar. Es un proceso para obtener valores comparados con distintas distribuciones, para obtener un valor estandarizado osea (Z).
Distribucion de Porcentaje bajo la curva
COMENTARIO:
Esta distribucion es la mas usada en estadistica ya que es asimetrica y tiene forma de campana y esto favorece su aplicacion como modelo a gran numero de variables estadisticas.
Area bajo la Curva Normal
Es el area que esta bajo la curva y la linea base, contiene el 100% en todos los casos en una distribucion normal.
COMENTARIO:
El area bajo la curva consiste en calcular el àrea que se pide entre dos partes. Tambien existen algunas funciones llamadas: Funciones de Primer Grado cuya representacion es una linea perfectamente recta y asi se puede calcular el àrea bajo la curva en una forma exacta.
jueves, 27 de marzo de 2008
Escalas de Medicion
Todo problema de investigación científica, aún el más abstracto, implica de algún modo una tarea de medición de los conceptos que intervienen en el mismo. Porque si tratamos con objetos como una especie vegetal o un comportamiento humano nos veremos obligados ya sea a describir sus características o a relacionarse éstas con otras con las que pueden estar conectadas: en todo caso tendremos que utilizar determinadas variables –tamaño, tipo de flor, semilla, o las variables que definan el comportamiento de estudio- y tendremos que encontrar el valor que éstas asumen en el caso estudiado. En eso consiste, desde el punto de vista lógico más general, la tares de medir.
La idea de medición, de medida, es intrínsicamente comparativa. Medir algo, en el caso más sencillo, es determinar cuantas veces una cierta unidad o patrón de medida, cabe en el objeto a medir. Para medir la longitud de un objeto físico nosotros desplazamos una regla o cinta graduada sobre el mismo, observando cuantas unidades (en este caso centímetros o metros) abarca el objeto en cuestión. Es decir que comparamos el objeto con nuestro patrón de medición para determinar cuántas unidades y fracciones del mismo incluye.
La medición de variables no físicas resulta, en esencia, un proceso idéntico al anterior. La dificultad reside en que las variables de este tipo no pueden medirse con escalas tan sencillas como las lineales y en que, por otra parte, no existen para su comparación patrones de medida universalmente definidos y aceptados. Si deseamos medir el peso de un objeto podremos expresar el valor del mismo en kilogramos, libras o cualquier unidad que, de todas maneras, tiene un equivalente fijo y constante con las otras que utilizan. En cambio para medir el grado de autoritarismo de un dirigente no existe ni una unidad ni una escala generalmente reconocidas, por lo que el investigador se ve obligado a elegir alguna escala de las que se han utilizado en otros trabajos o, lo que es bastante frecuente, a construir una adaptada a sus necesidades específicas. Resulta evidente, además, que el grado de autoritarismo no es una variable simple como el peso y la longitud, sino una resaltante compleja de una multitud de acciones y actitudes parciales. Por esta razón, medir un concepto complejo implica realizar una serie de operaciones que no tienen lugar en el caso de variables como el peso o la longitud; será necesario definir las dimensiones que integran la variable, encontrar indicadores diversos que la reflejen y construir luego una escala apropiada para el caso.
Una escala puede concebirse como un continuo de valores ordenados correlativamente que admite un punto inicial y otro final. Si evaluamos el rendimiento académico de estudiantes podemos asignar el valor cero al mínimo rendimiento imaginable al respecto; al mayor rendimiento posible podemos atribuirle un valor de 100, 20, 10 o 7 puntos, según resulte más práctico. Con estos dos valores tendríamos ya marcados los límites de nuestra escala; para concluir de confeccionarla será necesario asignar a los posibles rendimientos intermedios puntajes también intermedios. Con ello obtendremos una escala capaz de medir la variable rendimiento académico a través de los indicadores concretos de los trabajos presentados por los estudiantes, de sus exámenes, pruebas y otras formas de evaluación posibles.
Para que una escala pueda considerarse como capaz de aportar información objetiva debe reunir los dos siguiente requisitos básicos:
Confiabilidad: se refiere a la consistencia interior de la misma, a su capacidad para discriminar en forma constante entre un valor y otro."Cabe confiar en una escala – anotan Goode y Hatt- cuando produzca constantemente los mismos resultados al aplicarla a una misma muestra", es decir, cuando siempre los mismos objetos aparezcan valorados en la misma forma.
Validez: indica la capacidad de la escala para medir las cualidades para las cuales ha sido construida y no otras parecidas. Una escala confusa no puede tener validez, lo mismo que en una escala que esté midiendo, a la vez e indiscriminadamente, distintas variables superpuestas. "Una escala tiene validez cuando verdaderamente mide lo que afirma medir".
Existen diferentes tipos de escalas que se distinguen de acuerdo a la rigurosidad con que han sido construidas y al propio comportamiento de las variables que miden. Se acostumbra a clasificarlas en cuatro tipos generales que son los siguientes: escalas nominales, ordinales, de intervalos iguales y de cocientes o razones.
Escalas nominales son aquellas en que sólo se manifiesta una equivalencia de categorías entre los diferentes puntos que asume la variable. Es como una simple lista de las diferentes posiciones que pueda adoptar la variable, pero sin que en ella se defina ningún tipo de orden o de relación. Si es una investigación sobre producción agrícola queremos determinar los cereales que se cultivan en una cierta región, tendremos una variable que se designará como "cereal cultivado". Los distintos valores que esa variable reconoce serán, concretamente: trigo, maíz, centeno, etc. Entre estos valores no cabe obviamente ninguna jerarquía, no se puede trazar ningún ordenamiento. Sin embargo, a la enunciación explícita de todas estas posibilidades la consideramos como una escala, pues de algún modo es útil para medir el comportamiento de la variable, indicándonos en que posición se halla en cada caso.
Las escalas ordinales distinguen los diferentes valores de la variable jerarquizándolos simplemente de acuerdo a un rango. Establecen que existe una gradación entre uno y otro valor de la escala, de tal modo que cualquiera de ellos es mayor que el precedente y menor que el que le sigue a continuación. Sin embargo la distancia entre un valor y otro no queda definida sino que es indeterminada. En otras palabras, tales escalas nos esclarecen solamente el rango que las distintas posiciones guardan entre sí. Un ejemplo de escala ordinal es el que suele usarse para medir la variable "grado de escolaridad": podemos decir que una persona que ha tenido 2 años de instrucción escolar ha recibido más instrucción que quien solo tiene un año y menos que quien posee tres. Sin embargo no puede afirmarse válidamente que la diferencia entre quien posee 2 años de instrucción y quien ha recibido un año es igual a la diferencia entre quienes han recibido 16 y 17años de educación formal. Por tanto, como no podemos determinar la equivalencia entre las distancias que separan un valor de otro, debemos concluir que la escala pertenece a la categoría ordinal.
Las escalas de intervalos iguales, además de poseer la equivalencia de categorías y el ordenamiento interno entre ellas, como en el caso de las ordinales, tienen las características de que la distancia entre sus intervalos está claramente determinada y que estos son iguales entre sí. Un ejemplo típico de las escalas de intervalos iguales esta dado por las escalas termométricas. Entre 23 y 24 grados centígrados, por ejemplo, existe la misma diferencia que hay entre 45 y 46 grados. Muchas otras escalas, como las que se utilizan en los test psicológicos y de rendimiento, pertenecen a este tipo. La limitación que poseen es que no definen un cero absoluto, un valor límite que exprese realmente la ausencia completa de la cualidad medida. Por ello no se pueden establecer equivalencias matemáticas como las de la proporcionalidad: no puede afirmarse que 24° C es el doble de temperatura que 12° C, porque el cero de la escala es un valor arbitrario y no se corresponde con la ausencia absoluta de la variable que se mide.
Por último tenemos las escalas de cocientes, llamadas también de razones. En ellas se conservan todas las propiedades de los casos anteriores pero además se añade la existencia de un valor cero real, con lo que se hacen posibles ciertas operaciones matemáticas, tales como la obtención de proporciones y cocientes. Esto quiete decir que un valor de 20 en una escala de este tipo es el doble de un valor de 10, o de las dos terceras partes de un valor de 30. Son escalas de cocientes las que miden la longitud, la masa, la intensidad de corriente eléctrica y otras variables del mundo físico. Difícilmente las variables que intervien en las ciencias sociales son medidas con escalas de razones, pues son contados los casos en que dichas variables pueden ser definidas con la exactitud y precisión necesarias. La economía y la demografía son, entre estas disciplinas, las que más utilizan escalas de razones.
INSTRUMENTOS DE MEDICIÓN
Un instrumento de recolección de datos es, en principio, cualquier recurso de que se vale el investigador para acercarse a los fenómenos y extraer de ellos información. Ya adelantábamos que dentro de cada instrumento concreto pueden distinguirse dos aspectos diferentes: forma y contenido. La forma del instrumento se refiere al tipo de aproximación que establecemos con lo empírico, a las técnicas que utilizamos para esta tarea. En cuanto al contenido éste queda expresado en la especificación de los datos que necesitamos conseguir; se concreta, por lo tanto, en una serie de ítems que no son otra cosa que los mismos indicadores que permiten medir las variables, pero que asumen ahora la forma de pregunta, puntos a observar, elementos a registrar, etc. De este modo, el instrumento sintetiza en sí toda la labor previa de investigación: resume los aportes del marco teórico al seleccionar datos que corresponden a los indicadores y, por lo tanto, a las variables o conceptos utilizados; pero también expresa todo lo que tiene de específicamente empírico nuestro objeto de estudio pues sintetiza, a través de las técnicas de recolección que emplea, el diseño concreto escogido para el trabajo.
Es medianamente una adecuada construcción de los instrumentos de recolección que la investigación alcanza entonces la necesaria correspondencia entre teoría y hechos; es más, podríamos decir que es gracias a ellos que ambos términos efectivamente se vinculan. Si en una investigación los instrumentos son defectuosos se producirán, inevitablemente, algunas de las dificultades siguientes: o bien los datos recogidos no servirán para satisfacer los interrogantes iniciales o bien so se podrán obtener los datos que necesitamos, o vendrán falseados, distorsionados, porque el instrumento no se adecua al tipo de hechos en estudio. En ambos casos habrá, seguramente, uno o varios errores en las etapas anteriores del proceso de investigación. Será entonces necesario volver hacia atrás y revisar las diferentes tareas realizadas, hasta alcanzar una mejor aproximación al problema.
Diagrama de Tallos y Hojas
Es una técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes. El o los dígitos principales forman el tallo y los dígitos secundarios las hojas. Los tallos están colocados a lo largo del eje vertical, y las hojas de cada observación a lo largo del eje horizontal.
Ejemplo
La siguiente distribución de frecuencia muestra el número de anuncios comerciales pagados por los 45 miembros de Greater Buffalo Automobile Dealer´s Association en 1999. Observemos que 7 de los 45 comerciantes pagaron entre 90 y 99 anuncios (pero menos de 100). Sin embargo, ¿El numero de comerciantes pagados en esta clase se agrupan en alrededor de 90, están dispersos a lo largo de toda clase, o se acumulan alrededor de 99? No podemos saberlo.
# De anuncios comprados Frecuencia
80 a 90 2
90 a 100 7
100 a 110 6
110 a 120 9
120 a 130 8
130 a 140 7
140 a 150 3
150 a 160 3
Total 45
Una técnica que se usa para presentar información cuantitativa en forma condensada es el diagrama de tallo y hoja. En el ejemplo anterior no podíamos la identidad de los valores de la clase de 90 a 100. Para ilustrar la construcción de un diagrama de tallo y hojas usando el número de comerciales comprados, supongamos que las 7 observaciones en la clase de 90 a 100 sean 96, 94, 93, 94, 95, 96, 97. EL valor de tallo es el digito o dígitos principales, en este caso el 9. Las hojas son los dígitos secundarios. EL tallo se coloca a la izquierda de una línea vertical y los valores de las hojas a la derecha.
Los valores de las clases de 90 a 100, aparecerían como sigue:
9 6 4 3 4 5 6 7
Por ultimo, ordenamos los valores dentro de cada tallo de menor a mayor. El segundo renglón del diagrama de tallo y hojas aparecería como sigue:
9 3 4 4 5 6 6 7
Con el diagrama de tallo y hojas podemos observar rápidamente que hubo 2 comerciantes que compraron 94 comerciales y que el número de anuncios comprados fue desde 93 hasta 97. Un diagrama de tallo y hojas es semejante a una distribución de frecuencia, pero con más información, esto es, valores de datos en lugar de marcas.
Media Geometrica
Por ejemplo, la media geométrica de 2 y 18 es
Sólo es relevante la media geométrica si todos los números son positivos. Si uno de ellos es 0, entonces el resultado es 0. Si hay un número negativo (o una cantidad impar de ellos) entonces la media geométrica es, o bien negativa o bien inexistente en los números reales.
En muchas ocasiones se utiliza su trasformación en el manejo estadístico de variables con distribución no normal.
La media geométrica es relevante cuando varias cantidades son sumadas para producir un total.
Media geométrica ponderada
Al igual que en una media aritmética pueden introducirse pesos como valores multiplicativos para cada uno de los valores con el fin de ponderar o hacer pesar más en el resultado final ciertos valores, en la media geométrica pueden introducirse pesos como exponentes:
Media Armonica
Así, dados los números a1,a2, ... , an, la media armónica será igual
La media armónica resulta poco influida por la existencia de determinados valores mucho más grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho más pequeños que el conjunto.
La media armónica no está definida en el caso de la existencia en el conjunto de valores nulos.
Media cuadratica
Esta media como medida de asociación tiene aplicaciones tanto en ciencias biológicas como en medicina.
A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los errores de medida. En tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo. Este problema se resuelve, mediante la denominada media cuadrática. Consiste en elevar al cuadrado todas las observaciones (así los signos negativos desaparecen), en obtener después su media aritmética y en extraer, finalmente, la raíz cuadrada de dicha media para volver a la unidad de medida original.
Otras medias estadísticas son la media aritmética, la media ponderada, media cuadrática, media generalizada, media armónica y la media aritmética geométrica.
viernes, 14 de marzo de 2008
Teorema de Chebychev
por lo menos los datos deben estar concentrados en un 75% y un 94% con relaion a la desviacion estandar de la media.
si por un caso la forma de la curva tuviera forma de campana los datos deben de concentrarse en un 68%, un 95% y un 99.7% dentro de la desviacion estandar.
Para en contrar los datos del chebychev se debe concentrar dentro de k desviaciones estandar y la media.
jueves, 21 de febrero de 2008
Boxplot
Esta presentación visual, asocia las cinco medidas que suelen trabajarse de forma individual. Presenta al mismo tiempo, información sobre la tendencia central, dispersión y simetría de los datos de estudio. Además, permite identificar con claridad y de forma individual, observaciones que se alejan de manera poco usual del resto de los datos. A estas observaciones se les conoce como valores atípicos.
Por su facilidad de construcción e interpretación, permite también comparar a la vez varios grupos de datos sin perder información ni saturarse de ella. Esto ha sido particularmente importante a la hora de escoger esta representación para mostrar la opinión de los estudiantes respecto a la actuación docente a través de las diversas preguntas del instrumento utilizado.
· Partes del Boxplot
El nombre original del gráfico introducido por Jhon Tukey en 1977 es Box and whisker plot, es decir, diagrama de caja y bigote. En efecto, el gráfico consiste en un rectángulo (caja) de cuyos lados superior e inferior se derivan respectivamente, dos segmentos: uno hacia arriba y uno hacia abajo (bigotes).
La caja y los bigotes están ubicados paralelos a un eje rotulado, que en este caso está en la escala del 1 al 5 e indica el puntaje obtenido en una pregunta según la opinión de los estudiantes que llenaron el instrumento de opinión.
Las partes del Boxplot se identifican como sigue:
1.-Límite superior: Es el extremo superior del bigote. Las opiniones por encima de este límite se consideran atípicas. Para más detalles consulte sobre la construcción de los límites y los valores atípicos.
2.-Tercer cuartil (Q3): Por debajo de este valor se encentran como máximo el 75% de las opiniones de los estudiantes.
3.-Mediana: Coincide con el segundo cuartil. Divide a la distribución en dos partes iguales. De este modo, 50% de las observaciones están por debajo de la mediana y 50% está por encima.
4.-Primer cuartil (Q1): Por debajo de este valor se encuentra como máximo el 25% de las opiniones de los estudiantes
5.-Límite inferior: Es el extremo inferior del bigote. Las opiniones por debajo de este valor se consideran atípicas. Para más detalles consulte sobre la construcción de los límites y los valores atípicos.
6.-Valores atípicos: Opiniones que están apartadas del cuerpo principal de datos. Pueden representar efectos de causas extrañas, opiniones extremas o en el caso de la tabulación manual, errores de medición o registro.
Se colocan en la gráfica con asteriscos (*) o puntos (.) según se alejan menos o más del conjunto de datos. Se utiliza un superíndice numérico para indicar el número de veces que aparece ese dato como atípico. NOTA: Esta presentación en línea del Boxplot está en primera versión y aun en proceso de mejora. Se señalan los datos atípicos con una circunferencia (o) en el caso de ser única la observación. En caso contrario, usted sólo verá un triángulo ($). Si esto sucede, debe remitirse al reporte numérico para verificar la cantidad de observaciones atípicas por pregunta.
7.-Media aritmética: Es lo que tradicionalmente se conoce como promedio. Originalmente no forma parte del boxplot, sin embargo, se consideró su inclusión para dar una idea del puntaje general obtenido por pregunta. Actualmente se trabaja en la elaboración de estadísticos más representativos que la media aritmética para describir el conjunto de datos.
· ¿Cómo se interpreta?
Tenga en cuenta las siguientes consideraciones a la hora de interpretar el boxplot:
.-Mientras más larga la caja y los bigotes, más dispersa es la distribución de datos.
.-La distancia entre las cinco medidas descritas en el boxplot (sin incluir la media aritmética) puede variar, sin embargo, recuerde que la cantidad de elementos entre una y otra es aproximadamente la misma. Entre el límite inferior y Q1 hay igual cantidad de opiniones que de Q1 a la mediana, de ésta a Q3 y de Q3 al límite superior. Se considera aproximado porque pudiera haber valores atípicos, en cuyo caso la cantidad de elementos se ve levemente modificada.
.-La línea que representa la mediana indica la simetría. Si está relativamente en el centro de la caja la distribución es simétrica. Si por el contrario se acerca al primer o tercer cuartil, la distribución pudiera ser sesgada a la derecha (asimétrica positiva) o sesgada a la izquierda (asimétrica negativa respectivamente. Esto suele suceder cuando las opiniones de los estudiantes tienden a concentrase más hacia un punto de la escala.
.-La mediana puede inclusive coincidir con los cuartiles o con los límites de los bigotes. Esto sucede cuando se concentran muchos datos en un mismo punto, en este caso, cuando muchos estudiantes opinan igual en determinada pregunta. Pudiera ser este un caso particular de una distribución sesgada o el caso de una distribución muy homogénea.
.-Las opiniones emitidas como No aplica (N/A) cuando en realidad sí aplica o las opiniones nulas (cuando el estudiante no opina en una pregunta), no son tomadas en cuenta para elaborar el boxplot de esa pregunta. Por esta razón encontrará que en ocasiones no hay igual número de opiniones para todas las preguntas.
.-Debe estar atento al número de estudiantes que opina en cada pregunta. Lo que pareciera ser dispersión en los resultados, en ocasiones podría deberse a un tamaño de muestra muy pequeño: pocos estudiantes opinaron. Debe ser cauteloso a la hora de interpretar. En estos casos se sugiere remitirse al reporte numérico.
.-En términos comparativos, procure identificar aquellas preguntas cuyos boxplot parecen diferir del resto. Pudiera con esto encontrar fortalezas o debilidades en su actuación según la opinión de los estudiantes.
· Ejemplo
Se observa una variabilidad muy grande en cuanto a las impresiones que los estudiantes tienen del profesor en los diferentes aspectos de su actuación. Esto se concluye porque no existe una tendencia homogénea en las respuestas por pregunta.
Las opiniones son muy homogéneas y positivas en la pregunta 5: Logra comunicarse efectivamente con el estudiante. Este aspecto resalta en la actuación del docente y además todos los estudiantes encuestados coinciden en ello.
También se considera muy positiva la impresión que los estudiantes tienen en cuanto a los aspectos que se refieren a las preguntas 2, 6, 9, 12 y 13; salvo un par de opiniones que difieren del resto en las preguntas 2 y 6, las respuestas son homogéneas. Note que estas opiniones separadas son datos atípicos pues se alejan del cuerpo de datos. Note también que por el proceso de mejora que sufren los gráficos presentados en línea, debe remitirse al reporte numérico en la pregunta 2 para verificar el número de respuestas atípicas dado que el símbolo representativo por el momento es ($), mas no así en la 9 pues ya se comentó que el símbolo (¡) se refiere a sólo un dato atípico y en este caso vale “2”.
Observe que según la opinión de los estudiantes el aspecto de la pregunta 17: Realiza la entrega y revisión oportuna de los resultados de las evaluaciones revela el puntaje más bajo respecto al resto de las pregunta, lo cual pudiera ser un aspecto a considerar por el docente dado que además el 50% de los estudiantes le otorga el puntaje más bajo. Note que aquí la mediana es “1”, lo que indica que la mitad de las observaciones está allí (no por debajo porque no hay valor más bajo)
Note que algunos boxplot no tienen bigotes. En estos casos, como por ejemplo en la pregunta 19, el límite inferior coincide con el Q1 y el límite superior coincide con el Q3. En esta pregunta se evidencia simetría y bastante variabilidad.
El resto de las preguntas presentan alta variabilidad por lo que deben leerse cuidadosamente en función del punto donde se concentra la mayor cantidad de información, esto es, viendo la posición de la mediana (véase Simetría). Esta alta variabilidad indica que la opinión de los estudiantes respecto a los planteamientos es bastante heterogén
Cuartiles: Son valores que dividen a la distribución en cuatro partes iguales en cuanto a la cantidad de datos. Así, tenemos que el Primer cuartil (Q1), es el valor por debajo del cual ocurre el 25% de las observaciones y el Tercer cuartil (Q3) es aquel por debajo del cual ocurre el 75% de las observaciones. Siguiendo en esta línea, el Segundo cuartil (Q2) coincide con la mediana de la distribución.
Dispersión: Indica la variabilidad del conjunto de datos: cómo se distribuyen los datos de estudio. Una dispersión grande indica un conjunto de datos heterogéneos e implica poca utilidad de una medida de tendencia central únicamente para describir la distribución.
Estadísticos: son valores representativos que proporcionan información sobre la serie en cuanto a su posición en la escala de medición, agrupamiento en torno a un valor, distribución de los datos y concentración en una región entre otros. Los estadísticos proveen información sobre una muestra. Cuando se trabaja con toda la información (población) se le denomina parámetro.
Mediana: Es medida de tendencia central. Es un dato de la distribución que la divide en dos partes iguales de forma tal que por debajo y por encima de ella se encuentra como máximo el 50% de los datos de estudio. Por ejemplo, si las opiniones de cinco estudiantes (en puntaje del 1 al 5) fueron: 1-1-3-4-5, entonces 3 es la mediana; o si los puntajes fueron: 1-1-3-4-5-5, la mediana está entre 3 y 4 y la consideramos como 3,5.
Media aritmética o promedio: Es un estadístico de tendencia central. Representa una especia de punto de equilibrio para el conjunto de datos. Para calcularlo se emplean todos los datos de la distribución por lo que tiene la desventaja de verse afectada por datos muy grandes o pequeños, lo que conlleva a que en ocasiones no sea representativa de la distribución. Resulta de sumar todos los datos de la distribución y dividirlos entre el total de datos.
Simetría: Indica la forma del conjunto de datos, lo cual implica observar dónde se concentra la información. Para el estudio de la forma de una distribución, también se usan los términos sesgo o asimetría. Una distribución puede ser:
.-Simétrica: en este tipo de distribuciones la media, la moda y la mediana coinciden y los datos se distribuyen de igual forma a ambos lados de estas medidas. En el contexto, hay igual número de opiniones por encima que por debajo de la mediana.
.-Asimétrica positiva o sesgada a la derecha: los datos tienden a concentrarse hacia la parte inferior de la distribución y se extienden más hacia la derecha. La media suele ser mayor que la mediana en estos casos. En el contexto, las opiniones se concentran en un puntaje menor y las de mayor puntaje están más dispersas.
.-Asimétrica negativa o sesgada a la izquierda: los datos tienden a concentrarse hacia la parte superior de la distribución y se extienden más hacia la izquierda. La media suele ser menor que la mediana en estos casos. En el contexto, las opiniones se concentran en un puntaje mayor y las de menor puntaje están más dispersas.
Medida de Tendencia central: Estadístico que procura aportar información sobre la localización central de la distribución de datos. Son: la media aritmética, la moda, la mediana, la media geométrica y la media armónica, y se emplean de acuerdo al objetivo del estudio y al tipo de dato que se tenga.
Valor Mínimo o Máximo: Es el dato más pequeño o más grande de la distribución, respectivamente. En este contexto, es el puntaje más bajo o más alto otorgado por los estudiantes en determinada pregunta.
Medidas de Tendencia Central
Entre las medidas de tendencia central tenemos:
La Media Aritmética:
La medida de tendencia central más obvia que se puede elegir, es el valor obtenido sumando las observaciones y dividiendo esta suma por el número de observaciones que hay en el grupo. La media resume en un valor las características de una variable teniendo en cuenta a todos los casos. Solamente puede utilizarse con variables cuantitativas.
Media muestral:
Si se tiene una muestra estadística de valores (X1,X2,...,Xn) de valores para una variable aleatoria X con distribución de probabilidad F(x,?) [donde ? es un conjunto de parámetros de la distribución] se define la media muestral n-ésima.
Moda:
Es el dato que más se repiten en la cuenta. Si existen dos datos que se repite un numero igual de veces entonces el conjunto será bimodal. Ejemplo:
Numero de personas en distintas casas en una villa
Promedio Geométrico:
La media geométrica de un conjunto de observaciones es la raíz n ésima de su producto. El cálculo de la media geométrica exige que todas las observaciones sean positivas.
Percentiles:
Los percentiles representan los valores de la variable que están por debajo de un porcentaje, el cual puede ser una valor de 1% a 100% (en otras palabras, el total de los datos es divido en 100 partes iguales).
Moda:
En estadística la moda es el valor que cuenta con una mayor frecuencia en una distribución de datos.
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima.
Cuando en una distribución de datos se encuentran tres o más modas, entonces es multimodal.
Estadistica
Podríamos por tanto clasificar la Estadística en descriptiva, cuando los resultados del análisis no pretenden ir más allá del conjunto de datos, e inferencial cuando el objetivo del estudio es derivar las conclusiones obtenidas a un conjunto de datos más amplio.
Estadística descriptiva: Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos.
Estadística inferencial: Apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.