Hoy he aprendido un concepto interesante: la teoría de la diversificación.
Para los que no quieran, o simplemente les aburran los desarrollos largos, este no es complicado, pero tampoco es corto. He avisado. Aunque para los que quieran aprender un concepto interesante, este es MUY interesante. Ahí vamos.
Para empezar, es necesario conocer 5 conceptos de estadística. Aquí van las tres primeras:
- La media (E). Nada que decir sobre esta. Es bastante intuitiva.
- La varianza (VAR): Es la media de todas las diferencias con la media, al cuadrado. Lo de "al cuadrado" es un truco para que esas diferencias salgan positivas.
- La desviación estándar (SD): Así, en coloquial, es como de lejos están las variables de una distribución, de su valor medio. Viene a decirnos, lo disperso o concentrado que es un conjunto de datos. Se calcula mediante la raíz cuadrada de la varianza. Fácil.
Me faltan por explicar la covarianza y la correlación de dos variables. Pero para que se entienda mejor, un ejemplo.
Imaginemos que tenemos un bar, y que sabemos cuántas bebidas calientes y frías se venden en un día. Supongamos que esos números se representan según la siguiente gráfica (en el eje X las bebidas calientes, y en el Y, las frías). He tomado los datos de un ejemplo existente.
Las líneas punteadas serían las medias para cada una de las variables en ambos ejes (E[X]=457, E[Y]=210). A simple vista se ve que los días en que se venden más bebidas calientes, se venden (casi siempre) menos bebidas frías, y viceversa. Es decir, parece que hay una correlación entre ambas variables.
¿Cuál es esa correlación? Si tenemos en cuenta las líneas punteadas que representan los valores medios, la correlación que existe es que cuando se venden bebidas calientes por encima de la media, se suelen vender bebidas frías por debajo de la media. ¿No? Mira la figura otra vez. Esta conclusión es también bastante sencillota.
Pero, ¿qué significa esto? Significa que ambos valores están relacionados, y que esa relación se puede calcular, con la ayuda de la Covarianza (COV). ¿Qué nos dice la covarianza?
- Dadas dos variables, X e Y, si cuando X tiene valores por encima de su media, resulta que Y también presenta valores por encima de la media, se dice que la COV(X,Y) > 0.
- Y lo contrario: si cuando X tiene valores por encima de la media, resulta que Y lo que presenta son valores por debajo de la media, se dice que COV(X,Y) < 0.
Para el caso que se muestra en la figura, la COV(X,Y) = -23. Es decir, las dos variables están correladas negativamente. A efectos prácticos hay que decir que el valor de la desviación estándar de X es 244 (SD[X]=244), y de Y es 145 (SD[Y]=145). Son los valores que se usan en el ejemplo que he tomado. Ahora ya sabemos calcular e interpretar cómo están relacionadas las cifras de ventas de dos productos. O mejor dicho, sabemos calcular cómo se relacionan dos variables que siguen sendas distribuciones.
Este ejemplo es una simplificación extrema de un portfolio que sólo contiene dos productos, que además se complementan casi perfectamente, porque cuando se vende poco de uno, se vende mucho del otro. Pero a pesar de lo sencillo del caso, toda su argumentación es extrapolable a casos más complejos, con un mayor número de productos.
Pero (y ahora viene lo interesante) pongamos un precio a la bebida caliente típica, y a la bebida fría típica. Imaginemos que es 1.5€ para las calientes (X) y 2.5€ para las frías (Y). Calculemos ahora la desviación estándar para las cifras de venta que se obtienen de las bebidas calientes y las frías. Tendremos, a partir de los datos del ejemplo que yo tomé:
- SD(1.5X) = 1.5*244 = €366
- SD(2.5Y) = 2.5*145 = €364
Estos son más o menos los rangos en los que se mueven los ingresos por bebidas calientes y frías de mi establecimiento. Más o menos, la misma franja de euros para ambas. Curioso, ¿no? Pero, ¿qué pasa si calculamos la desviación estándar para las ventas TOTALES de mi establecimiento?
¿Cómo puede ser? Resulta que la franja en la que oscilan mis ingresos totales, ¡es menor que la de cada uno de los productos que yo vendo! Es decir, puedo esperar que mi caja diaria total varíe menos de lo que lo haría por los ingresos de cada uno de mis productos por separado. Es como si tener productos con comportamientos distintos fuera bueno para mis ingresos.
Pues bien, esta es la madre del cordero: A este principio tan sencillo se le conoce como el principio de la diversificación para reducir variabilidad y riesgo. Resulta, además, que este es un principio básico en la teoría de portfolios, y que le dieron el premio Nobel de economía a Merton Miller, William Sharpe y Harry Markowitz por este hallazgo, en 1990.