Los datos te engañan y no son lo que parecen. A veces hay obviedades en el cruce de datos y por intuición sacamos conclusiones pero, otras no tanto. Vemos claramente "La imperfección de los datos".
Podemos llegar a ver correlaciones donde no las hay y además, son totalmente erróneas.
Extraer información significativa de los datos puede ser un desafío, especialmente dado el problema de que los datos pueden, entre otras cosas, ser inexactos, incompletos y posiblemente contradictorios al surgir de una variedad de fuentes de calidad y nivel de confianza variables.
Si vamos a crear un dashboard donde queremos ver el número de clientes que se dan de baja en nuestra newsletter, se pierde recurrencia de compra, desciende el número de visitas a la web o incluso entender la rotación de empleados si somos rrhh u otro departamento, podemos llegar a conclusiones que no tienen sentido ninguno.
CORRELACIÓN ESPURIA
Aquí es cuando hablamos de una relación espuria. Esto no es nada más y nada menos, que un vínculo aparente entre dos eventos que se demuestra inválido cuando se examina la relación con mayor detalle.
Parece que los valores de una variable causan cambios en la otra variable, pero eso en realidad no está sucediendo.
Aunque es fácil detectar y explicar ejemplos absurdos, es probable que encuentres gráficos "ajustados" pero plausibles en el trabajo diario.
Las escalas del eje Y que miden valores diferentes pueden mostrar curvas similares que no deben emparejarse. Esto se vuelve bastante caótico cuando los valores parecen estar relacionados pero no lo están.

Si dominas el tema y sabes lo que haces, no va a pasar esto. Pero como tengamos ni idea de qué tenemos entre manos y qué estamos buscando, el caos estás servido.
Es como decir que voy a correlacionar el consumo de agua con los robots AGV´s. Quien no entienda del tema y le salga una gráfica con correlación le parecerá, un gran descubrimiento!
Aquí os dejo ejemplos absurdos de correlaciones y si hacéis click aquí os lleva a la web. Realmente son muy divertidos y hay mucho fondo tras el concepto Correlaciones Espurias.


INFERENCIA CAUSAL
Inferencia predictiva vs inferencia causal. Cada vez me parece más importante entender la INFERENCIA CAUSAL. A medida que hablamos de avances de IA, más importante me parece entender los datos que hay detrás.
La distinción entre inferencia predictiva e inferencia causal es importante. Esta última a menudo se pasa por alto, lo que nos lleva a errores con costes muy altos. La lógica y los modelos entre los dos enfoques son muy diferentes.
La causalidad, el campo centrado en comprender las relaciones entre causa y efecto, busca responder preguntas críticas como "¿Por qué?" y '¿Y si?'.
¿Pero cuándo necesitamos de inferencia causal? Pues cuando nos preguntamos esto.
¿Qué impacto podría tener la prohibición de los vehículos de combustible sobre la contaminación?
¿Cuál es el retorno de la inversión de nuestra campaña publicitaria?
La inferencia causal difiere principalmente de la inferencia predictiva debido a las supuestas relaciones causales subyacentes. Esas relaciones se representan explícitamente utilizando este tipo especial de gráfico llamado Gráficos Dirigidos (Acíclicos). Esta herramienta, junto con el marco de resultados potenciales, es el núcleo de la inferencia causal y permitirá pensar claramente sobre los problemas potenciales y, en consecuencia, las soluciones para evaluar la causalidad.
Un Directed Acyclic Graph o Grafo Acíclico Dirigido (DAG), es un tipo de grafo por el cual se puede representar una serie de datos relacionados entre sí. Estos datos se presentan visualmente como un conjunto de círculos o nodos. Cada uno de estos círculos o nodos, representa un determinado conjunto de datos dentro de todo el grupo.
Me sorprende que hay muchísimos libros que vienen del otro lado del mundo pero casi ninguno de aquí.
Los resultados de Google Trends para "inferencia causal" nos muestra un interés en rápido crecimiento y la asociación con el aprendizaje automático

BIAS/ SESGO Y LA CIBERNÉTICA
Este vídeo lo encontré de casualidad por Instagram. Y me parece el mejor ejemplo para usar la IA generativa junto con nuestra I.H. (Inteligencia Humana).
Con más criterio que mucho de lo que vemos. Con más sentido común o razonamiento de lo que a veces pasa.
Nuestra data es bia.
Es un video de nuestra Historia. Donde vemos selfie del Imperio Romano o Sumerios. Y donde vemos una imagen de la Segunda Guerra Mundial.
Obviamente, en el combate aparecen hombres, no hay mujeres. Es un hecho y una realidad. Y me parece un video que con muy buen sentido común y criterio está hecho. Somos humanos y tenemos sesgo. Somos bias.
Nuestra data es bia. Nosotros no creamos matemáticas ni estadística (sí trabajamos con estas dos herramientas), eso es ser humano.
Y obviamente, querer erradicar a toda costa el sesgo en temas que no son ciencia, nos lleva a errores y patinazos.
Cibernetics vs AI. Igual no es uno de los términos más escuchados pero existe y "es la ciencia que estudia los flujos de energía vinculados a la teoría de control y a la teoría de sistemas., es la ciencia que se ocupa de los sistemas de control y de comunicación en las personas y en las máquinas, etc." Por así decirlo, la cibernética es "objetiva" y la IA es "subjetiva" a imagen y semejanza humana.
Diría que es una IA, limpia de sesgo y por tanto no "I", diría que es conocimiento artificial "puro y duro" e igual es lo que muchos buscan de la IA.

Se afirma que la IA es un “derivado” de la cibernética. No siendo esta última sólo una ciencia informática, es una forma de mirar el mundo porque se supone que es neutral.
La IA se basa en la visión realista de que las máquinas pueden funcionar y comportarse como humanos, mientras que la cibernética se basa en una visión constructivista del mundo
Si bien la IA tiene una dimensión cultural (los sistemas de IA chinos y estadounidenses no son iguales o ninguno que estemos creando porque existen sesgos. Y a más volumen, mejor aprende la IA de nuestros propios errores y características. Es imagen y semajanza humana), la cibernética ignora la cultura, la nacionalidad, la etnia o la ideología. Realiza una tarea determinada sin temor a ser favorecido. Todo lo que requiere es consenso sobre su propósito, objetivo o destino.
Imaginemos pasajeros en un avión. Todos tienen una cosa en común: quieren ir a Singapur. No les importa sentarse al lado de un marxista o un vegetariano. Lo único que quieren es llegar sanos y salvos a Singapur y, idealmente, a tiempo.
Planificar, cuantificar, dirigir.
El término cibernética, acuñado por el informático estadounidense Norbert Wiener. El método Cibernético es un proceso de tres pasos: Planificar, Cuantificar y Dirigir. Plan define la meta, objetivo o destino, Quantify define los recursos necesarios y Steer se asegura de que el sistema dinámico se mantenga dentro de los parámetros establecidos por el Plan utilizando un sistema de retroalimentación.
Discrepancias o no, la cibernética está relacionada con el desarrollo de la realidad virtual y la inteligencia artificial.
Hay tener en cuenta, "La imperfección de los datos".
Comments