La Era de los Datos: definiciones básicas

Desde hace tiempo que tengo el foco puesto en mejorar mi entendimiento sobre todo lo relacionado con la era de los datos. En este post pretendo dar forma y orden a lo que he ido encontrando. Mi idea es hacer una serie de 4 post relacionados con los datos:

Empezaré por hablar de por qué ahora los datos son más importantes que nunca, me gustaría entrar en la definición de conceptos sobre datos y definiré algunos principios básicos del uso de los datos. 

El siguiente post profundizaré en la aplicación del mundo del data a nivel individual como la recogida, análisis y representación es una meta competencia digital.

En otro post me gustaría profundizar en eso de Data Driven Companies. En la realidad todas las compañías toman decisiones basadas en datos ¿Qué ha cambiado? ¿Por qué es más relevante ahora?

Por último me gustaría hablar de cómo el principio de Open data será un elemento fundamental para la paz y equidad social en el futuro. ¿Quién asegurará la justicia en un mundo de algoritmos?

Espero que os resulte tan interesante y útil como a mí. Si quieres ir recibiendo esta serie no dejes de suscribirte, y yo prometo cuidar mucho vuestro e-mail. ¿Empezamos?

Patrocinador: Adam patrocina el blog de @titonet. 
Te ofrecemos servicios cercanos y flexibles de data center, 
infraestructura cloud y conectividad en Madrid y Barcelona.
DESCUBRE ADAM 

Por qué ahora los datos son ahora más relevantes

1- Una nueva religión – el hiper racionalismo de los datos.

Parece que hay una especie de mística en torno al mundo de los datos que nos acercará a una verdad absoluta. Gracias a los datos dejaremos de tomar decisiones arbitrarias. Gracias a los datos acertaremos siempre en los planteamientos. Gracias a los datos nunca nos equivocaremos. Estamos otorgando un superpoder (“Data will rule the world”) a algo que aún no acabamos de entender cómo funciona.

2- Momentum tecnológico

Esta sobre expectativa con los datos no se sustenta si no hay una base de tecnología preparada ofrecer servicios. En la actualidad ha convergido muchos de los elementos críticos que hablábamos en los factores clave de la economía digital. Tenemos sensores que digitalizan señales, redes de comunicación que los transmiten, almacenes de datos y capacidad de procesamiento.

En la actualidad la infraestructura está disponible y a costes accesibles para empresas ya no solo de tamaño grande sino que la empresa mediana y pequeña tiene acceso. (recomiendo visitar la página de nuestro sponsor Adam). La dificultad ya no es tecnológica, sino que es humana. Falta talento por todos lados, de ingenieros y analistas de datos.

3- Digitalización de los negocios

Ya hemos hablado largo y tendido sobre la digitalización de los negocios y sus beneficios. La tecnología digital permite una mejora de la productividad y permite optimizar los procesos y  detectar oportunidades automatización. El proceso de digitalización va intrínsecamente vinculado con la gestión de datos dentro de las empresas con un foco de mejora del negocio.

Esta sobre exposición se acaba convirtiendo en un hype tecnológico, que ayuda a sensibilizar y poner encima de la mesa nuevas oportunidades.

4- La Hiper personalización

Según Javier Recuenco, hay 5 grandes vectores de que están moviendo el mundo. Uno es la hiperpersonalización. La experiencia educa y obliga a cualquier empresa a personalizar su oferta para evitar acabar siendo irrelevante. Sin datos estructurados, alimentados y en tiempo real, tu capacidad de personalización y satisfacción de clientes es más bien imposible. Si quieres competir en la hiperpersonalización te obliga a gestión activa y enfocada de los datos.

5- El mercado de los datos

Todos tus datos en estos momentos están a la venta. Quien eres, qué te gusta, con quien te relacionas, cuál es tu carácter y en qué trabajas. No solo eso, por donde te mueves, cómo estás de salud, cuanto duermes. Si te parece poco, tu orientación política, sexual y nivel económico. Todo a la venta. Lo has entregado a través de esta etapa dorada de compartir tu información en las redes sociales. Estos datos les interesan a empresas para dirigirte publicidad. Les interesan a entidades políticas para orientar tu voto.

6- La referencia de los monopolios digitales ,

A muchas empresas les gustaría ser Google. Ya hablamos en su día de los monopolios digitales y de su posición dominante. Si analizamos sus modelos de negocio (excepto Apple), se basan en la extracción, análisis y puesta en valor de datos de personas. Nota mental: Apple no re vende, pero sí que utiliza los datos para mejora de productos y para entender el momento crítico de introducir innovaciones.

La ventaja que han adquirido estos monopolios se entiende mejor con esta imagen.

7- Sin datos no hay transformación digital

Hemos hablado en muchos momentos que la transformación digital implica cambios en el modelo de negocio. Sin datos es imposible la servitización. Sin datos la productivización será un experimento más.

Definiciones básicas para la era de los datos

QUÉ ES UN DATO.

Una representación de hechos, conceptos o instrucciones de un modo formalizado, y adecuado para comunicación, interpretación o procesamiento por medios automáticos o humanos.

DATOS ABIERTOS

Son aquellos que cualquiera es libre de utilizar, reutilizar y redistribuir, con el único límite, en su caso, del requisito de atribución de su fuente o reconocimiento de su autoría.

DATOS CERRADOS

Aquellos datos que son accesible para un colectivo determinado. La gran mayoría de los datos de una empresa son cerrados, no abiertos. Se consideran los datos un elemento confidencial.

La graduación de la apertura puede variar. Las empresas no abren sus datos hacia el mercado, pero buscan mecanismos para abrir los datos hacia áreas, y departamentos para mejorar el acceso y toma de decisión.

BIG DATA

El término macrodatos se refiere a una gran cantidad (VOLUMEN) de diferentes tipos (VARIEDAD) de datos producidos a alta velocidad (VELOCIDAD)a partir de un gran número de diversos tipos de fuentes. Para manejar los conjuntos de datos muy variables y en tiempo real de hoy en día, se necesitan nuevas herramientas y métodos, como software, algoritmos y procesadores de gran potencia.

Cuando hablamos de Big data, hablamos de datos que con caben en un servidor, ni en dos, necesitas muchos (volumen). Es importante hacer entendible que la gran mayoría de noticias relacionadas con big data, se refieren a small data.

SMALL DATA

El Small Data es un conjunto de datos con un formato y un volumen que los hace accesibles, informativos y procesables.

Los datos gestionados por la gran mayoría de empresas son small data. Puedes tener muchos datos, pero no tienes porqué cumplir las 3 V’s (Volumen, variedad, velocidad). Como principio básico, si hablas de servidores, es small.

FAST DATA

Es aquél tipo de dato que una empresa es capaz de utilizar y llevar a la acción de una forma muy rápida. La velocidad de uso es la evidencia de la competitividad de una empresa. Via @genisroca.

TRUST DATA

Aquel conjunto de datos que son fiables para la toma correcta de decisiones. Para ser fiables los datos deben cubrir una serie de características: Precisos, completos, Consistentes, Unicos, validados y oportunos). Más info.

DATOS CAPTADOS

Es el resultado de aquel conjuntos de acciones que realizas para recoger datos. La ‘captación’ está asociada a acciones con intención de recopilar. Los datos que captas no

DATOS MERECIDOS

Se trata de la recogida de datos de diferentes fuentes, pero con una componente ética. Los datos y sus implicados saben de la recogida de los datos y aceptan su uso, utilización y acceso. (@genisroca)

QUÉ ES UN KPI

KPI – Key Performance Indicator. Dato que explica el desempeño realizado. Un KPI aislado no explica, pero analizar su evolución y contextualización ayuda a entender la evolución de una actividad.

Los KPI’s por definición son pocos, son una selección suficiente. En un mundo de abundancia de datos, tener pocos indicadores, precisos se vuelve una necesidad.

VANITY DATA

Aquél conjunto de datos que no ayudan a la toma de decisiones, pero debido a su volumen o evolución respaldan que el trabajo hecho por alguien, es muy bueno. En muchas empresas se confunden los KPi’s con Vanity data, lo que lleva a muchos datos, poco representativos.

Principios básicos sobre los datos

1- Menos big data, más trust data

Tener muchos datos no es garantía de nada. En la era del big data, es infinitamente mejor tener pocos datos y muy buenos, que muchos datos. La cantidad no garantiza la fiabilidad. Son los datos fiables (trust data) los que ayudan en la toma de decisiones.

2- Los datos caducan

Los datos generados en la etapa covid, no servirán en la etapa pospandemia. Los hábitos de compra han cambiado tanto en estos dos períodos que son datos no representativos ni útiles para tomar muchas decisiones. Los datos caducan, por ello, la velocidad es la variable crítica.

La pregunta es ¿Cuánto tiempo tardas desde el momento que tienes el dato hasta que los usas? La velocidad de uso (Fast data) es una variable que da competitividad.

Los datos necesitan que los alimentemos poder mantenerlos con vida. Como los datos caducan, enriquecerlos, remezclarlos, analizarlos es parte de su proceso para mantenerlos vivos. Sin esta gestión, caducan más rápido y acaban siendo inservibles.

3- El dato sesgado, manipula

Parece que Confiar en una opinión basada en datos es el nuevo mantra. Esto supone un peligro. Debemos estar alerta, ya que la recogida de los datos, su selección, su análisis y representación pueden estar sesgados. Una opinión basada en datos intencionados puede llevar a una manipulación muy peligrosa, ya que «es más fácil engañar a la gente, que convencerles de que han sido engañados» (Mark Twain)

4- La Correlación no implica causalidad.

Los datos nos llevan a explorar conexiones causa- efecto. Pero es bueno recordar que dos eventos se den habitualmente de manera consecutiva no implica que uno sea causa del otro. Internet está lleno de ejemplos. Cuantos más datos gestionamos, más tenemos que desarrollar nuestra capacidad analítica y nuestro espíritu crítico sobre sus interpretaciones. Los datos pueden llevar a correlaciones erróneas y por tanto a decisiones erróneas.

6- «All models are wrong, some are useful»

En la actualidad no tenemos mejor análisis, sino que tenemos más datos y más capacidad para almacenarlos y procesarlos. Nos faltan modelos que den una orientación y una utilidad. Los algoritmos se basan en modelos que tratan de explicar la realidad (recomiendo sin duda Model Thinking). Una vez tienes un modelo predictivo de comportamiento ocurre una paradoja: Nos empeñamos en querer que los modelos funcionen, no que los datos funcionen. Las empresas necesitan la capacidad de construir modelos que funcionen y ser capaces de entender cuando ya no. Más info

7- Principio PAD (Pérdida asumible de datos)

Todos hemos perdido datos alguna vez en nuestra vida (p.e. las fotos del móvil) La paradoja es que gestionar los datos implica dedicar tiempo y dinero. El principio de la PAD implica que asumo que lo que perderé no es tan importante como el coste que me supone la gestión. Muchas decisiones personales se basan en esta balanza.

8- Dato no utilizado, dato borrado

Parece que vivimos en un mundo basado en abundancia. Guardamos datos que no necesitamos, por si acaso. Nos cuesta borrar. Deberíamos utilizar el mismo principio que utilizamos todos con nuestro armario. Si la ropa no la usas la saco y la dono, vendo o tiro. Los datos si no se usan, se eliminan. Es la manera de asegurar la gestión y la actualización.

9 – Pon tus datos a trabajar, con analistas

La tecnología para utilizar los datos está disponible, dificultad está en encontrar personas capaces de utilizarlas. A veces a las empresas se nos olvida de la regla no escrita del 1×3 en el arranque de proyectos de datos. Por cada euro invertido en tecnología de datos, necesitas 3 en personas capaces de utilizarlos. Una vez funcionan los sistemas y en enfoque sea mantenimiento, necesitarás 1×1.

10 – No todo puede ser medido

En un mundo tendente al hiper racionalismo basado en datos es bueno recordar que “Not everything that can be counted counts, and not everything that counts can be counted.» William Bruce Cameron.

Hay muchas cosas en la vida que no pueden ser medidas. El amor no se mide, se siente. La racionalización de lo no medible hace que pierda valor. Necesitamos una sociedad que sepa separar entre las cosas que haya que medir y las cosas que no. 

Próximamente

Como os decía al principio, en el siguiente post me gustaría profundizar sobre la aplicación del mundo de los datos a nivel individual como la recogida, análisis y representación es una meta competencia digital. Lo otros post tocará hablar del Data driven companies y del Open data.

Espero que os resulte tan interesante y útil como a mí. Si quieres ir recibiendo esta serie no dejes de suscribirte, y yo prometo cuidar mucho vuestro e-mail.

Espacio Patrocinado por ADAM
La transformación digital es un proceso necesario, que afecta a la cultura y a la estrategia de tu negocio.
La tecnología es solo una parte, pero es una pieza fundamental para la que necesitas un partner
cercano y atento, que te acompañe en tus retos y te ayude a tomar las mejores decisiones.
En Adam nos gusta tener un trato personal y cercano. Entender tu proyecto y tus objetivos y
ofrecerte la solución más efectiva y escalable para cada situación.
Tenemos 30 años de experiencia ayudando a clientes en todos los sectores del mercado. 
Si quieres saber más, te podemos ayudar en servicios de colocation, infraestructura cloud
y conectividad, desde nuestros 3 data centers en Madrid y Barcelona.
DESCUBRE ADAM

Posts relacionados

1 Response
  1. Hola
    Preguntas sobre el artículo:
    – Para manejar los conjuntos de datos muy variables y en tiempo real de hoy en día, se necesitan nuevas herramientas y métodos, como software, algoritmos y procesadores de gran potencia.
    Qué herramientas o métodos te refieres?

    – La tecnología para utilizar los datos está disponible, dificultad está en encontrar personas capaces de utilizarlas.
    Qué tecnologías te refieres?

    asa

Leave a Reply

Titonet