AWS Data Analytics
Toma mejores decisiones rápidamente gracias a las soluciones de Amazon Analytics
“El dato es el petróleo del siglo XXI” es una afirmación que seguramente hayas escuchado en multitud de ocasiones.
¿Está tu compañía preparada para obtener el máximo de sus datos?
Se prevé que aumente el número de dispositivos para 2030, lo que aumentará el volumen de datos
De las empresas utilizan Big Data para obtener ventajas competitivas
De las empresas utilizan el 'hacer más con menos', aumentando el ROI gracias a soluciones analíticas para obtener ventajas competitivas
¿Por qué es necesaria una solución de Analytics?
Cada vez las empresas tienen a su disposición mayor cantidad de datos, provenientes de numerosas fuentes de información. Sin embargo, en muchas ocasiones no se tiene la capacidad de disponer de un entorno analítico capaz de ingestar, modelar, analizar y mostrar la información de valor que se esconde tras esos datos.
En un entorno cada vez más competitivo, global y cambiante como el que nos rodea, la capacidad de poder tomar decisiones rápidamente es primordial, aunque si la información de partida no es correcta o actualizada, seguramente el camino que tomemos no sea el adecuado.
La complejidad de la arquitectura de análisis del dato
Todos conocemos la arquitectura de la cadena de análisis tradicional:
- Fuente de Datos, normalmente una BD relacional en la que está nuestra información de negocio
- Solución ETL (Extract – Transform – Load), donde se extraen los datos del origen, se realizan las transformaciones necesarias y, finalmente, se cargan en una BD que normalmente denominamos DataWarehouse
- Solución de Análisis y Visualización, como soporte a la hora de tomar decisiones basadas en la foto actual, previsiones, etc.
A nivel conceptual, no cabe la menor duda de que el modelo funciona, pero el problema es que, al trasladarlo a la práctica, en muchas ocasiones resulta complejo de gestionar, ya que se suele optar por soluciones heterogéneas, lo cual hace que la puesta en marcha y la gestión del ciclo de vida de la solución sea complejo.
Por otro lado, tenemos que analizar los costes de la solución. En un esquema clásico, donde se requiere algún tipo de licenciamiento (ya sea por capacidad de cómputo asignada al DataWare o a la solución ETL), normalmente se dan unos costes de capital (CAPEX) que muchas veces hacen que el proyecto sea inviable.
Precisamente es aquí donde la aplicación de la filosofía de cloud pública, especialmente las ventajas de pago por uso, se convierte en el eje sobre el que pivotará la concepción de la nueva arquitectura de análisis del dato.
La nueva arquitectura de análisis del dato con AWS Analytics
El esquema del que partimos es el siguiente:
Como premisa tomaremos que los extremos (Origen y Análisis / Visualización) son constantes debido a que suele ser elementos en cierto modo “impuestos”:
- Origen: Serán las fuentes de datos que haya en la empresa, como las BD de ERP y/o CRM, fuentes de información externa, etc.
- Análisis / Visualización: En multitud de ocasiones suele suceder que el usuario final no está dispuesto a cambiar sus herramientas, las que usa para analizar y visualizar la información y los cuadros de mando.
Debido a ello, la arquitectura que presentaremos a continuación será independiente tanto del origen como de la herramienta de análisis y visualización en cuestión. Dicho esto, nos centraremos en la pieza central, el motor de la nueva arquitectura de analítica de Amazon Analytics.
ETL + DataWarehouse en pago por uso
Como puede apreciarse en la imagen anterior, los componentes que facilitan la funcionalidad tradicional bajo las premisas de pago por uso son los siguientes:
1. AWS DMS (Database Migration Service):
Servicio orientado a la migración y sincronización de bases de datos y que, en este caso, será el encargado de importar los datos desde las bases de datos originales hasta el servicio AWS S3.
Respecto a la facturación, el coste de este servicio depende de la capacidad de cómputo asignada a la tarea de extracción de la información y del tiempo que tarda en completar la tarea, por lo que, una vez finaliza la importación de la información, su coste pasa a ser 0 hasta que se realice la siguiente sincronización de datos.
2. AWS S3:
Servicio de almacenamiento de objetos, que ofrecerá la funcionalidad de área donde se vuelcan los datos extraídos de las BD origen, así como los datos procesados por el servicio AWS Glue.
A nivel de costes, se facturará por la cantidad de almacenamiento ocupado y por el número de escrituras y lecturas realizadas.
3. AWS Glue:
Servicio de integración de datos encargado de realizar las tareas de transformación necesarias y, posteriormente, actualizar los datos y metadatos del catálogo de datos, que será quien, finalmente, exponga los datos preparados para su consumo.
Como todo servicio Serverless, su facturación irá en función del tiempo de procesamiento de los datos importados, así como en la capacidad de cómputo necesitada para realizar dicha tarea.
4. AWS Athena:
Servicio interactivo de consultas de Amazon Web Services. Es el encargado de ejecutar las consultas provenientes de las herramientas de Analítica y Visualización sobre los datos procesados y expuestos en el catálogo de datos de AWS Glue.
Al ser serverless, la facturación de este servicio se realiza en función de la cantidad de información escaneada en cada consulta, por lo que, cuanto más optimizada esté dicha consulta, menor coste supondrá este servicio.
Beneficios de las soluciones Analytics de AWS
Somos firmes defensores de que la tecnología debe estar al servicio de negocio y debe poder ser lo suficientemente elástica para que ofrezca el rendimiento óptimo en cada momento, evitando ser un obstáculo.
Propuestas como esta, realizadas sobre los pilares de:
- Optimización de costes
- Pago por uso
- Elasticidad
- Serverless
Elige Neteris
En Neteris te ayudamos a evaluar las necesidades de negocio y traducirlas al lenguaje de IT, eligiendo la solución o el servicio que mejor cubre los requerimientos de cada compañía. Por tanto, no dudes en contactar con nosotros para estudiar tu caso y analizar cuál es la forma óptima de cumplir con los requisitos de tu negocio.