Muchas empresas hoy en día hablan de BigData, generan proyectos e invierten dinero en BigData y se leen o escuchan conversaciones en las cuales se dice ¿O sea que ya no necesito Data WareHousing?
La verdad es que son dos cosas distintas, ¡Muy Distintas! Big data es una tecnologia y DataWare House es una arquitectura. Si vamos a los principios de un Data WareHouse que expresa Kimball:
- Un Data Warehouse proporciona una visión global, común e integrada de los datos de la organización, independiente de cómo se vayan a utilizar posteriormente por los consumidores o usuarios. Normalmente en el almacén de datos habrá que guardar información histórica que cubra un amplio período de tiempo. Pero hay ocasiones en las que no se necesita la historia de los datos, sino sólo sus últimos valores, siendo además admisible generalmente un pequeño desfase o retraso sobre los datos operacionales. En estos casos el almacén se llama almacén operacional (ODS, Operational Data Store).

Si con tu Data WareHouse no estas en capacidad de relacionar los datos por ejemplo de: atención de clientes con los datos de consumo y la respuesta financiera a la variación de estas dos variables, te informo que en realidad tienes una agrupación de varios datamart en un solo servidor no un Data WareHouse. Y si aun peor los datos que tienes en tu "DataWarehouse" están en tercera forma normal ni la mas remota idea de que es lo que tienes, tal vez un "data warhouse", seria un híbrido entre una copia de tu aplicación de negocio mezclado con un datamart.
Ahora que tenemos definido lo que es un Data Warehouse y sabemos que es una arquitectura que nos sirve para agregar valor al negocio ya podremos definir lo que es Big Data.Hay muchas formas de definirlo pero una de las mas generalizadas es la que encontró hadoop:
- Tecnología capaz de almacenar grandes cantidades de datos.
- Tecnología que puede contener los datos en dispositivos de almacenamiento de bajo costo.
- Tecnología, donde el procesamiento se realiza por el método de "censo romano".
- Tecnología donde los datos son almacenados en formato no estructurado
Pueden haber mas características de una implementación de big data pero estas son las que se consideraran mínimas para Hadoop.
Como podemos ver las diferencias son gigantescas, Big Data en una tecnología que nos permite almacenar y manejar grandes volúmenes de datos y data ware housing es una forma o arquitectura para organizar datos que proporcionan credibilidad e integridad en un único entorno.
Las tecnologías de BigData están en capacidad de analizar fuentes de diferentes tipos de información estructurada y no estructurada, almacenada en diferentes medios, provenientes de diferentes plataformas que no tienen ningún tipo de relación entre si, todo esto sin necesidad de darle estructura a los datos ni almacenarlos dentro de un único contenedor.