Un lago de datos es un sistema o biblioteca de datos almacenados en un formato en bruto. Habitualmente es un único repositorio de datos que incluye copias sin tratamiento alguno de datos del sistema, de sensores, datos sociales y otros. Un lago de datos puede incluir datos estructurados de bases de datos relacionales, datos semiestructurados (CSV, logs, XML), datos sin estructurar (correos electrónicos, documentos, PDF) y datos binarios (imágenes, audio, video). Una definición de lago de datos podría ser la siguiente: repositorio de datos central, que ayuda a abordar los problemas relacionados con los silos de datos. Es importante destacar que un lago de datos almacena grandes cantidades de elementos sin procesar en su formato original. Ese formato podría ser estructurado, no estructurado o semiestructurado. Para que se tenga una idea de la importancia de este nuevo concepto, se estima que el valor del mercado de los lagos de datos, para el año 2026 será de 17 600 millones de dólares.













COMENTAR
Responder comentario