El big data ya es bien conocido por muchas empresas, mientras que el agotamiento de datos lo es mucho menos. Los macrodatos son datos primarios relacionados con el núcleo de su negocio, mientras que el agotamiento de datos son datos secundarios que se crean día a día.para. Los datos primarios y secundarios nos ayudarán hoy a explicar un poco el big data y el agotamiento de datos.
Para ver las diferencias entre Big Data y la extracción de datos basada en datos primarios y secundarios, veremos 5 cosas que debe comprender sobre la extracción de datos para comprender los pros y los contras de este tipo de datos.
1. Es esencialmente todo el Big Data que no pertenece al núcleo de su negocio.
El término escape de datos se ha utilizado durante más de una década, y surgió como resultado de nuevos flujos de datos de teléfonos inteligentes. Hoy en día, las herramientas de datos más accesibles están poniendo en primer plano el agotamiento de los datos.
Los datos primarios y secundarios tienen mucho que ver con esto. Si los macrodatos son datos primarios relacionados con la función principal de su empresa, El escape de datos son datos secundarios, o lo que es lo mismo, todo lo demás que se ha creado a lo largo del camino.. Por ejemplo, un banco consideraría todos los datos sobre débitos y créditos de las cuentas de sus clientes como primarios. Los datos secundarios pueden incluir información como un porcentaje de las transacciones de los clientes que ocurren en los cajeros automáticos en lugar de en una sucursal física.
No existen definiciones o esquemas estándar para el agotamiento de datos, que tiende a ser bruto y no estructurado, pero En muchos sentidos, es equivalente a los subproductos asociados con las máquinas de una empresa y el núcleo de las actividades en línea.. Puede incluir transmisiones de navegadores web, complementos, archivos de registro, dispositivos de Internet de las cosas y más.
2. Suele ser más grande que Big Data
El término Big Data es en sí mismo un término relativo que esencialmente se reduce a cualquier cosa que sea tan grande que no se pueda inspeccionar o trabajar manualmente de un registro a otro. En general, el agotamiento de datos tiende a ser aún mayor, principalmente porque existen pocos límites a lo que una empresa puede recopilar.
Para entender esto mejor, podemos decir que Google es el líder aquí. Literalmente recopila todo, incluso antes de que sepan qué hacer con él.
Eso trae a otro característica interesante del escape de datos relacionados con datos primarios y secundarios: Los datos secundarios del escape de datos pueden convertirse en datos primarios una vez que se encuentra un uso para ellos..
3. Tiene un gran potencial
La extracción de datos puede ser enormemente útil. En el ejemplo bancario, saber dónde los consumidores realizan la mayoría de sus transacciones puede llevar al banco a hacer un mejor trabajo.
No es fundamental para la transacción, pero puede ser importante para elevar el servicio al cliente a un mejor nivel. Proporciona un nivel de comprensión y contextualización de esta transacción o servicio principal que los clientes desean cada vez más..
Agotamiento de datos Puede contener información importante que quizás no esté buscando hoy, pero que podría ser útil en el futuro..
4. Puede haber riesgos asociados con el agotamiento de datos
Generalmente se trata de cosas que los clientes pueden no estar dispuestos a darte. Por lo tanto, hay potencial Riesgos legales, de marketing y de relaciones públicas., en torno al uso de esos datos, y podría terminar alejando su base de datos de los clientes o socios, cuando saben que usted sabe cosas sobre ellos que no querían que usted supiera.
Las implicaciones pueden ser sutiles. Si una compañía de seguros que utiliza GPS para localizar su automóvil en caso de robo, aprovechó el hecho de que puede ver la ubicación GPS de todas las partes donde recientemente ha estacionado su automóvil, por ejemplo, podría aumentar las tarifas para los clientes. que habitualmente se estacionan en áreas de alta criminalidad. Sin pretender hacerlo directamente, podrías construir un algoritmo que termine discriminando racionalmente.
Otro riesgo potencial es guardar datos primarios y secundarios que nunca serán útiles..
Los CIO deben equilibrar el valor del agotamiento de datos con el desperdicio de mantener toneladas de datos inútiles para siempre. Pero eso es muy difícil de hacer en este momento.
5. Tienes que tomar algunas decisiones
La conclusión es que Es fundamental ser selectivo sobre qué datos se guardan..
Es importante comenzar a tomar algunas decisiones sobre qué desechar. Por ejemplo, cuando se trata de teléfonos inteligentes y otros dispositivos, es bien sabido que gran parte de los datos son datos asociados con la transmisión, lo cual es dudoso si es útil.
Y lo que es más, los empleados deben acercarse al núcleo del negocio, en contacto con los datos. Es posible que tengan preguntas inmediatas que muestren la relevancia de algunos datos de inmediato.
Desde una perspectiva técnica, las empresas necesitan tecnologías de almacenamiento escalables, así como herramientas para el acceso a los datos. Una de las partes más difíciles de trabajar con el escape de datos es obtener una vista única y coherente a su alrededor. Limpiar y unificar esos datos puede ser un desafío.
Con datos primarios y secundarios, las empresas no suelen preocuparse al momento de la recolección, pero es importante que al menos se limpien los datos secundarios. Es importante darse cuenta de que no se trata solo de decir «aquí está toda esta pila de datos». Necesitamos hacer algo con ellos.
(function(d, s, id) {
var js, fjs = d.getElementsByTagName(s)[0];
if (d.getElementById(id)) return;
js = d.createElement(s); js.id = id;
js.src = «//connect.facebook.net/es_ES/all.js#xfbml=1&status=0»;
fjs.parentNode.insertBefore(js, fjs);
}(document, ‘script’, ‘facebook-jssdk’));