Datos masivos.

Big data hace referencia a una rama de los datos informáticos, utilizados en distintas áreas ya sea en el área de tecnologías de la información, tecnologías de la comunicación, recursos humanos, nomina, finanzas, etcétera. En general son utilizados en donde se requiera compartir datos a grandes rasgos.

Datos masivos es un término que hace referencia a una cantidad de datos, tal que, supera la capacidad del hardware habitual para ser capturados, gestionados y procesados en un tiempo razonable.

¿De dónde surgen estos datos?

Son generados segundo a segundo, directa o indirectamente, por cada persona clasificando la procedencia de cada uno de ellos de la siguiente manera:

  • Generados por la persona: como el nombre de la clasificación lo menciona, son generados por el envió de correos electrónicos, Whatsapp, Facebook, Twitter, Youtobe, donde se estima que cada minuto se envían más de 2,700,000 datos.
  • Transacciones de datos: este tipo de datos son generados por las llamadas telefónicas, transacciones entre cuentas bancarias, facturaciones y cualquier transmisión de datos entre usuarios registrados.
  • E-marketing y web: estos datos son generados al navegar en internet donde los mismos usuarios se convierten en creadores de contenidos.
  • M2M: machine to machine son aquellos que comparten datos con dispositivos mediadores es decir: sensores, Wifi, Bluetooth, GPS.
  • Biométrica: son datos provenientes de la seguridad y servicios de inteligencia generados por lectores biométricos, escáneres de retina, lectores de cadena de ADN.

Existen diferentes herramientas para ser usadas con el término “Big data” algunas de ellas y las más populares son:

  • Hadoop.
  • NoSQL.
  • Cassandra.
  • Business intelligence.

Para hacer uso de estos gestores debemos de conocer la clasificación Big data.

Las características principales que se utilizan para manejar datos masivos son:HerramientasparaBigData

  • Structured data: son datos que tienen definido su longitud y formato, además de ser almacenados en tablas, ejemplos de ello son las Base de Datos Relacionales y los datos que son alojados en hojas de cálculo.
  • Unstructured data: son todos aquellos datos que se muestran tal y como fueron recolectados, para identificarlos mejor, son aquellos datos que no es posible almacenar en una tabla o base de datos, ejemplo de ello son los documentos con extensiones pdf, documentos multimedia o simples documentos de texto.
  • Semistructured data: es información poco regular como para ser tratada de una forma estándar, proseen sus propios metadatos que describen a los objetos un ejemplo de datos semiestructurados son los documentos HTML, XML, JSON Con el conocimiento necesario de cómo son clasificados los datos masivos, además de conocer sus herramientas gestoras y de donde proviene tal magnitud de datos, lo único que faltaría por comprender seria el análisis que se hace para estos datos.

Para realizarlo es necesario utilizar las técnicas de análisis de datos.

  • Asociación: puede ser la venta cruzada en los e-commerce pues permite encontrar relaciones entre diferentes variables.
  • Data mining: es utilizado en grandes cantidades de datos para descubrir patrones, tiene como objetivo encontrar comportamientos predictivos, combinando métodos estadísticos y machine learning estos  almacenados en base de datos.
  • Clustering: tiene la finalidad de encontrar similitudes ente los grupos más pequeños de los cuales no se conoce el parecido y arroja nuevos conocimientos y similitudes de datos comparados.

Este conjunto de tecnologías pueden ser utilizadas en una gran variedad de ámbitos laborales, para poder lograr una mejor organización de nuestra información.

 

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s