Tape vs Cloud

Traducimos (libremente) desde BSCM un artículo original de Joseph Ortiz en StorageSwiss.com que nos parece interesante para nuestros seguidores. Ver nuestra opinión al final del artículo.

El almacenamiento en la nube (pública, privada, interna) es seguramente la mejor opción para la información activa, pero se vuelve mucho más costoso para almacenar datos “fríos”¹ a los que raramente accedemos.

Normalmente se tiene en cuenta que el almacenamiento en la nube conlleva algunos problemas particulares, como la latencia, el ancho de banda, o problemas de seguridad específicos, pero muchas veces no se examina con detalle el coste de este tipo de almacenamiento, considerando los costes potenciales de almacenar de este modo grandes cantidades de información “fría” e histórica durante largos periodos de tiempo. Hasta ahora.

Haciendo cálculos

Primero, vamos a examinar cual es el coste de almacenar una cantidad relativamente grande de información “fría” en la nube a largo plazo.

El precio de almacenamiento a largo plazo en la mayoría de los proveedores de servicio en la nube ronda los 0,007 € por mes.

Si una organización necesita proteger 100Tb de daos en la nube durante los próximos 10 años, cuál sería el coste? A 0,007 €/Gb por mes, los números serían:

  • Coste medio mensual por 100Tb de almacenamiento en la nube son 700 €
  • Coste anual por 100 Tb: 700 € x 12 = 8.400 €
  • Coste por 100 Tb durante 5 años: 8.400 € x 5 = 42.000 €
  • Coste de 100 Tb durante 10 años: 8.400 € x 10 = 84.000 €

Si la misma organización necesita almacenar 500 Tb de información en la nube, los números se parecerían a estos:

  • Coste medio mensual por 500Tb de almacenamiento en la nube son 3.500 €
  • Coste anual por 500 Tb: 700 € x 12 = 42.000 €
  • Coste por 500 Tb durante 5 años: 8.400 € x 5 = 210.000 €
  • Coste de 500 Tb durante 10 años: 8.400 € x 10 = 420.000 €

Y si la misma organización necesita almacenar 1 Pb, los costes serían:

  • Coste medio mensual por 1Pb de almacenamiento en la nube son 7.000 €
  • Coste anual por 1Pb: 700 € x 12 = 84.000 €
  • Coste por 1Pb durante 5 años: 8.400 € x 5 = 420.000 €
  • Coste de 1Pb durante 10 años: 8.400 € x 10 = 840.000 €

Estos costes básicos son sólo de almacenamiento de las cantidades indicadas y no tienen en cuenta que el volumen de información generalmente aumenta una media del 50% o más cada año. Tampoco incluyen otros costes asociados al acceso, borrado o descarga de esta información, o a su transferencia a otras regiones o ubicaciones.

El coste de recuperar esta información a menudo es difícil de calcular y puede suponer importes sustanciales dependiendo de la cantidad de información a recuperar, cómo estaba almacenada ésta (en ficheros individuales o en grandes ficheros de archivo) y cómo se recupera.

Lo normal es que sólo ocasionalmente se acceda a la información “fría” o de archivo, pero algunas circunstancias como por ejemplo una demanda pueden ser el detonante de la necesidad de acceder a cantidades significativas de datos en un periodo corto de tiempo. Además, muchas organizaciones empiezan a ver el potencial de sus datos históricos llevándoles a operaciones de “data mining” para obtener valor económico de estos datos, lo que también requiere de la recuperación de cantidades importantes de información.

Hay otros aspectos como la encriptación de la información en la nube, quien controla las claves de encriptado, la cadena de custodia de tus datos y seguridad. La información se salvaguarda electrónicamente en una red que es siempre potencialmente susceptible de recibir ciberataques.

Un buen ejemplo de esto fue el caso de Code Spaces, una reputada compañía que ofrecía servicios SaaS (Infraestructura como Servicio) y que tuvo que cesar el negocio por un ciberataque. Esta era una empresa de vanguardia en 2014 y tenía la mayor parte de sus recursos e infraestructuras en la nube, incluyendo sus backups, algunos de los cuales se consideraba que debían estar off-site porque había diferentes copias distribuidas a través de su proveedor de servicios en la nube. Sin embargo, un hacker consiguió el control de las cuentas de su proveedor de servicios y cuando Code Spaces intentó recobrar el control, el hacker destruyó prácticamente toda su información, configuraciones de servidores, servidores virtuales y sus copias de seguridad. Estos backups deberían haber estado off-site, pero todavía permanecían online. Sin poder recuperar sus datos, la compañía se vio obligada a cerrar. Este incidente subraya la importancia de tener copias de seguridad fuera de línea (off-line backups) de tu información así como unos protocolos de seguridad y de backup adecuados.

Pero qué pasa con la cinta?

El precio medio de compra de un LTO6 es de aproximadamente 30 €. Usando la capacidad nativa del soporte, esto hace que el coste por Gb de la cinta sea aproximadamente de 0,00012 €, muy inferior al coste de almacenamiento en la nube. Pero hay otra diferencia clave entre la cinta y el almacenamiento en la nube. El almacenamiento en la nube es un coste recurrente que tienes que pagar cada mes, cada año, pero la compra de cintas es una inversión única.

Almacenar 1Pb de datos en cintas LTO6 a su capacidad nativa de 2,5 Tb por cinta requiere 400 cintas. A 30 € cada una, esto sería un coste de 12.000 € en una sola ocasión. Si se usa la capacidad de la cinta comprimida, 6,25 Tb por cinta, necesitarías 160 cintas con un coste de 4.800 € una sola vez.

Otro factor de coste relacionado con las cintas sería el almacenamiento externo en un proveedor de servicios en unas instalaciones adecuadamente protegidas (climatización y seguridad) y con una adecuada cadena de custodia. El coste de este tipo de servicio puede variar en función del proveedor, del número de cintas a almacenar, cómo están guardadas, y con cargos por cada viaje y movimientos de soportes.

Usando los números de un servicio de custodia off-site, almacenar 1Pb de datos en 160 cintas LTO6 , en contenedores, con un intercambio diario producen los siguientes costes:

  • Almacenamiento de 160 cintas en contenedores a 0,89 € por cinta = 142,40 € al mes
  • Almacenamiento de 160 cintas en contenedores x 12 meses = 1.708,80 € al año
  • Almacenamiento de 160 cintas en contenedores durante 5 años = 8.544 €
  • El coste por 10 años sería de 85.440 €

Habría que tener en cuenta otros costes como el hardware y el mantenimiento, así como nuevas cintas. Desde que hace unos años apareció el LTO6, muchas organizaciones que usan librerías de cintas han actualizado ya sus unidades (drives) por lo que el coste principal sería por el mantenimiento del hardware existente. Estos costes varían dependiendo del proveedor de servicio, del hardware incluido y de los tiempos de respuesta requeridos.

Otro coste delicado corresponde a los trabajadores que manejan la carga y la rotación de las cintas de la librería a las instalaciones de custodia. Este puede variar mucho dependiendo de la configuración del hardware, los requisitos de rotación, el tipo de personal utilizado, etc.

También hay que tener en cuenta que muchas de las grandes empresas y algunas de las mayores PYMEs que vienen actuando desde hace una década o más, y que tienen grandes cantidades de información a almacenar, tienen también centros de datos, infraestructuras y almacenamiento, incluyendo librerías de cintas. Por lo tanto, ya han invertido en las cosas que el almacenamiento en la nube puede ahorrar costes a una organización que no las tenga. Evidentemente estas empresas no estarán pensando en desmontar y tirar todo este equipamiento.

Conclusión

La cinta hoy ofrece algunos atractivos muy convincentes como el bajo coste de adquisición, compatibilidad con sistemas anteriores, escalabilidad, alto rendimiento, longevidad, alta capacidad y portabilidad. El formato LTFS y su compatibilidad con versiones anteriores de LTO, ayuda a asegurar que podrás leer y recuperar tus datos en el futuro sin la necesidad de aplicaciones propietarias.

Más importante aún, la cinta puede ofrecer una última línea de defensa contra los ciberataques y la corrupción de datos que puede afectar a las copias de información almacenada en diferentes discos en la compañía o en la nube.

Por último, cada organización tendrá que examinar detenidamente los costes de almacenamiento, local o en la nube, de su información “fría” y de archivo, para determinar qué estrategia (alquilar o comprar) será la más eficiente en costes para ellas.

Desde BSCM consideramos que hay algunas cuestiones no contempladas en el artículo, como por ejemplo (por citar algunos) costes de licencias de software o costes asociados a la migración de datos que perjudican a la opción de cintas, o como costes asociados al Centro de Proceso de Datos o  impacto medioambiental que perjudican a la Nube. Lo importante es destacar como un estudio pormenorizado de la mejor solución seguramente llevará a un mix de ambas opciones (BSCM ofrece las dos), si lo que prima es la eficiencia y no la eficacia.

Puede acceder al artículo original en:

http://storageswiss.com/2016/02/22/tape-vs-cloud-for-archive-and-cold-data/

¹ Se considera datos “fríos” o información “fría” (cold data) como aquella información que no será accedida muy a menudo (o quizá nunca) pero es necesario