NOTE: CentOS Enterprise Linux is built from the Red Hat Enterprise Linux source code. Other than logo and name changes CentOS Enterprise Linux is compatible with the equivalent Red Hat version. This document applies equally to both Red Hat and CentOS Enterprise Linux.
Linuxtopia - CentOS Enterprise Linux 4: Introduccion a la administracion de sistemas - Respaldos
Red Hat Enterprise Linux 4: Introducci�n a la administraci�n de sistemas
Los respaldos o copias de seguridad tienen dos objetivos principales:
Permitir la restauraci�n de archivos individuales
Permitir la restauraci�n completa de sistemas de archivos completos
El primer prop�sito es la base para las peticiones t�picas de restauraciones de archivos: un usuario accidentalmente borra un archivo y le pide restaurarlo desde el �ltimo respaldo. Las circunstancias exactas pueden variar, pero este es el uso diario m�s com�n de los respaldos.
La segunda situaci�n es la peor pesadilla de un administrador de sistemas: por la situaci�n que sea, el administrador se queda observando un hardware que sol�a ser una parte productiva del centro de datos. Ahora, no es m�s que un pedazo de acero y silicon in�til. Lo que est� faltando en todo el software y los datos que usted y sus usuarios habian reunido por a�os. Supuestamente todo ha sido respaldado. La pregunta es: �Est� seguro?
Y si lo ha sido, �Lo puede restaurar?
8.2.1. Datos diferentes: Necesidades de respaldos diferentes
Observe el tipo de datos[1] procesados y almacenados por un sistema computacional t�pico. Observe que algunos de los datos raramente cambian y otros cambian constantemente.
El ritmo al cual los datos cambian es crucial para el dise�o de un procedimiento de respaldo. Hay dos razones para esto:
Un respaldo no es m�s que una instant�nea de los datos respaldados. Es un reflejo de los datos en un momento particular.
Los datos que cambian con poca frecuencia se pueden respaldar menos a menudo, mientras que los datos que cambian regularmente deben ser copiados frecuentemente.
Los administradores de sistemas que tienen un buen entendimiento de sus sistemas, usuarios y aplicaciones deber�an ser capaces de agrupar r�pidamente en sus sistemas en diferentes categor�as. Sin embargo, he aqu� algunos ejemplos para comenzar:
Sistema operativo
Estos datos solamente cambia durante las actualizaciones, las instalaciones de reparaciones de errores y cualquier modificaci�n espec�fica al sitio.
Sugerencia
Deber�a de molestarse con el respaldo del sistema operativo? Esta es una pregunta que muchos administradores de sistemas operativos han evaluado por muchos a�os. Por un lado, si el proceso de instalaci�n es relativamente f�cil y si las reparaciones de fallos y personalizaciones est�n bien documentadas y son f�ciles de reproducir, la reinstalaci�n del sistema operativo puede ser una opci�n viable.
Por otro lado, si hay alguna duda de que una instalaci�n fresca pueda recrear completamente el ambiente original del sistema, el respaldo del sistema operativo es la mejor opci�n, a�n si los respaldo se realizaron con mucho menos frecuencia que los respaldos de datos de producci�n. Los respaldos ocasionales de sistemas operativos son �tiles cuando se deben restaurar solamente unos pocos sistemas operativos (por ejemplo, debido a la eliminaci�n accidental de un archivo).
Software de aplicaciones
Estos datos cambian cuando se instalan, actualizan o eliminan aplicaciones.
Datos de aplicaciones
Estos datos cambian tan frecuente como lo hacen las aplicaciones asociadas. Dependiendo de la aplicaci�n espec�fica y su organizaci�n, esto puede significar que los cambios toman lugar segundo a segundo o al final del a�o fiscal.
Datos de usuarios
Estos datos cambian de acuerdo a los patrones de uso de su comunidad de usuarios. En la mayor�a de las organizaciones, esto significa que los cambios toman lugar todo el tiempo.
Basado en estas categor�as (y cualquier otra adicional que sean espec�ficas a su organizaci�n), usted deber�a tener una buena idea concerniente a la naturaleza de los respaldos que se necesitan para proteger sus datos.
Nota
Debe tener en mente que la mayor�a del software de respaldo trata con datos en un directorio o a nivel del sistema de archivos. En otras palabras, la estructura de su sistema de archivo juega un papel importante en c�mo se ejectuten los respaldos. Esta es otra raz�n por la que es una buena idea considerar cuidadosamente la mejor estructura de directorios para un nuevo sistema y agrupar los archivos y directorios de acuerdo a su uso anticipado.
8.2.2. Software de respaldos: Comprar contra Construir
Para poder llevar a cabo los respaldos, es necesario tener el software de respaldo apropiado. Este software no solamente debe ser capaz de realizar la tarea b�sica de hacer copias de bits en una media de respaldo, tambi�n debe interactuar limpiamente con el personal y las necesidades de su organizaci�n. Algunas de las funcionalidades a considerar cuando evalue software de respaldo incluyen:
Planifica respaldos para que se ejecuten en el momento adecuado
Maneja la ubicaci�n, rotaci�n y uso de la media de respaldo
Funciona con operadores (y/o cargadores rob�ticos) para asegurarse de que la media apropiada est� disponible
Asiste a los operadores en ubicar la media que contiene un respaldo espec�fico de un archivo dado
Como puede observar, una soluci�n de respaldo del mundo real implica mucho m�s que simplemente escribir bits en su media de respaldo.
La mayor�a de los administradores de sistemas en este punto, ven hacia una de dos soluciones:
Comprar una soluci�n desarrollada comercialmente
Desarrollar una soluci�n casera de sistema de respaldo desde el principio (posiblemente integrando una o m�s tecnolog�as de c�digo abierto)
Cada enfoque tiene sus puntos buenos y sus puntos malos. Dada la complejidad de la tarea, una soluci�n casera probablemente no maneje todos los aspectos (tales como administraci�n de media, o tener el soporte t�cnico y la documentaci�n completa) muy bien. Sin embargo, para algunas organizaciones, esto quiz�s no sea una limitaci�n.
Una soluci�n desarrollada comercialmente es m�s probable que sea altamente funcional, pero tambi�n excesivamente compleja para las necesidades presentes de la organizaci�n. Dicho esto, la complejidad puede hacer posible mantenerse con una soluci�n aun si la organizaci�n crece.
Como puede ver, no hay un m�todo claro para decidirse sobre un sistema de respaldo. La �nica gu�a que se puede ofrecer es pedirle que considere los puntos siguientes:
Cambiar el software de respaldo es complicado; una vez implementado, estar� usando el software de respaldo por un largo tiempo. Despu�s de todo, tendr� archivos de respaldo por largo tiempo que podr� leer. El cambiar el software de respaldo significa que usted debe bien sea mantener el software original (para acceder a los archivos de respaldo), o que debe convertirlos para que sean compatibles con el nuevo software.
Dependiendo del software de respaldo, el esfuerzo que implica convertir archivos de respaldo puede ser tan directo (pero probablement consuma mucho tiempo) como ejecutar los respaldos a trav�s de un programa de conversi�n ya existente, o puede requerir ingenier�a inversa del formato de respaldo y escribir un software personalizado para realizar esta tarea.
El software debe ser 100% confiable - debe respaldar lo que se supone que debe respaldar y cuando se necesite.
Cuando llega el momento de restaurar los datos - ya sea un archivo �nico o un sistema de archivos completo - el software de respaldo debe ser 100% confiable.
8.2.3. Tipos de respaldo
Si le pregunta a una persona que no esta familiarizada con los respaldos o copias de seguridad de computadoras, la mayor�a pensar�a que un respaldo es una copia id�ntica de todos los datos en un computador. En otras palabras, si se cre� un respaldo el martes en la noche, y no se cambi� nada durante el miercoles completo, el respaldo del miercoles en la noche ser�a id�ntico que el del martes.
Mientras que es posible configurar los respaldos de esta forma, es probable que no lo haga. Para entender un poco m�s sobre esto, primero se debe entender los tipos de respaldo que se pueden crear. Estos son:
Respaldos completos
Respaldos incrementales
Respaldos diferenciales
8.2.3.1. Respaldos completos
El tipo de respaldo discutido al principio de esta secci�n se conoce como respaldo completo. Un respaldo completo es un respaldo donde cada archivo es escrito a la media de respaldo. Como se mencion� anteriormente, si los datos a respaldar nunca cambian, cada respaldo completo creado ser� una copia de exactamente lo mismo.
Esta similaridad se debe al hecho de que un respaldo completo no verifica para ver si un archivo ha cambiado desde el �ltimo respaldo; ciegamente escribe todo a la media de respaldo, haya sido modificada o no.
Esta es la raz�n por la que los respaldos completos no se hacen todo el tiempo - cada archivo es escrito a la media de respaldo. Esto significa el uso de gran cantidad de media de respaldo a�n cuando nada se haya cambiado. Respaldar 100 GB de datos cada noche cuando solamente cambi� 10 MB de datos, no es una buena soluci�n; por eso es que se crean los respaldos incrementales.
8.2.3.2. Respaldos incrementales
A diferencia de los respaldos completos, los respaldos incrementales primero revisan para ver si la fecha de modificaci�n de un archivo es m�s reciente que la fecha de su �ltimo respaldo. Si no lo es, significa que el archivo no ha sido modificado desde su �ltimo respaldo y por tanto se puede saltar esta vez. Por otro lado, si la fecha de modificaci�n es m�s reciente, el archivo ha sido modificado y se deber�a copiar.
Los respaldos incrementales son utilizados en conjunto con respaldos regulares completos (por ejemplo, un respaldo semanal completo, con respaldos incrementales diarios).
La principal ventaja obtenida de los respaldos incrementales es que se ejecutan much�simo m�s r�pido que un respaldo completo. La principal desventaja es que restaurar un archivo dado puede implicar pasar a trav�s de varios respaldos incrementales hasta encontrar el archivo. Cuando se restaura un sistema de archivos completo, es necesario restaurar el �ltimo respaldo completo y cada respaldo incremental subsecuente.
En un intento de aliviar la necesidad de pasar a trav�s de varios respaldos incrementales, se puede utilizar un enfoque ligeramente diferente. Esto se conoce como respaldo diferencial.
8.2.3.3. Respaldos diferenciales
Los respaldos diferenciales son similares a los respaldos incrementales en que ambos solamente copian archivos que han sido modificados. Sin embargo, los respaldos diferenciales son acumulativos — en otras palabras, con un respaldo diferencial, una vez que un archivo ha sido modificado continua siendo inclu�do en todos los respaldos diferenciales subsecuentes (hasta el pr�ximo respaldo completo).
Esto significa que cada respaldo diferencial contiene todos los archivos modificados desde el �ltimo respaldo completo, haciendo posible realizar una restauraci�n completa solamente con el �ltimo respaldo completo y el �ltimo respaldo diferencial.
De la misma manera que la estrategia de respaldo de los respaldos incrementales, los respaldos diferenciales siguen el mismo enfoque: un respaldo completo peri�dico seguido de m�s frecuentes respaldos diferenciales.
El efecto de utilizar los respaldos diferenciales de esta forma es que los respaldos diferenciales tienden a crecer un poco con el tiempo (asumiendo que diferentes archivos son modificados con el paso del tiempo entre respaldos completos). Esto coloca los respaldos diferenciales en un punto entre los respaldos incrementales y los completos en t�rminos de utilizaci�n de la media y velocidad de los respaldos, mientras que ofrecen restauraciones completas y de archivos individuales mucho m�s r�pidas (debido a que hay menos respaldos en los que buscar/restaurar).
Dadas estas caracter�sticas, vale la pena considerar cuidadosamente los respaldos diferenciales.
8.2.4. Media de respaldo
Hemos sido muy cuidadosos en seleccionar la palabra "media de respaldo" a lo largo de las secciones. Hay una raz�n para esto. Los administradores de sistemas m�s experimentados usualmente piensan sobre respaldos en t�rminos de leer y escribir en cintas, pero hoy d�a existen otras opciones.
En alg�n momento, los dispositivos de cintas eran los �nicos dispositivos de media de respaldo que se pod�an utilizar razonablemente para prop�sitos de respaldos. Sin embargo, esto ha cambiado. En las secciones siguientes vamos a tratar sobre las medias de respaldo m�s populares y revisar sus ventajas as� como tambi�n sus desventajas.
8.2.4.1. Cintas
Las cintas fueron el primer tipo de media removible disponible como medio de almacenamiento. Tiene los beneficios de bajos costos y una capacidad de almacenamiento razonablemente buena. Sin embargo, las cintas tienen algunas desventajas - es susceptible a desgastarse y el acceso a los datos en una cinta es por naturaleza secuencial.
Estos factores implican que es necesario hacer un seguimiento del uso de las cintas (retirando las cintas una vez que hayan alcanzado el final de su vida �til) y que las b�squedas de un archivo en cinta pueden ser una tarea bastante lenta.
Por otro lado, las cintas son uno de los medios de almacenamiento masivo menos costosos disponibles y tienen una larga historia de confiabilidad. Esto significa que construir una biblioteca de cintas de un buen tama�o no necesita consumir una gran parte de su presupuesto, y puede contar con poderla utilizar ahora y en un futuro.
8.2.4.2. Disco
En a�os pasados, las unidades de disco nunca se utilizaban como medio para respaldos. Sin embargo, los precios se han reducido tanto que, en algunos casos, el uso de discos duros como unidades de respaldo, tiene sentido.
La raz�n principal para el uso de unidades de disco como medio para respaldos ser�a su velocidad. No hay un medio de almacenamiento masivo m�s r�pido disponible. La velocidad puede ser un factor cr�tico cuando la ventana para hacer el respaldo de su centro de datos es corta y la cantidad de datos a copiar es grande.
Pero por varias razones el almacenamiento en disco no es el medio ideal para respaldos.
Normalmente los discos duros no son removibles. Un factor clave para una estrategia de respaldo efectiva es que se pueda retirar la media de su centro de datos y en alg�n tipo de almacenamiento fuera del sitio. Un respaldo de la base de datos de producci�n sentada en un disco duro medio metro m�s all� de la base de datos misma no es un respaldo; es una copia. Y las copias no son muy �tiles si los datos del centro de datos y sus contenidos (incluyendo las copias) son da�adas o destru�das por alg�n tipo de evento desafortunado.
Las unidades de disco duro son costosas (al menos comparadas con otros tipos de media). Hay situaciones donde el dinero realmente no es un problema, pero en todos los demas casos, los costos asociados con el uso de discos duros para respaldos significa que el n�mero de copias de respaldo se debe mantener bajo para as� mantener bajos los costos generales. Menos copias de seguridad significa menos redundancia si por alguna raz�n uno de los respaldos no se puede leer.
Los discos duros son fr�giles. A�n si hace el gasto adicional de comprar discos removibles, su fragilidad puede ser un problema. Si se le cae un disco, usted perdi� el respaldo. Es posible comprar estuches especiales que pueden reducir (pero no eliminar completamente) este peligro, pero esto hace una propuesta costosa a�n m�s costosa.
Las unidades de disco no son media para archivado. Asumiendo que pueda superar todos los otros problemas asociados con la realizaci�n de respaldos a unidades de disco, deber�a considerar lo siguiente. La mayor�a de las organizaciones tienen varios requerimientos legales para mantener los registros disponibles por cierto tiempo. Las posibilidades de obtener data utilizable desde una cinta de 20 a�os son mucho m�s grandes que las posibilidades de hacerlo desde un disco de 20 a�os. Por ejemplo, �tendr� el hardware necesario para conectarlo a su sistema? Otra cosa a considerar esn que una unidad de disco es mucho m�s compleja que una unidad de cinta. Cuando un motor de 20 a�os gira un plato de disco de 20 a�os, causando que los cabezales de lectura/escritura de 20 a�os vuelen sobre la superficie del plato, �cu�les son las posibilidades de que estos componentes funcionen sin problema despu�s de haber estado 20 a�os sentados sin hacer nada?
Nota
Algunos centros de datos hacen los respaldos a unidades de disco y luego, para prop�sitos de archivado, copian estos respaldos a unidades de cinta. Esto permite realizar los respaldos m�s r�pidos durante la ventana de respaldo que se tiene. Se puede hacer luego la escritura de los respaldos a las unidades de cinta, durante el resto del d�a laboral; siempre y cuando la grabaci�n se termine antes de que se realicen los respaldos del pr�ximo d�a laboral.
Dicho esto, todav�a existen algunas situaciones en las que los respaldos a unidades de discos duros tiene sentido. En la pr�xima secci�n podemos ver c�mo se pueden combinar con una red para formar una soluci�n de respaldo viable (pero costosa).
8.2.4.3. Red
Por s� misma, una red no puede actuar como una media de respaldo. Pero combinada con tecnolog�as de almacenamiento masivo, puede hacerlo muy bien. Por ejemplo, combinando un enlace de red de gran velocidad a un centro de datos remoto conteniendo grandes cantidades de almacenamiento en disco, repentinamente las desventajas sobre el respaldo a discos mencionadas anteriormente, dejan de ser desventajas.
Al hacer respaldos sobre la red, las unidades de disco ya se encuentran en otra ubicaci�n, fuera del sitio, por lo que no es necesario transportar unidades de discos fr�giles a otro lado. Con suficiente ancho de banda, se mantiene la ventaja de la velocidad que puede obtener por hacer los respaldos a discos.
Sin embargo, este enfoque todav�a no soluciona el problema del almacenamiento de los archivo (aunque se puede utilizar el mismo enfoque de copiar a las cintas luego de hacer el respaldo, como se mencion� anteriormente). Adem�s, los costos de un centro de datos remoto con un enlace de alta velocidad al centro de datos principal hace esta soluci�n extremadamente costosa. Pero para los tipos de organizaci�n que necesitan el tipo de funcionalidades que esta soluci�n ofrece, es un costo que pagar�an con gusto.
8.2.5. Almacenamiento de las copias de seguridad o respaldos
Una vez que se termine de hacer el respaldo, que pasa luego? La respuesta obvia es que los respaldos se deben guardar. Sin embargo, lo que no es tan obvio es exactamente qu� se deber�a almacenar - y d�nde.
Para responder a estas preguntas, primero debemos considerar bajo qu� circunstancias se utilizaran los respaldos. Hay tres situaciones principales:
Peticiones de restauraci�n peque�as y discretas de los usuarios
Restauraciones masivas para recuperarse de un desastre
Almacenamiento de archivos que raramente se utilizar� otra vez
Lamentablemente, hay diferencias irreconciliables entre el primer y segundo caso. Cuando un usuario elimina accidentalmente un archivo, usualmente quiere recuperar su archivo de inmediato. Esto implica que el medio de respaldo no est� m�s all� que unos pocos pasos del sistema en el cual se restauraran los datos.
En el caso de un desastre que necesita una restauraci�n completa de una o m�s computadoras en su centro de datos, si el desastre fue de naturaleza f�sica, lo que sea que haya sido destru�do tambi�n habr� destru�do los respaldos que estaban al lado de los computadores. Esto ser�a una situaci�n muy mala.
El almacenamiento de los archivos es menos controversial; puesto que las posibilidades de que se vuelvan a utilizar son bastante bajas, si la media de respaldo fue ubicada a muchos kil�metros de distancia del centro de datos no habr� realmente ning�n problema.
Los enfoques para resolver estas diferencias var�an de acuerdo a las necesidades de la organizaci�n en el caso. Un acercamiento posible es almacenar varios d�as de respaldo en el sitio; estos respaldos se toman luego a un sitio de almacenamiento m�s seguro cuando se creen respaldos diarios m�s nuevos.
Otro enfoque ser�a mantener dos fondos diferentes de media:
Un fondo de provisiones del centro de datos utilizado estrictamente para peticiones de restauraci�n independientes
Un fondo fuera del sitio utilizado para el almacenamiento fuera del sitio para casos de recuperaci�n en casos de desastres
Por supuesto, el tener dos fondos de datos implica la necesidad de ejecutar todos los respaldos dos veces o de hacer copias de los respaldos. Esto se puede hacer, pero los respaldos dobles pueden tomar bastante tiempo y requieren de m�ltiples unidades de respaldo para procesar las copias (y probablemente un sistema dedicado para efectuar la copia).
El reto para un administrador de sistemas es el de encontrar un balance que reuna adecuadamente las necesidades de todo el mundo, mientras que se asegura que los respaldos esten disponibles a�n en las peores situaciones.
8.2.6. Problemas de restauraci�n
Mientras que los respaldos son una ocurrencia diaria, las restauraciones generalmente son un evento menos frecuente. Sin embargo, las restauraciones son inevitables; seran necesarias, as� que es mejor estar preparados.
Lo importante que se debe hacer aqu� es ver a los diferentes escenarios de restauraci�n en esta secci�n y determinar las formas de evaluar su habilidad para llevarlos a cabo en realidad. Tenga en cuenta que el m�s dif�cil a evaluar es tambi�n el m�s cr�tico.
8.2.6.1. Restauraci�n a metal pelado
La frase "restauraci�n a metal pelado" es la forma de describir de un administrador de sistemas el proceso de restaurar un respaldo completo de sistemas en un computador sin datos de ning�n tipo en el - sin sistema operativo, sin aplicaciones, nada.
En general, existen dos enfoques para las restauraciones a metal pelado:
Reinstalar, seguido de una restauraci�n
Aqu� se instala el sistema operativo base como que si se estuviese configurando una computadora reci�n comprada. Una vez que el sistema operativo est� configurado adecuadamente, se pueden particionar y formatear los discos duros restantes y restaurar todos los respaldos desde la media.
Discos de recuperaci�n del sistema
Un disco de recuperaci�n del sistema es una media de arranque de alg�n tipo (a menudo un CD-ROM) que contiene un ambiente de sistemas m�nimo, capaz de realizar las tareas b�sicas de administraci�n del sistema. El ambiente de recuperaci�n contiene las utilidades necesarias para particionar y formatear los discos, los controladores de dispositivos necesarios para acceder el dispositivo de respaldo y el software necesario para restaurar los datos desde la media de respaldo.
Nota
Algunos computadores tienen la capacidad de crear cintas de respaldo de arranque y utilizarlas para arrancar desde ellas e iniciar el proceso de restauraci�n. Sin embargo, esta capacidad no est� disponible en todos los computadores. M�s a�n, las computadoras basadas en la arquitectura de PC no se prestan para este enfoque.
8.2.6.2. Evaluar respaldos
Cada tipo de respaldo deber�a ser evaluado de forma peri�dica para asegurarse de que los datos se pueden leer. Es un hecho que algunas veces se realizan los respaldos que son, de una forma u otra, ilegibles. La parte desafortunada en todo esto es que muchas veces esto no se nota hasta que los datos se pierden y se deben restaurar desde el respaldo.
Las razones para esto pueden variar desde cambios en la alineaci�n de los cabezales de la unidad de cinta, software de respaldo mal configurado o un error del operador. No importa la causa, sin las revisiones peri�dicas usted no puede estar seguro de si est� generando respaldos a partir de los cuales se puedan restaurar los datos m�s adelante.
Estamos usando el t�rmino datos en esta secci�n para describir cualquier cosa que se procesa por el software de respaldo. Esto incluye software del sistema operativo, software de aplicaciones, as� como tambi�n los datos reales. No importa lo que sea, para el software de respaldos, todos son datos.