Herramientas de virtualización libres para sistemas GNU/Linux

Congreso Internet del Mediterráneo

Sergio Talens Oliag

sto@iti.upv.es

25 de septiembre de 2010

Resumen

En esta presentación hablaremos de qué son y cómo funcionan los sistemas de virtualización y las herramientas relacionadas. Una vez introducidos los conceptos básicos comentaremos con más detalle algunas de las soluciones de virtualización disponibles en las distribuciones de GNU/Linux actuales (fundamentalmente para Debian GNU/Linux y derivadas, a pesar de que también funcionan en otras distribuciones), con una pequeña explicación de sus características, casos de uso y modo de funcionamiento.

Contenido

¿Qué es la virtualización?
Tipos de virtualización
Emulación a nivel de aplicación (1)
Emulación a nivel de aplicación (2)
Emulación a nivel de aplicación (3)
Virtualización nativa sin apoyo hardware (1)
Virtualización nativa sin apoyo hardware (2)
Virtualización nativa sin apoyo hardware (3)
Virtualización nativa con apoyo hardware (1)
Virtualización nativa con apoyo hardware (2)
Virtualización nativa con apoyo hardware (3)
Virtualización nativa con apoyo hardware (4)
Paravirtualización (1)
Paravirtualización (2)
Paravirtualización (3)
Virtualización a nivel de sistema operativo (1)
Virtualización a nivel de sistema operativo (2)
Virtualización a nivel de sistema operativo (3)
Sistemas de virtualización para GNU/Linux
Sistemas de virtualización para GNU/Linux
Bochs
QEMU (1)
QEMU (2)
VirtualBox (1)
VirtualBox (2)
VirtualBox (3)
VirtualBox (4)
VirtualBox (5)
VirtualBox (6)
KVM (1)
KVM (2)
KVM (3)
KVM (4)
KVM (5)
User-Mode Linux (1)
User-Mode Linux (2)
Xen (1)
Xen (2)
Xen (3)
Linux-VServer (1)
Linux-VServer (2)
Linux-VServer (3)
OpenVZ (1)
OpenVZ (2)
LXC (1)
LXC (2)
Herramientas relacionadas
Frontends de escritorio
aqemu
kemu
virt-manager
Frontends Web
Frontends Web
qemudo
phpVirtualBox
OpenVCP
OpenVZ Web Panel
WebVZ
xvp
ConVirt
oVirt
Distribuciones especializadas
ProxmoxVE
Virtualización de otros recursos
Ventajas de usar linux como anfirión
Ejemplos de uso
Uso de user-mode-linux para formación (1)
Uso de user-mode-linux para formación (2)
Uso de user-mode-linux para formación (3)
Uso de VirtualBox para formación (1)
Uso de VirtualBox para formación (2)
Uso de linux-vserver en el ITI (1)
Uso de linux-vserver en el ITI (2)
Uso de linux-vserver en el ITI (3)
Uso de linux-vserver en el ITI (4)
Uso de linux-vserver en el ITI (5)
Uso de linux-vserver en el ITI (6)
Uso de linux-vserver en el ITI (7)
Uso de linux-vserver en el ITI (8)
Uso de linux-vserver en el ITI (9)
Uso de Proxmox en el ITI (1)
Uso de Proxmox en el ITI (2)
Uso de Proxmox en el ITI (3)
Uso de Proxmox en el ITI (4)
Uso de Proxmox en el ITI (5)
Uso de Proxmox en el ITI (6)
Uso de Proxmox en el ITI (7)
Uso de Proxmox en el ITI (8)
Uso de Proxmox en el ITI (9)
Uso de Proxmox en el ITI (10)

¿Qué es la virtualización?

En esta presentación hablamos de la virtualización de plataforma o virtualización de servidores que definiremos como:

La capacidad de ejecutar en un único equipo físico (el anfitrión o host) múltiples sistemas operativos invitados (guests)

La idea básica es poder ejecutar programas de usuario dentro de un entorno virtual sin tener que modificarlos (algunos sistemas de virtualización modifican el sistema operativo invitado para que los programas de usuario puedan funcionar sin cambios)

Tipos de virtualización

Distinguiremos los siguientes tipos de virtualización:

Emulación o simulación del hardware a nivel de aplicación
Virtualización completa o nativa sin apoyo hardware
Virtualización completa o nativa con apoyo hardware
Paravirtualización
Virtualización a nivel de sistema operativo

A continuación explicaremos como funcionan y veremos ejemplos de sistemas reales que los implementan.

Emulación a nivel de aplicación (1)

Una aplicación simula el hardware completo, permitiendo la ejecución de sistemas operativos sin modificar.

La ejecución se hace bajo el control del emulador que simula el sistema completo, incluyendo la ejecución de las instrucciones a nivel de CPU. El emulador simula la ejecución de código binario para una CPU concreta en un sistema real que usa un procesador y un juego de instrucciones diferente al del sistema emulado.

Emulación a nivel de aplicación (2)

El inconveniente de este modelo de virtualización es que la simulación es muy lenta (para cada instrucción del sistema emulado puede ser necesario ejecutar entre 100 y 1000 instrucciones a la CPU real), a pesar de que en algunos casos no es un problema grande (por ejemplo la emulación de sistemas de los años 80 en hardware actual funciona mucho más rápida que en los equipos originales).

Emulación a nivel de aplicación (3)

Ejemplos:

Bochs: http://bochs.sourceforge.net/
MAME: http://mamedev.org/
QEMU: http://bellard.org/qemu/

Virtualización nativa sin apoyo hardware (1)

Este tipo de sistemas usan una máquina virtual que hace de intermediaria entre el sistema invitado y el hardware real.

El software de virtualización es conocido generalmente como monitor de máquina virtual (VMM, Virtual Machine Monitor) o hipervisor (hypervisor).

Virtualización nativa sin apoyo hardware (2)

En este tipo de sistemas el hipervisor se encarga de emular un sistema completo y analiza dinámicamente el código que quiere ejecutar el sistema invitado, reemplazando las instrucciones críticas (las que hace falta virtualizar) por nuevas secuencias de instrucciones que tienen el efecto deseado en el hardware virtual, mientras que las instrucciones no críticas se ejecutan tal cual en la CPU real.

Virtualización nativa sin apoyo hardware (3)

Este tipo de sistemas permiten la ejecución de sistemas operativos sin modificar.

Ejemplos:

VirtualBox: http://www.virtualbox.org/
VMWare: http://www.vmware.com/

Virtualización nativa con apoyo hardware (1)

Estos sistemas funcionan como los sistemas de virtualización completa sin apoyo hardware, pero aprovechan instrucciones incorporadas a las nuevas generaciones de microprocesadores como las de Intel (Intel-VT, VT-x para 32 bit y VT-y para 64 bit) y AMD (AMD-V) para ejecutar el hipervisor o VMM con el máximo nivel de acceso a la CPU (Anillo -1 en procesadores AMD e Intel) y los invitados se ejecutan a un nivel inferior (Anillo 0 en procesadores AMD e Intel, que era es el máximo nivel de ejecución en procesadores sin soporte para la virtualización).

Virtualización nativa con apoyo hardware (2)

Anillos de privilegio en x86

Virtualización nativa con apoyo hardware (3)

Con la introducción de un nivel superior al que ya usaban los sistemas reales conseguimos que no sea necesario hacer ningún cambio a los sistemas invitados, pero ahora esos sistemas no tienen acceso a los dispositivos reales y es la CPU quién avisa al VMM cuando se quieren ejecutar instrucciones para acceder a los dispositivos desde los sistemas invitados y es el hipervisor quién se encarga de dar el acceso a los dispositivos virtuales o reales que correspondan.

Virtualización nativa con apoyo hardware (4)

Ejemplos:

KVM: http://kvm.qumranet.com/
VirtualBox: http://www.virtualbox.org/
VMWare: http://www.vmware.com/
Xen: http://www.xen.org/

Paravirtualización (1)

Son sistemas similares a los de virtualización completa, que ejecutan el sistema invitado con un hipervisor que se ejecuta sobre el sistema real, pero en este tipo de virtualización se modifica el sistema operativo invitado para que llame directamente al hipervisor cuando es necesario.

La ventaja es que salvo por las modificaciones del núcleo del sistema invitado, los programas de usuario se pueden ejecutar sin ningún cambio.

Paravirtualización (2)

Un caso extremo de este modelo de virtualización es el del UML (User-mode Linux), en el cual el núcleo del sistema invitado se transforma en una aplicación a nivel de usuario que hace la función de hipervisor y se encarga de emular el hardware, a pesar de que lo hace a nivel de la interfaz del sistema operativo y no emulando el hardware (como el acceso a los dispositivos dentro del sistema invitado siempre se hace a través del núcleo no hace falta emular el hardware, sólo la visión que tienen de él los programas de usuario).

Paravirtualización (3)

El gran problema de este modelo es que hace falta modificar el sistema operativo invitado, cosa que no es posible en algunos casos (por ejemplo, ¿cómo modificamos el código de Windows XP para que funcione con para-virtualización?).

Ejemplos:

User-mode Linux: http://user-mode-linux.sourceforge.net/
Xen: http://www.xen.org/

Virtualización a nivel de sistema operativo (1)

En estos sistemas sólo ejecutamos un núcleo (el del anfitrión) y este crea entornos de ejecución que las aplicaciones ven como máquinas virtuales.

En este tipo de sistemas no hace falta emular el hardware a bajo nivel, puesto que en realidad es el mismo sistema operativo quién controla los dispositivos físicos. Lo que sí se suele hacer es incluir apoyo para tener dispositivos virtuales como discos o tarjetas de red dentro de cada entorno de ejecución.

Virtualización a nivel de sistema operativo (2)

La idea es que los programas se ejecutan en un entorno que hace creer a las aplicaciones que se encuentran en un sistema independiente cuando en realidad comparten recursos con otras máquinas virtuales, a pesar de que el sistema organiza las cosas para evitar que los entornos se interfieran entre ellos.

Este es uno de los modelos de virtualización más económico, puesto que no necesita apoyo del hardware ni hace falta supervisar el código a bajo nivel, aunque tiene el inconveniente que sólo permite ejecutar entornos virtuales para la misma CPU y sistema operativo que ejecuta el servidor y al sólo haber un núcleo si ese tiene un problema todas las máquinas virtuales lo tienen.

Virtualización a nivel de sistema operativo (3)

Ejemplos:

Linux-VServer: http://www.linux-vserver.org/
LXC: http://lxc.sourceforge.net/
OpenVZ: http://www.openvz.org/

Sistemas de virtualización para GNU/Linux

En este apartado comentaremos las características de algunos sistemas de virtualización disponibles para GNU/Linux:

Bochs (<http://bochs.sourceforge.net/>)
QEMU (<http://wiki.qemu.org/>)
VirtualBox (<http://www.virtualbox.org/>)
KVM (<http://kvm.qumranet.com/>)

Sistemas de virtualización para GNU/Linux

User-Mode Linux (<http://user-mode-linux.sourceforge.net/>)
Xen (<http://www.xen.org/>)
Linux-VServer (http://www.linux-vserver.org/)
OpenVZ (http://www.openvz.org/)
LXC (http://lxc.sourceforge.net/)

Bochs

Es un emulador de arquitecturas basadas en x86 que funciona en múltiples plataformas; el mayor interés de Bochs es que es capaz de emular un PC completo incluyendo los periféricos y funciona en prácticamente cualquier sistema anfitrión (por ejemplo se puede usar para emular un PC en un Linux que se ejecuta en una arquitectura PowerPC, Alpha, SPARC o MIPS).

El problema de este sistema es que es muy lento. De todos modos las últimas versiones van mejorando la velocidad de emulación empleando técnicas de optimización como las descritas el artículo Virtualization without Direct Execution or Jitting: Designing a Portable Virtual Machine Infrastructure de Darek Mihocka y Stanislav Shwartsman.

QEMU (1)

QEMU es un emulador similar a Bochs que tiene dos modos de funcionamiento, uno de emulación de sistema completo y otro de emulación en modo usuario.

En el modo de sistema completo el programa emula un equipo entero (por ejemplo un PC basado en microprocesadores x86 o x86_64) incluyendo múltiples procesadores y periféricos. Este modo se usa para ejecutar sistemas operativos completos. En las últimas versiones del programa se soportan más de 15 arquitecturas diferentes.

QEMU (2)

En la emulación en modo usuario el programa puede ejecutar programas compilados para una CPU concreta en un sistema que funciona sobre una CPU diferente; esto se puede emplear, por ejemplo, para ejecutar el Wine en una arquitectura no Intel.

Para las arquitecturas x86 QEMU soporta el uso de un módulo de aceleración para sistemas anfitriones Linux y Windows que permite que parte del código que se ejecuta en los sistemas invitados sea ejecutado directamente por la CPU real, haciendo que el QEMU funcione como un sistema de virtualización nativa en lugar de como un emulador.

VirtualBox (1)

Oracle VM VirtualBox es un software de virtualización para arquitecturas x86 que funciona sobre múltiples sistemas operativos (la versión actual tiene binarios para GNU/Linux, Mac OS X, Solaris/OpenSolaris y Windows). Existen dos versiones del producto, una libre y otra con licencia privativa, aunque las diferencias entre ellas son pocas.

Permite crear máquinas virtuales de 32 y 64 bits, cada máquina virtual puede arrancarse, suspenderse y pararse de modo independiente y como los ficheros que definen la máquina virtual son los mismos en todos los sistemas anfitriones es fácil mover las máquinas virtuales entre distintos equipos, además de permitir la importación y exportación de máquinas virtuales en el formato de virtualización abierto (OVF, por Open Virtualization Format).

VirtualBox (2)

Otra característica importante del virtualizador es que puede funcionar sin soporte de virtualización hardware, pero si trabajamos en máquinas con instrucciones VT-x o AMD-V el sistema las aprovecha para mejorar el rendimiento.

Cuando no hay virtualización hardware lo que hace el emulador software es parchear el código del anfitrión para que lo que normalmente se ejecuta en el anillo 0 lo haga en el 1, dejándo el hipervisor en el nivel 0; si se detecta un problema VirtualBox emplea un recompilador dinámico basado en el de QEMU para resolverlo, en muchos casos desensamblando y parcheando el código del invitado para evitar futuras recompilaciones.

VirtualBox (3)

El sistema también incluye drivers para gestionar el acceso al hardware virtualizado en distintos sistemas operativos; la ventaja de usar estos controladores es que permite la interacción entre el anfitrión y sus invitados y que se simplifica la emulación de los dispositivos, lo que mejora la velocidad de ejecución del sistema emulado.

En cuanto al hardware OpenBox emula procesadores multi núcleo (SMP), controladoras USB (sólo en la versión con licencia privativa), discos IDE, SATA y SCSI, tarjetas de sonido, tarjetas de red, puertos serie y paralelo y da acceso a ACPI, permite usar múltiples resoluciones de pantalla, etc.

VirtualBox (4)

Configuración de una Máquina virtual con VirtualBox

VirtualBox (5)

El producto incluye funcionalidades que mejoran la usabilidad de la herramienta:

Múltiples frontales para controlar la aplicación: VirtualBox (interfaz basada en Qt, es la empleada por los usuarios de escritorio), VBoxManage (interfaz de línea de órdenes), VBoxSDL (interfaz gráfico simplificado, empleado para dar acceso a la máquina virtual sin permitir la configuración de la misma) y VBoxHeadless (lanza la máquina virtual sin entorno gráfico local, aunque podemos usar un sistema de acceso remoto)

VirtualBox (6)

Permite el acceso a maquinas virtuales de forma remota, usando VNC en la edición libre y por medio del Remote Desktop Protocol (RDP) en la versión completa (el servidor RDP permite hasta compartir dispositivos USB remotos)
Soporte de múltiples ramas de snapshots (podemos almacenar el estado de la máquina virtual en un momento cualquiera y recuperarlo cuando nos convenga)

KVM (1)

KVM (Kernel Virtual Machine) es una solución de virtualización completa en la que se utiliza el núcleo de Linux como hipervisor, de manera que tanto el control de los dispositivos reales como la planificación de tareas y la gestión de memoria del sistema anfitrión las hace el núcleo de Linux.

En este modelo las máquinas virtuales son procesos normales del sistema (por esto la gestión de memoria y la planificación de procesos son las estándar del sistema) a los que añadimos un modo de ejecución adicional (invitado) a parte de los modos de ejecución estándar de Linux (usuario y núcleo).

KVM (2)

Así, una máquina virtual tendrá tres modos de ejecución:

Modo invitado: será el modo de ejecución normal para el código del sistema invitado siempre que no tenga operaciones de entrada/salida.
Modo usuario: sólo lo usaremos para ejecutar las operaciones de entrada/salida del sistema invitado, nos permitirá gestionar dispositivos virtuales a nivel de usuario.
Modo núcleo: se usará para entrar a trabajar en modo invitado y para gestionar las salidas desde modo usuario causadas por operaciones especiales o de entrada/salida.

KVM (3)

Arquitectura de KVM

KVM (4)

A nivel de implementación el KVM está formado por dos componentes:

Un controlador de dispositivos para gestionar el hardware de virtualización, accesible desde el dispositivo /dev/kvm (incluido en el núcleo de Linux desde la versión 2.6.20, con soporte para microprocesadores Intel y AMD).
Un programa de usuario que emula el hardware del PC (actualmente se usa una versión modificada de qemu) que se encarga de reservar la memoria de la máquina virtual y llamamiento al controlador anterior para ejecutar código en modo invitado.

KVM (5)

Una de las ventajas de haber usado el QEMU como componente de espacio de usuario es que la gestión de la entrada/salida es la misma que a la emulador y por lo tanto podemos usar los mismos dispositivos virtuales que funcionan con QEMU.

El hecho de que el apoyo para el KVM esté integrado en las versiones oficiales del núcleo y que sea el sistema de virtualización preferido de distribuciones como RedHat o Ubuntu hacen que KVM sea una tecnología a considerar a corto y medio plazo para hacer virtualización nativa con Linux.

User-Mode Linux (1)

User-mode Linux (UML) es una aplicación que sólo se puede ejecutar sobre sistemas GNU/Linux que nos proporciona un sistema operativo Linux virtual.

Técnicamente es una adaptación del núcleo de Linux como las que se hacen para poder ejecutarlo en diferentes procesadores, con la diferencia que en este caso es una adaptación a la interfaz software definida por el núcleo y no a la interfaz hardware definida por la arquitectura física (se transforma un núcleo pensado para ejecutarse sobre un sistema físico en una aplicación de nivel de usuario en la que todos los dispositivos son virtuales).

User-Mode Linux (2)

Un sistema virtualizado con UML es más lento que un sistema de virtualización a nivel del sistema operativo, puesto que estamos ejecutando el núcleo como proceso, pero por otro lado tenemos la ventaja de que estamos seguros de que la máquina virtual está claramente aislada del sistema real y de otras máquinas virtuales como ella, lo cual nos da muchas garantías respecto a las consecuencias de los problemas generados por el código que se ejecuta dentro de cada una de las máquinas virtuales.

Xen (1)

Xen es una solución de paravitualización que implementa un hipervisor que se ejecuta en el nivel más privilegiado de la máquina y que básicamente se hace cargo de la planificación de tareas y de la gestión de memoria, delegando la gestión de la Entrada/Salida en un invitado privilegiado (llamado domain 0 o dom0 en Xen) que arranca siempre que lanzamos el hipervisor.

En las distribuciones de GNU/Linux que incluyen Xen el invitado privilegiado es una versión modificada del núcleo de Linux, aunque también se posible usar versiones modificadas de NetBSD y Solaris como núcleos para el dom 0, es decir, en realidad Xen no es un sistema de virtualización ligado en exclusiva al núcleo de Linux.

Xen (2)

La idea básica detrás de este modelo de funcionamiento es que así el código del hipervisor es más sencillo y ligero, a pesar de que actualmente y dadas las capacidades de las CPU (multithreading, multicore, etc.) y de la gestión de memoria, no deja de ser un sistema complejo.

Cuando Xen se emplea en una CPU que no soporta virtualización a nivel hardware es necesario modificar el código del sistema operativo que se vaya a ejecutar sobre él, por lo que no es posible ejecutar sistemas como Windows XP en una CPU que no proporcione soporte hardware a la virtualización.

Xen (3)

Si la CPU soporta virtualización el hipervisor de Xen se ejecuta en el anillo de máxima prioridad (anillo -1 en Intel/AMD) y en ese caso sí que podemos ejecutar sistemas operativos sin ninguna modificación.

Es importante indicar que el hipervisor de Xen nunca será integrado al núcleo de Linux, puesto que en realidad se trata de un programa independiente que no está integrado de ninguna manera con el código del núcleo de Linux, aunque si se han integrado los parches que hacen que Linux se pueda emplear como invitado privilegiado (dom0) o como invitado a secas (domU en terminología Xen).

Linux-VServer (1)

El Linux-VServer es un sistema de virtualización a nivel de sistema operativo que se implementa como una serie de parches sobre el núcleo de Linux.

Lo que hace este sistema es incluir apoyo en el núcleo para crear y mantener múltiples entornos de usuario independientes (conocidos como VPS o Virtual Private Servers) sin que tengan ninguna interferencia entre ellos.

Para independizar los espacios de usuario se define el concepto de contexto, que no es más que un contenedor (container) de procesos relacionados con un único VPS. Cuando el sistema arranca define un contexto por defecto que es el que emplean todos los procesos que pertenecen al sistema anfitrión.

Linux-VServer (2)

A parte de los contextos, el Linux-VServer también emplea una llamada similar a chroot para redefinir el directorio raíz de los procesos que se ejecutan dentro de un contexto determinado y evita que puedan acceder a los directorios que hay por debajo de la raíz.

Como esta tecnología no tiene ninguna dependencia relacionada con la CPU del anfitrión, el sistema está disponible para múltiples familias de microprocesadores (x86, x86-64, PowerPC, ARM, etc.).

Linux-VServer (3)

El problema de este sistema es que no gestiona adecuadamente la utilización compartida de recursos virtuales como las tarjetas de red (o en este caso sería más correcto hablar de dispositivos virtuales de red), puesto que lo que hace es usar los recursos del anfitrión sin aislarlos de los que usa la máquina virtual.

Como ejemplo de esto último, si lanzamos una operación de bind() contra un puerto dentro de una máquina virtual y el puerto está ocupado por un proceso que se ejecuta en el anfitrión y que no especificó una dirección IP el bind() falla, cosa que no pasaría si el aislamiento entre dispositivos virtuales de red fuera total.

OpenVZ (1)

OpenVZ es un sistema de virtualización similar a LinuxVServer que incluye capacidades y herramientas de administración más adelantadas que las de este último.

Se distribuye con un conjunto de utilidades que simplifican mucho la creación y mantenimiento de los entornos virtuales (VE, Virtual Environments en la documentación de OpenVZ), incluyendo la posibilidad de trabajar con plantillas de entornos virtuales pre instaladas (básicamente las plantillas son archivos tar.gz que contienen una imagen del sistema de archivos raíz de un VE).

OpenVZ (2)

Entre las características de OpenVZ destacamos las siguientes:

multiples entornos virtuales (permite la creación de múltiples entornos virtuales aislados dentro del mismo núcleo),
gestión de recursos (proporciona mecanismos para limitar o garantizar la disponibilidad de la CPU, la memoria o el espacio de disco para cada entorno virtual)
checkpointing (permite congelar un entorno virtual, almacenar su estado en un fichero que podemos usar para descongelarlo en el mismo anfitrión o en otro dejándolo en el mismo estado que tenía antes de la congelación).

LXC (1)

Los Linux Containers (lxc) son un método de virtualización a nivel de sistema operativo que permite ejecutar múltiples instalaciones de servidores aisladas (contenedores) en un único anfitrión.

Los Linux Containers no proporcionan una máquina virtual, sino que crean un entorno que tiene su propio espacio para procesos y conexiones de red; en la práctica su uso es similar a un chroot pero ofrece mucha más aislación.

LXC (2)

En LXC la gestión de recursos se hace a través de los cgroups (grupos de control) también conocidos como contenedores de procesos (process containers) y la independencia de recursos se consigue usando los namespaces (espacios de nombres) de Linux.

LXC forma parte del núcleo oficial de linux desde la versión 2.6.29, lo que hace que sepamos que siempre lo vamos a tener disponible con los nuevos núcleos; su desventaja respecto a Linux-Vserver y OpenVZ es que tiene menos funcionalidades que los sistemas anteriores, aunque es una buena solución si no necesitamos esas funcionalidades adicionales.

Herramientas relacionadas

Todos los sistemas de virtualización que hemos comentado antes incluyen herramientas de administración para crear y configurar máquinas virtuales y para ejecutar y parar esas máquinas, aunque es habitual que se desarrollen aplicaciones que hacen de frontend de esos programas para simplificar y hacen más cómodo el trabajo con los sistemas de virtualización desde la línea de órdenes, en el escritorio o a través de la web.

De hecho las operaciones e interfaces son tan similares que incluso existe una biblioteca denominada libvirt (http://libvirt.org) que proporciona una caja de herramientas para gestionar de manera unificada múltiples sistemas de virtualización (libvirt soporta Xen, QEMU, KVM, LXC, OpenVZ, User Mode Linux y VirtualBox entre otras tecnologías) sobre la que se han desarrollado múltiples aplicaciones.

Frontends de escritorio

En el ámbito del interfaz gráfico encontramos unas cuantas aplicaciones:

aqemu <http://aqemu.sourceforge.net/> para QEMU y KVM
kemu <http://www.rpdev.net/home/kemu> para QEMU y KVM,
Virtual Machine Manager <http://virt-manager.org/> para los sistemas de virtualización soportados por lib-virt

aqemu

kemu

virt-manager

Frontends Web

Vía web encontramos aplicaciones como:

qemudo (http://qemudo.sourceforge.net/) para QEMU y KVM
phpVirtualBox (http://code.google.com/p/phpvirtualbox/) para VirtualBox
OpenVCP (http://www.openvcp.org/) para Linux-Vserver
OpenVZ Web Panel (http://code.google.com/p/ovz-web-panel/) para OpenVZ

Frontends Web

WebVZ (http://webvz.sourceforge.net/) para OpenVZ
xvp (http://www.xvpsource.org/) para XEN
ConVirt (http://www.convirture.com/) para XEN y KVM,
oVirt (https://fedorahosted.org/ovirt/) para los sistemas soportados por lib-virt

qemudo

phpVirtualBox

OpenVCP

OpenVZ Web Panel

WebVZ

xvp

ConVirt

oVirt

Distribuciones especializadas

Además de las aplicaciones independientes también están empezando a aparecer distribuciones como Proxmox VE (http://pve.proxmox.com/) que proporcionan el soporte necesario para instalar y gestionar clusters de servidores virtuales (en concreto esta distribución soporta el uso de KVM y OpenVZ).

ProxmoxVE

Listado de máquinas virtuales en un cluster ProxmoxVE

Virtualización de otros recursos

Alrededor de la virtualización de sistemas también se desarrollan sistemas para virtualizar otro tipo de recursos, como los discos o los dispositivos de red a nivel de sistema anfitrión.

Como ejemplo podemos encontrar el sistema de ethernet distribuida virtual (Virtual Distributed Ethernet <http://vde.sourceforge.net/>), que se puede usar para crear una red ethernet virtual entre sistemas UML, QEMU y KVM que se ejecuten en el mismo o en diferentes sistemas reales.

Ventajas de usar linux como anfirión

Es interesante indicar que el hecho de usar un sistema como Linux como anfitrión para la virtualización de sistemas nos permite emplear otras muchas tecnologías que son o pueden ser interesantes para montar infraestructuras virtuales como sistemas de ficheros con funcionalidades avanzadas (RAID, LVM2) o herramientas de gestión de red avanzadas (iptables, iproute2 ó brctl).

Ejemplos de uso

A continuación comentaremos unos cuantos ejemplos de uso de tecnologías de virtualización, explicando las razones para elegir una tecnología u otra y como se organiza la gestión y el mantenimiento de los sistemas de virtualización dentro de las infraestructuras en las que se integran.

Uso de user-mode-linux para formación (1)

Hay situaciones en las que vale la pena emplear tecnologías como el user-mode-linux pese a que no tenga las mismas prestaciones que otros sistemas de virtualización.

Un buen ejemplo de esto se da cuando nos interesa que la herramienta de virtualización se ejecute a nivel de usuario, sin necesidad de dar permisos especiales a esos usuarios.

Este es el caso, por ejemplo, cuando queremos realizar prácticas de administración de sistemas GNU/Linux y queremos ahorrarnos la reinstalación del sistema después de cada sesión.

Uso de user-mode-linux para formación (2)

Gracias a las capacidades del UML y a la existencia SLIRP (un programa a nivel de usuario que nos permite dar acceso a la red a los servidores UML) resulta rápido y económico dar a cada alumno una o varias máquinas virtuales para poder trabajar con ellas como administrador sin tener que darles ningún permiso especial en el sistema anfitrión.

Otra ventaja es que una vez instalado el software necesario en el sistema anfitrión no es precisa ninguna intervención de un administrador del equipo para crear, borrar o modificar las máquinas virtuales y resulta muy sencillo compartir datos entre la máquina virtual y el anfitrión, ya que el UML también soporta el acceso a directorios del sistema anfitrión desde el sistema invitado.

Uso de user-mode-linux para formación (3)

Por último comentar que hay una característica muy interesante del UML cuando queremos economizar recursos, en concreto nos referimos a la posibilidad del uso de ficheros COW con capas, que nos permiten generar un fichero base en el que hacer una instalación inicial de la máquina virtual que puede ser compartido por todos los alumnos (p. ej. accediendo al mismo usando un directorio compartido por NFS) de modo que ellos sólo necesiten crear un fichero adicional (p. ej. en su directorio de usuario) en el que se guarden los cambios respecto al sistema de ficheros base compartido, que en una sesión de prácticas suelen ser pocos.

Uso de VirtualBox para formación (1)

Si lo que nos interesa es que las máquinas virtuales puedan funcionar en múltiples sistemas operativos y que dispongan de interfaz gráfico (p. ej. para impartir un curso de instalación y configuración de servidores) VirtualBox es una buena opción, ya que tiene versiones libres que funcionan en distintos sistemas operativos y es relativamente sencillo mover la máquina virtual de un sitio a otro.

Uso de VirtualBox para formación (2)

Al igual que sucede con otras tecnologías, VirtualBox permite suspender las máquinas virtuales y hacer fotos (snapshots) del estado del sistema en un momento dado, lo que puede resultar muy útil cuando usamos la máquina para aprender a hacer algo, ya que podemos ir guardando el estado del sistema cada vez que completemos una tarea para volver atrás en el caso de que algo no funcione como debe.

Uso de linux-vserver en el ITI (1)

Hace más de cuatro años que en el ITI se planteó la necesidad de renovar las infraestructuras informáticas de uso común para el personal del centro y se decidió que lo que más interesaba era consolidar los servidores para poder retirar equipos antiguos y emplear virtualización para facilitar la escalabilidad y movilidad de los sistemas.

En su momento se compraron servidores con microprocesadores Intel y AMD de 64 bits sobre los que se instaló la versión estable del sistema operativo Debian GNU/Linux (en aquel momento la versión 4.0, con el nombre en código etch).

Esa versión incluía de serie paquetes binarios de la versión 2.6.18 del núcleo de Linux con soporte para Xen y Linux-VServer.

Uso de linux-vserver en el ITI (2)

Como inicialmente sólo queríamos instalar servidores virtuales Linux optamos por el Linux-VServer por ser una tecnología más ligera y sencilla que Xen, sabiendo que en un futuro podríamos emplear ambas tecnologías en un mismo sistema (en etch había versiones del núcleo con soporte simultáneo de Linux-VServer y XEN).

Desde que comenzamos a utilizar el Linux-VServer definimos procedimientos para automatizar la instalación y configuración de los sistemas anfitriones e invitados para nuestro entorno.

Uso de linux-vserver en el ITI (3)

El modelo empleado asumía que el sistema anfitrión ha de dar la misma imagen a los servidores virtuales que se ejecutan sobre él, por lo que definimos una serie de servicios y configuraciones que siempre deben ser iguales:

En primer lugar hacemos que todos los vservers tengan sus interfaces de red ligadas al dispositivo virtual de red dummy0 que está configurado en el sistema anfitrión para tener la IP 10.0.0.1 (usaremos esa dirección como IP local del anfitrión desde todos los servidores virtuales). Las direcciones de los servidores virtuales están siempre en la red privada 10.0.0.0/8.

Uso de linux-vserver en el ITI (4)

Para dar acceso al exterior a los vservers empleamos un script de 'iptables que hace NAT de salida para las direcciones internas de los servidores virtuales.

Para dar acceso a los servicios públicos que se ejecutan en los servidores virtuales usamos port forwarding (PAT) de entrada, las reglas las instala el mismo script de iptables.

Uso de linux-vserver en el ITI (5)

El anfitrión siempre ejecuta un servidor de SMTP local que escucha en la IP 10.0.0.1 y se encarga de modificar las direcciones de los mensajes que salen de los servidores virtuales (usamos la reescritura canonical de postfix, que cambia las direcciones de entrada y salida) y los envía a los smarthosts que correspondan (dentro del ITI se envían a nuestro servidor de correo principal).

Uso de linux-vserver en el ITI (6)

Opcionalmente el anfitrión puede ejecutar un servidor proxy de DNS (normalmente usamos pdnsd o pdns-resolver) que también funciona con la dirección 10.0.0.1 y nos independiza de la red en la que se ejecuta el servidor virtual, ya que no hace falta saber cual es la dirección del servidor de nombres de la red local.
Como todos los servidores se compraron con dos discos, se montan con RAID-1 (mirroring) para garantizar que tenemos redundancia ante problemas físicos en uno de los discos.

Uso de linux-vserver en el ITI (7)

Sobre los RAID montamos sistemas de ficheros con LVM2, dejando siempre espacio para poder emplear snapshots, ya que nos resultan muy útiles para hacer copias de seguridad de los sistemas de archivos sin tener que parar los servicios. Lo que hacemos es asegurarnos de los ficheros en disco son correctos, tomamos una foto fija del sistema de ficheros (un snapshot de LVM2) y continuamos trabajando normalmente. El proceso de copia de seguridad se hace contra la foto fija (en nuestro caso usando rdiff-backup`) y cuando se termina eliminamos el snapshot y el sistema continua funcionando normalmente sin ninguna interrupción.

Uso de linux-vserver en el ITI (8)

Para monitorizar el buen funcionamiento de los servicios locales del anfitrión utilizamos el programa monit, que está ajustado para monitorizar distintos parámetros del sistema y asegurar la disponibilidad de los servicios que consideramos necesarios.

En cuanto a los sistemas invitados lo que hacemos es aplicar un modelo similar al estándar de OpenVZ, es decir, hemos preparado un script para replicar una plantilla de un servidor virtual y modificar los cuatro parámetros básicos para que funcione de modo independiente.

Uso de linux-vserver en el ITI (9)

Dentro de la plantilla instalamos siempre unos cuantos servicios ya configurados, incluyendo un servidor de ssh para conectar a los servidores virtuales directamente desde la red, un servidor postfix preparado para interactuar con el servidor del sistema anfitrión y un monit preparado para supervisar el funcionamiento de los servicios anteriores.

Para migrar o cambiar un servidor virtual de anfitrión usamos un proceso manual en el que copiamos los datos del servidor virtual, lo paramos,volvemos a sincronizarlo, ajustamos los scripts de red de ambos anfitriones para mover las direcciones IP públicas y las reglas de cortafuegos y lo levantamos en su nueva ubicación.

Uso de Proxmox en el ITI (1)

Aunque la infraestructura basada en linux-vserver funcionaba (y funciona) bien, existían algunos problemas con el sistema que nos hicieron plantearnos la migración a un sistema de virtualización diferente aprovechando todo lo posible el modelo ya definido:

Por un lado parece que el desarrollo de linux-vserver está algo parado desde hace unos años, aunque desde que se tomó la decisión de cambiar las sucesivas versiones de Debian han seguido publicado versiones del núcleo con soporte para linux-vserver.

Uso de Proxmox en el ITI (2)

No es posible hacer una suspensión ni una migración en vivo de los servidores virtuales. Aunque no es un problema grave, es una funcionalidad que resulta muy útil cuando queremos ajustar la carga de los servidores o poner en marcha sistemas de alta disponibilidad para los servidores o servicios.
El uso de dispositivos de red con linux-vserver deja mucho que desear, sobre todo resulta muy molesto el hecho de que no se puedan crear interfaces de loopback dentro de los servidores virtuales.

Uso de Proxmox en el ITI (3)

El uso de sistemas de cuotas para limitar el uso de CPU, disco, memoria, etc. no es especialmente potente con linux-vserver.
Necesitamos disponer de una tecnología que nos permita ejecutar sistemas distintos a GNU/Linux, cosa que no es posible con Linux-VServer.

Uso de Proxmox en el ITI (4)

Después de evaluar las alternativas decidimos migrar los servidores que corren sobre Linux-VServer a OpenVZ y por otro lado Linux decidimos abandonar la idea de usar Xen prácticamente sin probarlo y optamos por emplear KVM para la virtualización de sistemas que no usen el núcleo de Linux, ya que se trata de una tecnología mucho más simple de instalar y configurar y que sabíamos que si se iba a integrar en los núcleos oficiales de Linux y por tanto estaría soportada por los núcleos de las distribuciones de GNU/Linux de serie.

Uso de Proxmox en el ITI (5)

Habiendo decidido cambiar a estas tecnologías encontramos una distribución basada en Debian (Proxmox) que incluye de serie soporte para ambas y además nos proporciona un interfaz web para gestionar clusters de máquinas virtuales, por lo que decidimos utilizar su tecnología.

Como en realidad Proxmox se basa en Debian para hacer instalaciones en lugar de usar su instalador nosotros hacemos una instalación mínima de Debian configurándolo a nuestro gusto (RAID, LVM2, soporte de bridging, ...) y le añadimos los componentes de Proxmox que se emplean para gestionar la virtualización (versiones del núcleo y las herramientas estándar de openvz y kvm)

Uso de Proxmox en el ITI (6)

Aunque el interfaz gráfico de Proxmox nos resulta útil para muchas tareas lo cierto es hay cosas que hacemos siguiendo un proceso de más bajo nivel, por ejemplo para crear las máquinas virtuales OpenVZ empleamos las herramientas de línea de órdenes y plantillas de las distribuciones generadas por nosotros (normalmente la plantilla es una instalación de la versión estable de Debian GNU/Linux generada con una herramienta denominada dab).

Para las máquinas con KVM (generalmente Windows) usamos instalaciones base y las clonamos de modo similar a lo que se hace en redes locales que no usen virtualización, con la diferencia de que en este caso la clonación del sistema se limita a copiar ficheros de configuración y la imagen del disco duro.

Uso de Proxmox en el ITI (7)

En cuanto a la red, lo que hemos hecho es emplear bridging para los interfaces de red virtuales de ambos sistemas; la idea es que al usar puentes las máquinas virtuales se configuran como si fuesen sistemas reales (en OpenVZ los interfaces virtuales se ven como eth0, eth1, etc.), lo que simplifica enormemente la gestión.

De hecho en casi todos nuestros anfitriones configuramos tres puentes ethernet, uno que da acceso a la red pública del instituto, otro que da acceso a una red privada que interconecta todos los anfitriones y máquinas virtuales entre sí y otro que se monta sobre el dummy0 y que permite que el anfitrión y sus invitados tengan un canal de comunicación directo que no pase por ninguna red real.

Uso de Proxmox en el ITI (8)

Actualmente estamos usando el montaje anterior para gestionar varios clusters de proxmox instalados en servidores Blade (tenemos un Sun Blade 6048 con 48 nodos instalados):

en algunos de los nodos sólo montamos uno o dos servidores virtuales openvz (son nodos de cálculo en los que se usa un sistema de colas para controlar la carga y la distribución de tareas, pero la virtualización nos sigue siendo útil para hacer snapshots, migrar nodos, etc.),

Uso de Proxmox en el ITI (9)

en otros montamos varios servidores virtuales KVM (los usan para desarrollar y ejecutar programas en windows y si sólo se emplean uno o dos cores vale la pena lanzar varias máquinas a la vez)
en otros montamos múltiples servidores linux con openvz (para aplicaciones que no son de cálculo intensivo suele valer la pena tener varios servidores y con la virtualización es típico que cada proyecto que lo requiera tenga entre una y tres máquinas iguales para hacer desarrollo, preproducción y producción).

Uso de Proxmox en el ITI (10)

En cuanto al almacenamiento, de momento los sistemas virtuales se instalan en los discos locales de los anfitriones, aunque tenemos un RAID iSCSI y otro AoE a los que se da acceso empleando servidores de ficheros de red (NFS para los servidores OpenVZ y Samba para los servidores Windows), aunque en el futuro no descartamos ejecutar los sistemas virtuales completos desde discos montados directamente de la red (eso resultaría especialmente interesante si tuviésemos servicios en alta disponibilidad).