version 0.2.2
La suma de la experiencia humana se está expandiendo a un ritmo prodigioso y los medios que utilizamos para seguir el hilo a través del consiguiente laberinto de ítems momentáneamente importantes son los mismos que usábamos en los días de los barcos de vela. (Bush, 1945).En su opinión el problema no era tanto una cantidad excesiva de publicaciones como el nulo avance de las tecnologías con que se gestionaba su manejo. Con los rudimentos tecnológicos de su época en mente, Bush fue capaz de idear un sistema llamado memex que permitiría archivar el conocimiento de un modo más eficaz: una especie de escritorio futurista en el que se guardarían, microfilmados, los libros, actas, ficheros, etc. Cada elemento de información se visualizaría en pantalla tecleando su código mnemotécnico correspondiente y, esto es lo más importante, podríamos registrar las conexiones observadas entre elementos distintos. Un usuario del memex que contase con una buena base de datos podría anotar conexiones entre, digamos, un artículo de enciclopedia sobre el escritor angloamericano H. Ph. Lovecraft, una fotografía suya y alguno de sus cuentos. Al leer el artículo, la simple pulsación de un boton le permitiría hojear "El horror de Dunwich" o visualizar la fotografía. Más tarde podría conectar con este conjunto la biografía de Lovecraft escrita por Pierre Bourbonnais.
Figura 1.-- Un link nos conduce a otros textos, imágenes, etc.
Bush remarcaba que este tipo de asociación no lineal de ideas era el modo de funcionamiento natural de la mente humana, y confiaba en que dispositivos semejantes al memex lo reproducirían en el futuro más adecuadamente. Es un hecho que los artículos de una enciclopedia, las notas al pie o las referencias bibliográficas contienen conexiones no lineales de aquel tipo, pero los medios tradicionales resultan inadecuados para gestionarlas. Cuando nos encontramos con una referencia bibliográfica que nos interesa, todo lo que podemos hacer es acudir a una biblioteca o una librería. Con el memex, idealmente, pulsaríamos un botón para consultar en nuestra pantalla el libro en cuestión. En el futuro, profetizaba Bush, las enciclopedias serían redes de conexiones que el usuario podría anotar y modificar a su antojo.
Bush era un visionario. En 1945 sus ideas no eran técnicamente realizables. Ni lo eran aún en 1965, cuando otro visionario, Ted Nelson, las ordenó conceptualmente. Fue Nelson quien acuñó el término `hipertexto' para referirse a "un cuerpo de material escrito o gráfico interconectado de un modo complejo que no se puede representar convenientemente sobre el papel; puede contener anotaciones, adiciones y notas de los estudiosos que lo examinan" (Nelson 1965). La idea es que el lector examina los nodos de una red, y pasa de unos a otros siguiendo las conexiones (links, en inglés). El hecho de que los nodos pueden contener texto, pero también pueden integrar otros medios: imagen, sonido, etc. es lo que se quiere remarcar con otro término complementario: `hipermedia'.
Durante las dos décadas siguientes se vivió el auge de los ordenadores, el almacenamiento digital y las redes. El propio Nelson cobró conciencia de lo apropiado de estas nuevas tecnologías para la realización del sueño de una red de elementos de información libremente accesible alrededor del mundo. Sin embargo, se diría que sus ideas sólo han llegado a concretarse recientemente con el World-Wide Web [3].
`World Wide-Web' (abreviado `Web'; escrito también `WWW' o incluso `W3') significa algo así como `red (o telaraña) global'. La propaganda oficial del CERN lo define como un "sistema hipermedia distribuido" (Boutell 1994). En principió se pensó como un medio para la distribución de la información entre equipos de investigadores geográficamente dispersos; concretamente se dirigía a la comunidad de físicos de altas energías vinculados al CERN (Berners-Lee 1994). En su primera propuesta, Berners-Lee exponía las desventajas del uso de sistemas incompatibles e inconexos:
"En el CERN, una diversidad de datos está ya disponible: informes, datos experimentales, datos personales, listas de direcciones de correo electrónico, documentación informática, documentación experimental y muchos otros conjuntos de datos están girando contínuamente en discos de ordenadores. Es sin embargo imposible 'saltar' de un conjunto a otro de una manera automática: una vez has encontrado que el nombre de Joe Bloggs se lista en una descripción incompleta de algun software en línea, no se encuentra directamente su dirección actual de correo electrónico. Usualmente, tendrás que utilizar un método de consulta distinto en un ordenador distinto con un interface distinto. Una vez has localizado la información, es difícil guardar sus conexiones o hacer una anotación privada que puedas después encontrar rápidamente."La conclusión era que "hay un enorme beneficio potencial en la integración de una variedad de sistemas de un modo que permita a los usuarios seguir conexiones que apuntan de un elemento de información a otro".
Se pretendía pues que los recursos disponibles en formato electrónico, que residen en ordenadores distintos conectados a la red, fuesen accesibles para cada investigador desde su terminal, de un modo transparente y exento de dificultades, sin necesidad de aprender a utilizar varios programas distintos. Además, debería posibilitarse el salto entre elementos de información conexos. Los recursos existentes deberian integrarse en una red hipertextual distribuida gestionada por ordenadores.
Las primeras instalaciones del WWW para uso interno del CERN estuvieron listas en 1991. Ese mismo año el sistema se abrió ya a Internet. Desde entonces, para acceder al World-Wide Web no se requiere más que un terminal VT conectado a Internet, pero la máxima facilidad de uso y el máximo rendimiento se alcanzan con una pantalla gráfica (un modelo Next o Macintosh, un X-Terminal o un PC con tarjeta gráfica). Entonces el sistema nos ofrece hipertextos como el que muestra la figura 2, nodos de la telaraña global. Las palabras subrayadas, y las imágenes recuadradas, son links que nos conducen a otros nodos. Para viajar hasta ellos basta con situarse con el ratón sobre el link y pulsar el botón. El nodo de llegada puede ser otro hipertexto, o también un nodo no hipertextual integrado en la red: un servidor gopher, un grupo de netnews, una búsqueda en una base de datos WAIS, etc.
Figura 2.-- Pantalla típica del World-Wide Web
El éxito del WWW, el crecimiento de la telaraña, ha sido espectacular. Durante 1993 se pasó de 50 a 500 nodos. En 1994 se contabilizan ya miles de servidores en el WWW que distribuyen todo tipo de información (de ellos, trece en España [4]; el primero fue el del Departamento de Educación de la Universitat Jaume I, en septiembre de 1993).
a) Diseñar e implementar un nuevo protocolo que permitiera realizar saltos hipertextuales, esto es, de un nodo o lexia de origen a uno de destino, que podria ser un texto o parte de un texto, una imagen, un sonido, una animación, fragmento de vídeo, etc. Es decir, cualquier tipo de información en formato electrónico. Este protololo se denomina HTTP (HyperText Transfer Protocol) y es el "lenguaje" que "hablan" los servidores del WWW.
b) Inventar un lenguaje para representar hipertextos que incluyera información sobre la estructura y el formato de representación y, especialmente, indicar origen y destino de saltos hipertextuales. Este lenguaje es el HTML o (HyperTextex markup Language).
c) Idear una forma de codificar las instrucciones para los saltos hipertextuales de un objeto a otro de la Internet. Dada la variedad de protocolos, y por tanto, formas de almacenamiento y recuperación de la información, en uso en la Internet, esta información es vital para que los clientes (ver el siguiente punto) puedan acceder a dicha información.
d) Desarrollar aplicaciones cliente para todo tipo de plataforma y resolver el problema de cómo acceder a información que está almacenada y es accesible a través de protocolos diversos (FTP, NNTP, Gopher, HTTP, X.500, WAIS, etc.) y representar información multiformato (texto, gráficos, sonidos, fragmentos de vídeo, etc.). A este fin se han desarrollado diversos clientes, entre los que destaca la familia Mosaic, del NCSA (National Center for Supercomputer Applications) de la Universidad de Chicago, y su sucesor Netscape Navigator, de Netscape Communications Corporation.
Pero, veamos con cierto detenimiento los rasgos más sobresalientes de estos elementos clave del sistema.
"Una descripción formal de los formatos de los mensajes y las reglas que deben seguir dos ordenadores para intercambiar dichos mensajes. Los protocolos pueden describir detalles de bajo nivel de los interfaces de máquina a máquina (por ejemplo, el orden en el cual deben enviarse bits y bytes a través de un cable) o intercambios de alto nivel entre programas (por ejemplo, la forma en que dos programas transfieren un fichero a través de la Internet)." (Malkin y LaQuey Parker, 1993, pág. 39).El HTTP es un protocolo genérico orientado a objetos que no mantiene la conexión entre transacciones (Berners-Lee, 1993d). Ha sido especialmente diseñado para atender las exigencias de un sistema hipermedia distribuido como es el World-Wide Web. Sus características principales son:
Figura 3.-- Documento HTML
Las etiquetas del HTML se delimitan por medio de los signos < y >. Por ejemplo, la etiqueta <P> marca el inicio de cada párrafo. Otras, la mayor parte, van por parejas: <TITLE> y </TITLE> abren y cierran, respectivamente, el título del documento.
Los links se abren y cierran con las etiquetas <A> y </A>. El objeto de la red a donde nos lleva el link se codifica en la etiqueta de apertura por medio de una notación que se ha convertido de hecho en un estándar de Internet: los llamados URL.
Un URL representa de un modo compacto la localización y el método de acceso de cualquier recurso de la red (Berners-Lee, Masinter y McCahill, 1994). No sólo hay más de dos millones de ordenadores conectados a los varios miles de redes que forman la Internet, sino que existen múltiples protocolos o formas diferentes de acceder a la información (ftp, gopher, http, etc.). Los URL aportan esos dos datos esenciales: dónde se encuentra un recurso y cómo se puede acceder a él.
La sintaxis de los URL es la siguiente:
URL:<esquema>:<parte-específica-del-esquema>El esquema es un término convenido que representa el método de acceso a un recurso. La parte específica del esquema informa sobre su localización en la red, de un modo que depende de cada método de acceso. Un ejemplo nos ayudará a entender esto.
Cuando utilizamos ftp anónimo para copiar un fichero de un ordenador remoto a nuestro ordenador necesitamos saber lo siguiente: host o nombre del ordenador remoto donde se encuentra el fichero y path o via que conduce al fichero dentro de la estructura de ficheros del ordenador remoto. Supongamos que el fichero se llama README, y que está en el directorio pub del host ftp.uji.es; el URL de tal objeto sería éste:
Al recuperar un fichero mediante ftp anónimo usamos "anonymous" como nombre de usuario, y nuestra dirección de correo electrónico como password. En los URL esta información se omite dado que es conocida. Sin embargo, es posible incluirla si, por ejemplo, no se trata de ftp anónimo, sino que se necesita especificar un usuario real y su password. La sintaxis genérica de los URL para objetos accesibles por ftp es la siguiente:
URL:ftp://[user[:password]@]host[:port]/path[;type=<typdecode>]El "port" puede omitirse si el servidor de ftp emplea el port estándar de ftp (el 21). Este principio de omitir lo ya conocido se sigue en todos los URL. Si los distintos servidores siguen las recomendaciones de la Internet no es necesario incluir información redundante.
El "path" es la lista ordenada de subdirectorios por los que hay que pasar para llegar al fichero, separados por "/", seguida del nombre del fichero.
El "type" es "d", "a", "i". "d" indica que se requiere la transmisión de una lista de nombres de ficheros (un directorio). "a" solicita una transmisión de líneas de texto. "i" solicita una transmisión binaria.
En la actualidad existen esquemas definidos para los siguientes servicios:
Esquema Sintaxis ftp (File Transfer Protocol) ftp://user:password@host:port/path;type=<typecode> http (HyperText Transfer Protocol) http://<host>:<port>/<path>?<searchpart> gopher (gopher) gopher://<host>:<port>/<gopher-path> mailto (correo electrónico) mailto:<rfc822-addr-spec> news (USENET news) news:<newsgroup-name> nntp (USENET news especificando un nntp://<host>:<port>/<newsgroup-name>/<article-number servidor nntp, NetNews Transfer > Protocol) wais (Wide Area Information Server) wais://<host>:<port>/<database> o wais://<host>:<port>/<database>?<search> o wais://<host>:<port>/<database>/<wtype>/<wpath>
Ejemplos
Figura 4.-- Las news en el Web
En sus versiones actuales, Netscape y otros clientes del Web no entienden por sí mismos el protocolo WAIS. Es decir, no pueden consultar directamente bases de datos WAIS, sino sólo a través de pasarelas. Sin embargo, este procedimiento es transparente para el usuario. En la figura 5 se ve el resultado de la búsqueda del término "poetry" en la base de datos WAIS "Directory of Servers":
Figura 5.-- WAIS en el Web
Una característica útil para desplazarnos a puntos arbitrarios de la red es la posibilidad de acceder directamente a una página dando su URL. Otra posibilidad aún más importante es la de mantener "bookmarks", listas personalizadas de páginas de nuestro interés, a las que podemos volver en cualquier momento.
El HTML, por su parte, también tiene puntos flacos. El hecho de que las marcas se integren en el propio texto dificulta el mantenimiento de éste. La modificación del texto hace necesario volver a aplicar las marcas.
También es arduo mantener los links, pero esto no es tanto un problema del HTML como del sistema de URL. Ya hemos dicho que se intenta superar los URL mediante la especificación de URN: nombres permanentes de objetos, independientes de sus localizaciones y métodos de acceso transitorios, que unos servidores de nombres resolverían en los URL correspondientes.
Finalmente, parece que no basta con el acceso hipermedia a la red. La Internet continua siendo un almacen caótico. Sólo hemos ordenado el interface de usuario, el acceso a los datos, pero estos continuan desordenados. Para solventar este desorden se requieren sistemas de indexación y catalogación que pueden estar basados en los actuales, como WAIS.
ANDREESSEN, M. (1993a). Getting Started with NCSA Mosaic. Software Development Group. National Center dor Supercomputing Applications, Champaing IL, May 8 1993.
ANDREESSEN, M. (1993b). NCSA Mosaic Technical Summary. Software Development Group. National Center dor Supercomputing Applications, Champaing IL, May 8 1993.
BALASUBRAMANIAN, V. (1994). Hypermedia Issues and Applications: A State-of-the-Art Review. Graduate School of Management, Rutgers University, Newark, New Jersey. Documento electrónico. E-mail: balasubr@andromeda.rutgers.edu
BERNERS-LEE, T. (1993a). The World-Wide Web Initiative. Documento Electrónico. <ftp://info.cer.ch/pub/www/doc/inet92.ps>
BERNERS-LEE, T. (1993b). Uniform Resource Locators (URL). A Unifying Syntax for the Expression of Names and Addresses of Objects on the Network, Internet Draft, IETF URL Working Group. Octubre 1993. <ftp://info.cern.ch/pub/www/doc/url7a.ps.Z>
BERNERS-LEE, T. (1993c). HTTP: A protocol for networked information. Documento hipertexto. <http://info.cern.ch/hypertext/WWW/MarkUp/HTTP.html>
BERNERS-LEE, T. (1993d). Hypertext Transfer Protocol: A Stateless Search, Retrieve and manipulation protocol.. Internet Draft. Documento electrónico <ftp://nic.switch.ch/mirror/internet-draft/draft-ietf-iiir-http-00.ps>
BERNERS-LEE, T. y CONOLLY, D. (1993). Hypertext Markup Language (HTML): A Representation of Textual Information and MetaInformation for Retrieval and Interchange, Internet Draft, IIIR Working Group, June 1993. <http://info.cern.ch/hypertext/WWW/MarkUp/HTML.html> o <ftp://info.cern.ch/pub/www/doc/html-spec.ps.Z>
BERNERS-LEE, T., CAILLAU, R., GROFF, J-F., POLLERMAN, B. (1992a). World-Wide Web: An Information Insfrastructure for High-Energy Physics, Presented al "Software Engineering, Artificial Inteligence and Expert Systems for High Energy and Nuclear Physics", at Londe-les-Maures, January 1992.
BERNERS-LEE, T., CAILLAU, R., GROFF, J-F., POLLERMAN, B. (1992b). World-Wide Web: The Information Universe, Electronic Networking: Research, Applications and Policy, Vol 1, No 2, Meckler, Westport CT, Spring 1992.
BOUTELL, Th. (1994). Frequently asked questions about World-Wide Web. Documento electrónico. <ftp://rtf.mit.edu/usenet/news.answers/www-faq>
BUSH, V. (1945). "As We May Think", Atlantic Montly, 176/1, July, pp. 101-108. Puede verse una traducción al castellado de parte de este texto en LAMBERT, S. y ROPIEQUET, S. (Eds.) (1987). CD ROM. El nuevo papiro. Madrid: Anaya-Multimedia, pp. 3-21.
HARDY, H. E. (1993). The History of the Net. Master's Thesis. School of Communications. Grand Valley State University. Allendale, MI 49401. v 8.5. September 28, 1993.
KALHE, B (1989). Wide Area Information Servers Concepts. Thinking Machines. Documento electrónico. <ftp://ftp.wais.com//pub/wais-inc-doc/wais-concepts.txt>
LINDNER, P. (1994). Frequently asked questions about Gopher. Documento electrónico. <ftp://rtf.mit.edu/usenet/news.answers/gopher-faq>
NELSON, T. H. (1965). A File Structure for the Complex, The Changing and The Indeterminate. ACM 20th National Conference. 1965.
NELSON, T.H. (1981). Literary Machines, publicado por el autor.
RAGGETT, D. (1993). HTML+ (Hypertext markup format). Internet Draft <ftp://nic.switch.ch/pub/mirror/internet-drafts/draft-raggett-www-html-00.ps&t;
WEIDER, C. y DEUTSCH, P. (1994). Uniform Resource Names. Internet Draft. IRTF. URI Working Group.<URL:ftp//ftp.isi.edu/internet-drafts/draft-ietf-uri-resource-names-02.xt>. Borrador de trabajo.