24x7 Linux Página personal y profesional HTML 4.01 válido CSS válido
Problemas para acceder a ciertas páginas web que antes funcionaban

Desde hace algunas semanas Telefonica™ ha implementado en su red de datos del servicio ADSL (tanto residencial como empresarial) un conjunto de proxys para el acceso a servicios web. La idea es que dichas máquinas hagan de intermediarios para el acceso a los servicios web desde los abonados ADSL sin que éstos deban modificar la configuración de sus equipos.

Este mecanismo se conoce como proxy transparente, y permite acelerar la descarga de contenidos desde Internet, almecenando en grandes cachés de datos los recursos accedidos con más frecuencia, evitando descargarlo desde el servidor real, posiblemente más lejano, saturado y con menor ancho de banda (y más costoso para el proveedor, al saturar sus caros enlaces de larga distancia).

Para que estos intermediarios funcionen de manera transparente al usuario, deben capturar el tráfico web, redirigirlo a una aplicación que implemente el servicio, y será esta aplicación la que haga la petición de la página. Todo esto consiste en la rescritura y reenvío de cabeceras del protocolo HTTP, que de no ser correctas o no enviarse en tiempo y forma, causará problemas de navegación.

Pues bien, los problemas de acceso a este sitio web es muy probable que vengan causados por alguno de estos mecanismos de proxy transparente que, por alguna razón, no funciona como debería. Lo más extraño de todo esto es que el acceso a páginas hospedadas en una determinada dirección IP de una máquina concreta funciona, pero falla el acceso a páginas hospedadas en el mismo servidor pero asociadas a otra dirección IP distinta.

En cualquier caso, los síntomas son retrasos de segundos o inclusos minutos antes de que nuestro navegador comience a descargar la página, el fallo del proceso (expira el plazo que el navegador se da para obtener una respuesta), etc. Estamos plenamente convencidos de que estos problemas son ajenos a nuestra responsabilidad, y rogamos disculpen las molestias causadas por estos errores por parte de su proveedor de acceso a Internet.

Puede verificar si su conexión está sujeta a los mecanismos descritos más arriba entrando en esta página, donde se le muestra información interesante sobre la petición HTTP, las direcciones IP real (la de su máquina, la identificada en letras grandes) y del servidor proxy intermedio, así como las cadenas User-Agent de su navegador y de la máquina intermedia.

Si en el informe aparecen los campos X-Forwarded-For y Via, entonces con casi total seguridad le sucede lo que a mi y otros muchos abonados al servicio ADSl de Telefonica™. Consulte esta conversación en el grupo de noticias es.comp.redes.adsl para saber algo más acerca de este asunto.

Otro posible inconveniente de estos mecanismos es que cuando acceda a páginas que cambian con mucha frecuencia (por ejemplo, sitios de noticias o periódicos) obtenga como respuesta una página en la caché del intermediario, y no el contenido real del servidor web remoto en ese momento. Esto puede evitarse en la mayoría de los navegadores pulsando CTRL+SHIFT+R para recargar la página actual evitando en lo posible el uso de cachés intermedias.

La solcuión de todos estos problemas pasa por la voluntad y responsabilidad del proveedor. Mientras tanto, para acceder a aquellos sitios que resultan inaccesibles, podemos hacer uso de alguno de los servicios de navegación anónima, como por ejemplo Anonymizer.com.


Actualización (2002-11-10)

Después de llevar a cabo diversas pruebas para identificar el origen de los problemas, con la inestimable ayuda y colaboración de algunos amigos, parece que hemos dado con la causa de los mismos. Aunque para entender la razón de los problemas de acceso, y la solución adoptada, es necesario disponer de unos conceptos básicos de funcionamiento de la web (es decir, de qué sucede desde que tecleamos una URL en nuestro navegador hasta que aparece la página en pantalla. Consulte este artículo para saber más al respecto, y luego siga leyendo.

El problema sucede por una desafortunada combinación de factores, entre los que se incluyen el proxy situado por Telefonica™ en el camino del tráfico HTTP saliente, el funcionamiento del propio protocolo y posibles problemas con los servidores DNS que contienen la información asociada al dominio 24x7linux.com. Sucede que habitualmente los navegadores usan la versión 1.1 del protocolo HTTP, que especifica la obligatoriedad de enviar junto con el resto de cabeceras de la petición, una de nombre Host, donde se indique el nombre o dirección IP (y en caso necesario, el puerto) del servidor remoto a cuyas páginas queremos acceder. Baste decir que esta cabecera es la que permite configurar virtual hosts distinguidos por nombre, compartiendo una misma IP.

En situaciones normales (en ausencia de proxys, el navegador conecta al puerto correspondiente de la máquina remota, y le remite las cabeceras de la petición HTTP (incluyendo la cabecera Host). El servidor web remoto analizará las cabeceras, y devolverá la respuesta (página) que corresponda. Sin embargo, con un proxy intermedio (aunque sea transparente de cara al usuario) la petición del cliente (el navegador) es atendida por la máquina proxy, que por su parte realiza una nueva consulta al servidor en nombre del cliente, hecho del que deja constancia añadiendo alguna cabecera adicional, como por ejemplo X-Forwarded-For (IP de la máquina donde está el navegador que hizo la petición original) y Via (donde el proxy se identifica como tal).

Pues bien, por razones que no alcanzo a comprender parece como si el proxy intentara averiguar la dirección IP de la máquina indicada en la cabecera Host. Esto, que en circunstancias normales no tendría mayor problema, se convierte en un grave inconveniente si, como parece, el proxy es incapaz de encontrar la dirección IP asociada a www.24x7linux.com la mayor parte del tiempo, reteniendo la petición HTTP, que nunca llega al servidor. Parece que eventualmente consigue averiguar la dirección IP asociada, dando acceso al sitio web durante el tiempo que dicha equivalencia entre nombre y dirección IP permanece en su caché DNS.

La razón por la que el proxy es incapaz de averigüar la dirección IP del sitio web me resulta desconocida. Porque habiendo consultado a varios servidores DNS la equivalencia entre el nombre www.24x7linux.com y su dirección IP siempre he obtenido respuesta, y de manera rápida en todos los casos. Lo que sí es cierto es que desde hace unas semanas la web de Gandi, donde se registró el nombre de dominio y donde se encuentran los servidores DNS primario y secundario para el mismo, ha experimentado graves problemas de acceso, que bien pudieran afectar también al servicio de nombres.

Así que para descartar esta posibilidad, y solucionar de una vez los problemas de acceso que están teniendo lugar, me decidí a migrar los servidores DNS primario y secundario para el dominio a la máquinas de la empresa ZoneEdit. Dicha empresa se dedica exclusivamente a prestar servicios de hospedaje de servidores DNS, proporcionando una sencilla interfaz web para la gestión de toda la información asociada al dominio o dominios cuyos servidores de nombres albergue. Además, este servicio es completamente gratuito para los primeros cinco dominios cuyos servidores DNS hospedemos, así que todo son ventajas.

El único problema es que la propagación de los cambios en los servidores de nombres asociados a dominios .com suele tardar entre dos y tres días, de manera que hasta aproximadamente el Martes día 12 de Noviembre de 2002 no sabremos si el cambio ha solucionado los problemas de acceso (confirmándonos que la causa de los mismos radicaba en la combinación de circunstancias indicadas más arriba). Seguiremos informando de todo cuando vayamos averigüando.


Actualización (2002-11-12)

Se ha confirmado desde varias líneas de acceso (tanto de la red ADSL de Telefonica™, como de otros proveedores y con otras tecnologías) que la información actualizada de los servidores de nombres primario y secundario para el dominio 24x7linux.com ya se ha propagado por Internet. Desde estas mismas conexiones se ha probado a acceder a la página web www.24x7linux.com, funcionando correctamente y a gran velocidad en todos los casos.

Es decir, se confirma nuestra hipótesis principal, que consistía en problemas de funcionamiento de los servidores DNS hospedados en las máquinas de Gandi, aunque bien es cierto que dichos problemas sólo parecían suceder en las supuestas resoluciones de nombres que parecían llevar a cabo los proxys instalados por Telefonica™ en la red de datos ADSL.

Desde el cambio de los servidores DNS primario y secundario del dominio a ZoneEdit no hemos tenido ningún tipo de problema. De hecho, personalmente opino que he salido ganando con este cambio, que si bien me había planteado en alguna ocasión, nunca había llevado a cabo, por la simple premisa de "si funciona, no lo toques". Aprovecho estas últimas líneas para agradecer la colaboración, apoyo y paciencia de todos aquellos que han colaborado en averiguar y solucionar el problema acaecido. Muchas gracias a todos.


Actualización (2002-11-18)

Según parece, Telefonica™ ha dado marcha atrás en su despliegue de proxys para las conexiones ADSL, en las que todo el tráfico de red con destino a puertos 80 remotos se asumía de tipo HTTP. Esto impedía prestar servicios distintos de web en citado puerto (algo nada habitual), desvirtuaba la información contenida en los archivos de log de los ervidores, causaba que ciertas aplicaciones y formularios web no funcionaran correctamente, o que se manifestaran otro tipo de problemas como el sucedido con este sitio, y que se describe más arriba.

Si bien parece que los proxys ya no están presentes (como se puede comprobar en esta página), bien pudiera ser una medida temporal o simplemente una configuración más furtiva de los mismos. Hasta ahora las únicas noticias al respecto de esta posible retirada de los proxys en las líneas ADSL provienen de un hilarante (por las estupideces técnicas y la creencia de sus autores de haber sido ellos, entre otros, lo que han hecho dar marcha atrás a la operadora) artículo en el foro de nombre Asociación para la Información de Hackers (A.I.H.).

De momento la operadora no ha dicho nada al respecto (tampoco veo yo la necesidad de que una operadora haga públicos cada uno de los cientos de cambios que acomete al mes en su red), y no hay mucha más informacuón al respecto. El hecho es que parece que el hecho se confirma a lo largo de toda la red ADSL de Telefonica™, y la situación vuelve a la situación previa a principios de Noviembre.


Actualización (2002-12-03)

Parece que lo que parecía lógico se ha hecho realidad: Telefonica™ parece haber "reactivado" sus proxys en los accesos ADSL. Como ya hemos comentado previamente esto no es malo de por sí, de hecho si funcionan correctamente es beneficioso tanto para el operador de la red como para el usuario, pero conviene tener este hecho en cuenta por si experimentamos problemas de navegación inusuales. Por lo demás, consulte el resto de este artículo para los (pocos) detalles concretos al respecto de este tema.


Actualización (2002-12-25)

Por fin parece haber información fiable al respecto del asunto de los proxys de boca del proveedor. Según se recoge en esta página de ADSL4Ever, Telefonica está informando a sus clientes que en breve (a partir del día 10 de Enero de 2003) activará los proxys de los que hemos venido hablando ya durante varias semanas, y que hasta la fecha tan sólo estaban en pruebas.

Si bien los argumentos del proveedor son correctos y justificados, el uso de estos sistemas abren algunas cuestiones que no tienen de momento respuesta, así como algunos inconvenientes que pueden aparecer. Si bien es cierto que el uso de los proxys proporcionan "Mayor seguridad y anonimato de los usuarios ya que, para estos contenidos, se accede a los servidores con la dirección IP del proxy-caché y no con la del usuario", también es cierto que esto impide a los servidores web generar estadísticas de uso correctas con la configuración actual. Además del posible inconveniente de un punto central de fallo, que en caso de fallar (físicamente, o por problemas de configuración) puede dejar sin servicio a un elevado número de abonados.

Además, el uso de estos proxys quizás (no lo sé con seguridad) no aplique a otros tipos de tráfico posiblemente más masivo y "dañino" para la calidad del servicio de sus clientes, como es el generado por los programas peer-to-peer y de streaming de vídeo y audio. Sin olvidar que dependiendo del funcionamiento de estos ingenios es posible que las páginas cuyos contenidos varían con frecuencia (como los periódicos en Internet y los weblogs) se nos muestren anticuadas con respecto a los contenidos actuales de las mismas.


Actualización (2003-01-05)

Telefonica muestra en las páginas de www.telefonicaonline.com información acerca del despliegue de los sistemas de proxy cache para los abonados del servicio ADSL. En concreto, a partir de esta página se encuentran varios documentos en formato PDF, donde se explican los detalles del sistema tanto para los usuarios finales, como para las empresas y proveedores.

Lo mejor para formarse una opinión acerca de este tema es leer la documentación enlazada en el párrafo anterior, aunque conviene señalar un par de detalles:

  • Los únicos servicios a los que afectará la presencia de estos proxy son a los prestados en los puertos 80 (protocolo HTTP), streaming de Microsoft™ Windows Media© (puerto 1755 tanto TCP como UDP), streaming de Real Networks™ (protocolo RTSP en el puerto 554), así como streaming de Quicktime©, en el mismo puerto que el anterior.
  • No existe previsto un mecanismo para evitar el uso de los proxy, salvo reconfigurar los servidores web bajo nuestra responsabilidad y forzar a que los navegadores pidan contenido "fresco" a los servidores.
  • Algunos sitios y aplicaciones que usan la dirección IP de las peticiones HTTP como medio de identificar a los usuarios o restringir el acceso es muy posible que dejen de funcionar correctamente. Esto incluye también a los programas analizadores de log y de generación de estadísticas de acceso.

Al margen de los detalles objetivos existen bastantes detalles en los documentos publicados por Telefonica que bien no son ciertos, o son contradictorios con otras cosas dichas en los mismos documentos tan solo unos párrafos antes, como por ejemplo:

  • Si bien se dice que el uso de cookies en los servicios web se desaconseja, puesto que dichas páginas no son cacheadas por los proxy, un par de párrafos más adelante se indica el uso de este mecanismo para ofrecer al usuario el contenido real actualizado del sitio.
  • Se recomiendan barbaridades como renombrar todos los archivos de nuestro sitio web para asegurarnos de que los cambios se propagan de manera inmediata a los visitantes de nuestras páginas.
  • Se explica cómo modificar la configuración de los servidores web más importantes del mercado para generar archivos de log que tengan en cuenta la presencia de los proxy, pero los cambios suponen que las peticiones que vengan directamente de los navegadores de los usuarios sin pasar por estos dispositivos no se registrarán correctamente, siendo no contabilizables con las aplicaciones de generación de estadísticas.
  • Los cambios necesarios en los servidores web para "adecuarlos" a los proxy, en los casos donde realmente sirven para algo, requieren siempre privilegios de superusuario sobre la máquina que hospeda las páginas, lo que impide llevar estos cambios a la práctica cuando las páginas están alojadas en un servicio de hosting.
  • Otras muchas incorrecciones, contradicciones y recomendaciones al margen de la realidad que podrá encontrar si lee con detenimiento los documentos en cuestión.

Ya para finalizar, mi opinión personal después de leer la información proporcionada por el propio proveedor es que la presencia de estos dispositivos en la red de acceso para los usuarios de ADSL posiblemente sí que mejore los tiempos de carga de las páginas web más visitadas, pero dudo que en la mayor parte de los casos la mejora sea tan importante como para justificar el despliegue masivo de esta infraestructura de proxy.

Además, puede que el porcentaje de tráfico que estos proxy ahorren al proveedor sea muy bajo, puesto que tráfico tan masivo como el FTP, los programas de peer to peer, el streaming de MP3, etc. no son cacheados por estos dispositivos.

Por cierto, si desea reconfigurar su servidor web Apache para que sus archivos de log contengan entradas correctas aún cuando las peticiones provengan de usuarios ADSL de Telefonica, consulte este artículo.

Última modificación: 11-January-2003 13:52:37 -0500

© 2002-2007 José Luis Domingo López. Todos los derechos reservados.
Contacte con el webmaster para informarle de fallos, incorrecciones o sugerencias.
Esta página cumple con los estándares HTML 4.01 y CSS2 del World Wide Web Consortium.