Raw Access Logs son archivos de texto que contienen información acerca de los usuarios y el contenido al cual han accedido en tu web. La traducción que hace su página web es Registros de acceso crudos o directamente Registros de Acceso Raw y desde el enlace anterior puedes acceder también a una Demo de Cpanel.
Estos Registros de Acceso -veremos qué datos contiene- pueden resultar de mucha utilidad e importancia, por ejemplo, a la hora de descubrir errores en aplicaciones web, ver quién está investigando más de lo que debiera, descubrir vulnerabilidades... Sin embargo, muchos usuarios no lo configuran adecuadamente y estos registros suelen ser borrados automáticamente al cabo de cierto tiempo: 1 mes, 24 horas etc... Veremos cómo configurarlo, guardar copias, eliminar la del mes anterior y descargarlas.
Desde CPanel debes dirigirte a la zona de Registros (Logs en inglés) y ahí verás la opción "Registros de Acceso Raw":
Al entrar, vemos lo siguiente (la traducción en castellano no es muy buena):
Si tildas las opción 1, una vez que se procesen las estadísticas, se guardarán los archivos de registro en tu directorio home. La opción 2 permite borrar los registros del mes anterior de tu directorio home. Tanto si tildas o destildas la opción 1 o 2, debes pulsar el botón "Salvar" 3, para guardar los cambios.
Si pulsas en el enlace 4 descargarás los registros de acceso en bruto actuales. Es un archivo de texto que puedes abrir con tu editor de texto preferido.
Si has tildado la opción 1, verás que se irán archivando los Registros de Acceso Raw completos 5. Puedes hacer clic y descargarlos o acceder directamente a ellos desde tu directorio home/logs. Tienen extensión gz (GNU zip), que tendrás que descomprimir.
Normalmente y por defecto, los archivos de acceso raw se regeneran cada 24 horas y tú solamente puedes verlos hasta un máximo de ese periodo. Cuando tildas las opción 1, cada nuevo ciclo se va guardando hasta que llega a completarse (1 mes), momento en el cual se archiva 5 y se crea un nuevo ciclo.
Voy a copiar una línea de un archivo de Registros de Acceso Raw, contiene los siguientes datos:
192.168.21.64 - - [28/Jan/2013:01:36:43 -0500] "GET /style.css HTTP/1.1" 200 6097 "http://www.karmany.net/index.php" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.56 Safari/537.17"
Los datos que muestra son los siguientes:
Datos del registro |
Explicación |
---|---|
192.168.21.64 | Es la dirección IP del cliente que hizo la petición al servidor. |
[28/Jan/2013:01:36:43 -0500] | La hora en la que el servidor recibió la petición. Formato: [día/mes/año:hora:minuto:segundo zona_horaria] |
GET | Método usado por el cliente. Normalmente GET o POST |
/style.css | Recurso al que se ha hecho la petición. |
HTTP/1.1 | Protocolo usado |
200 | Código de estado que el servidor envía al cliente. 200: Ok. Todos los códigos están aquí, sección 10: HTTP/1.1 Status Code Definitions |
6097 | El tamaño retornado por el cliente. Si es nulo aparecerá un - |
http://www.karmany.net/index.php | Servidor del que proviene el cliente, que debería ser la página que contiene o enlaza al recurso anterior. |
Mozilla/5.0... | Información del navegador usado por el cliente |
CPanel suele contener también otras herramientas como Awstats, últimas visitas u otras (como puedes ver en la primera imagen), que unidas a los Registros de Acceso Raw y a otras herramientas externas como Google Analytics, StatCounter y un largo etcétera, te muestran información del usuario y al contenido al cual han accedido. Hoy, por ejemplo, he accedido a las estadísticas mensuales de Awstats y he descubierto varias peticiones de error hacia imágenes de mi servidor. Esas peticiones de error vienen porque tengo activado Hotlinking e investigando he comprobado que varios sitios web, copian artículos enteros de esta web, incluso el enlace real de mis imágenes.