4 include_once('/org/zeitungsliste.de/lib/core.inc');
5 include_once('/org/zeitungsliste.de/lib/extern/apache-log-parser.php');
7 $log = '/var/log/apache2/www.zeitungsliste.de/combined.log.0';
11 $logparser = new apache_log_parser();
12 if ($logparser->open_log_file($log)) {
13 while ($line = $logparser->get_line()) {
15 if (strpos($line, "GET /robots.txt HTTP/") !== false) {
16 $parts = $logparser->format_line($line);
18 $_SERVER['HTTP_USER_AGENT'] = $parts['agent'];
21 $notfound[] = $parts['agent'];
24 $logparser->close_log_file();
26 echo "Cannot open $log\n";
30 if (count($notfound)) {
31 $header[] = 'From: Zeitungsliste <master@zeitungsliste.de>';
32 $header[] = 'To: Joey Schulze <joey@infodrom.org>';
33 $header[] = 'MIME-Version: 1.0';
34 $header[] = 'Content-type: text/plain; charset=utf-8';
35 $header[] = 'Content-Disposition: inline';
36 $header[] = 'Content-Transfer-Encoding: 8bit';
38 $to = 'joey@infodrom.org';
39 $subject = 'Spider nicht erkannt';
40 $body = "Die folgenden Spider wurden nicht anhand ihres UserAgent-Kennung\n".
43 foreach ($notfound as $agent)
44 $body .= " " . $agent . "\n";
46 mail ($to, $subject, $body, implode("\n", $header));