New crawler
[infodrom.org/www.zeitungsliste.de] / lib / core.inc
index e358285..e498fd1 100644 (file)
@@ -197,8 +197,11 @@ function is_spider()
       strpos($_SERVER['HTTP_USER_AGENT'], 'suggybot v0.01a') !== false ||
       strpos($_SERVER['HTTP_USER_AGENT'], 'DomainCrawler/2.0') !== false ||
       strpos($_SERVER['HTTP_USER_AGENT'], 'Plukkie/1.4') !== false ||
-      strpos($_SERVER['HTTP_USER_AGENT'], 'nutch-1.3/Nutch-1.3') !== false ||
+      strpos($_SERVER['HTTP_USER_AGENT'], '/Nutch-') !== false ||
       strpos($_SERVER['HTTP_USER_AGENT'], 'aiHitBot/1.0') !== false ||
+      strpos($_SERVER['HTTP_USER_AGENT'], 'AhrefsBot/2.0') !== false ||
+      strpos($_SERVER['HTTP_USER_AGENT'], 'Crawler') !== false ||
+      strpos($_SERVER['HTTP_USER_AGENT'], 'Acoon') !== false ||
       strpos($_SERVER['HTTP_USER_AGENT'], 'Cityreview Robot') !== false) {
     if (isset($_SESSION['uid']))
       $_SESSION['robot'] = true;