New crawler
authorJoey Schulze <joey@infodrom.org>
Thu, 26 Apr 2012 20:42:52 +0000 (20:42 +0000)
committerJoey Schulze <joey@infodrom.org>
Thu, 26 Apr 2012 20:42:52 +0000 (20:42 +0000)
lib/core.inc

index e358285..e498fd1 100644 (file)
@@ -197,8 +197,11 @@ function is_spider()
       strpos($_SERVER['HTTP_USER_AGENT'], 'suggybot v0.01a') !== false ||
       strpos($_SERVER['HTTP_USER_AGENT'], 'DomainCrawler/2.0') !== false ||
       strpos($_SERVER['HTTP_USER_AGENT'], 'Plukkie/1.4') !== false ||
-      strpos($_SERVER['HTTP_USER_AGENT'], 'nutch-1.3/Nutch-1.3') !== false ||
+      strpos($_SERVER['HTTP_USER_AGENT'], '/Nutch-') !== false ||
       strpos($_SERVER['HTTP_USER_AGENT'], 'aiHitBot/1.0') !== false ||
+      strpos($_SERVER['HTTP_USER_AGENT'], 'AhrefsBot/2.0') !== false ||
+      strpos($_SERVER['HTTP_USER_AGENT'], 'Crawler') !== false ||
+      strpos($_SERVER['HTTP_USER_AGENT'], 'Acoon') !== false ||
       strpos($_SERVER['HTTP_USER_AGENT'], 'Cityreview Robot') !== false) {
     if (isset($_SESSION['uid']))
       $_SESSION['robot'] = true;