Thomas Bruederli
2012-11-17 6ddb16d181e285d4f0ef0ef55bdd0ba787f1b583
program/include/rcube_string_replacer.php
@@ -5,8 +5,11 @@
 | program/include/rcube_string_replacer.php                             |
 |                                                                       |
 | This file is part of the Roundcube Webmail client                     |
 | Copyright (C) 2009, Roundcube Dev. - Switzerland                      |
 | Licensed under the GNU GPL                                            |
 | Copyright (C) 2009, The Roundcube Dev Team                            |
 |                                                                       |
 | Licensed under the GNU General Public License version 3 or            |
 | any later version with exceptions for skins & plugins.                |
 | See the README file for a full license statement.                     |
 |                                                                       |
 | PURPOSE:                                                              |
 |   Handle string replacements based on preg_replace_callback           |
@@ -14,16 +17,14 @@
 +-----------------------------------------------------------------------+
 | Author: Thomas Bruederli <roundcube@gmail.com>                        |
 +-----------------------------------------------------------------------+
 $Id$
*/
/**
 * Helper class for string replacements based on preg_replace_callback
 *
 * @package Core
 * @package    Framework
 * @subpackage Utils
 */
class rcube_string_replacer
{
@@ -36,15 +37,17 @@
  function __construct()
  {
    // Simplified domain expression for UTF8 characters handling
    $utf_domain = '[^?&@"\'\\/()\s\r\t\n]+\\.[a-z]{2,5}';
    $url = '[a-z0-9%=#@+?.:;&\\/_~-]+';
    // Support unicode/punycode in top-level domain part
    $utf_domain = '[^?&@"\'\\/()\s\r\t\n]+\\.?([^\\x00-\\x2f\\x3b-\\x40\\x5b-\\x60\\x7b-\\x7f]{2,}|xn--[a-zA-Z0-9]{2,})';
    $url1 = '.:;,';
    $url2 = 'a-zA-Z0-9%=#$@+?!&\\/_~\\[\\]{}\*-';
    $this->link_pattern = "/([\w]+:\/\/|\Wwww\.)($utf_domain($url)?)/i";
    $this->link_pattern = "/([\w]+:\/\/|\W[Ww][Ww][Ww]\.|^[Ww][Ww][Ww]\.)($utf_domain([$url1]?[$url2]+)*)/";
    $this->mailto_pattern = "/("
        ."[-\w!\#\$%&\'*+~\/^`|{}=]+(?:\.[-\w!\#\$%&\'*+~\/^`|{}=]+)*"  // local-part
        ."@$utf_domain"                                                 // domain-part
        ."(\?$url)?"                                                    // e.g. ?subject=test...
        .")/i";
        ."(\?[$url1$url2]+)?"                                           // e.g. ?subject=test...
        .")/";
  }
  /**
@@ -79,13 +82,21 @@
    $i = -1;
    $scheme = strtolower($matches[1]);
    if (preg_match('!^(http|ftp|file)s?://!', $scheme)) {
    if (preg_match('!^(http|ftp|file)s?://!i', $scheme)) {
      $url = $matches[1] . $matches[2];
      $i = $this->add(html::a(array('href' => $url, 'target' => '_blank'), Q($url)));
    }
    else if (preg_match('/^(\W)www\.$/', $matches[1], $m)) {
      $url = 'www.' . $matches[2];
      $i = $this->add($m[1] . html::a(array('href' => 'http://' . $url, 'target' => '_blank'), Q($url)));
    else if (preg_match('/^(\W*)(www\.)$/i', $matches[1], $m)) {
      $url        = $m[2] . $matches[2];
      $url_prefix = 'http://';
      $prefix     = $m[1];
    }
    if ($url) {
      $suffix = $this->parse_url_brackets($url);
      $i = $this->add($prefix . html::a(array(
          'href' => $url_prefix . $url,
          'target' => '_blank'
        ), rcmail::Q($url)) . $suffix);
    }
    // Return valid link for recognized schemes, otherwise, return the unmodified string for unrecognized schemes.
@@ -100,11 +111,13 @@
   */
  public function mailto_callback($matches)
  {
    $href   = $matches[1];
    $suffix = $this->parse_url_brackets($href);
    $i = $this->add(html::a(array(
        'href' => 'mailto:' . $matches[1],
        'onclick' => "return ".JS_OBJECT_NAME.".command('compose','".JQ($matches[1])."',this)",
      ),
      Q($matches[1])));
        'href' => 'mailto:' . $href,
        'onclick' => "return ".rcmail::JS_OBJECT_NAME.".command('compose','".rcmail::JQ($href)."',this)",
      ), rcmail::Q($href)) . $suffix);
    return $i >= 0 ? $this->get_replacement($i) : '';
  }
@@ -122,6 +135,22 @@
  }
  /**
   * Replace all defined (link|mailto) patterns with replacement string
   *
   * @param string $str Text
   *
   * @return string Text
   */
  public function replace($str)
  {
    // search for patterns like links and e-mail addresses
    $str = preg_replace_callback($this->link_pattern, array($this, 'link_callback'), $str);
    $str = preg_replace_callback($this->mailto_pattern, array($this, 'mailto_callback'), $str);
    return $str;
  }
  /**
   * Replace substituted strings with original values
   */
  public function resolve($str)
@@ -129,4 +158,38 @@
    return preg_replace_callback(self::$pattern, array($this, 'replace_callback'), $str);
  }
}
  /**
   * Fixes bracket characters in URL handling
   */
  public static function parse_url_brackets(&$url)
  {
    // #1487672: special handling of square brackets,
    // URL regexp allows [] characters in URL, for example:
    // "http://example.com/?a[b]=c". However we need to handle
    // properly situation when a bracket is placed at the end
    // of the link e.g. "[http://example.com]"
    if (preg_match('/(\\[|\\])/', $url)) {
      $in = false;
      for ($i=0, $len=strlen($url); $i<$len; $i++) {
        if ($url[$i] == '[') {
          if ($in)
            break;
          $in = true;
        }
        else if ($url[$i] == ']') {
          if (!$in)
            break;
          $in = false;
        }
      }
      if ($i<$len) {
        $suffix = substr($url, $i);
        $url    = substr($url, 0, $i);
      }
    }
    return $suffix;
  }
}