用于采集的函数,补全url
// 根据url补全地址 
function formaturl($url, $str){
    if (is_array($str)) {
        $return = array();
        foreach ($str as $href) {
            $return[] = formaturl($url, $href);
        }
        return $return;
    } else {
        if (stripos($str, 'http://')===0 || stripos($str, 'ftp://')===0 || stripos($str, 'https://')===0) {
            return $str;
        }
        $str = str_replace(chr(92), '/', $str);
        $parseUrl = parse_url(dirname($url).'/');
        $scheme = isset($parseUrl['scheme']) ? $parseUrl['scheme'] : 'http';
        $host = $parseUrl['host'];
        $path = isset($parseUrl['path']) ? $parseUrl['path'] : '';
        $port = isset($parseUrl['port']) ? $parseUrl['port'] : '';
        if (strpos($str, '/')===0) {
            return $scheme.'://'.$host.$str;
        } else {
            $part = explode('/', $path);
            array_shift($part);
            $count = substr_count($str, '../');
            if ($count>0) {
                for ($i=0; $i<=$count; $i++) {
                    array_pop($part);
                }
            }
            $path = implode('/', $part);
            $str = str_replace(array('../','./'), '', $str);
            $path = $path=='' ? '/' : '/'.trim($path,'/').'/';
            return $scheme.'://'.$host.$path.$str;
        }        
    }
 }