jiuhecai说,在帝国cms编辑器的下部菜单中,点选自动分页后,可以设置每多少个字节(默认是5000个)自动分页。
这个分页是比较粗糙的。为什么这么说呢?因为他可能截断html标签,导致分页后页面内容展示畸形。
比如正文内容是这样的:
<p>我们这里开始了呵呵...这里省略4990个字 <ul><li>黄瓜</li> <li>黄瓜</li></ul></p>
分页后可能变成这样的:
<p>我们这里开始了呵呵...这里省略4990个字 <ul><li>黄瓜
这是第一页,html标签不完整了。
</li> <li>黄瓜</li></ul></p>
这是第二页,html标签也不完整了。
如何避免这情况的发生,就需要改动帝国cms 的源代码,使得分页更加智能化。看这个函数:
<?php /** * 取HTML,并自动补全闭合 * * param $html * * param $length * * param $end */ function subHtml($html,$length=10,$fenyefu='[!--jiuhecai的分页符--]') { $result = ''; $tagStack = array(); $len = 0; $contents = preg_split("~(<[^>]+?>)~si", $html, -1, PREG_SPLIT_NO_EMPTY | PREG_SPLIT_DELIM_CAPTURE); foreach($contents as $tag) { if (trim($tag) == "") continue; if (preg_match("~<([a-z0-9]+)[^/>]*?/>~si", $tag)) { $result .= $tag; } else if (preg_match("~</([a-z0-9]+)[^/>]*?>~si", $tag, $match)) { if ($tagStack[count($tagStack)-1] == $match[1]) { array_pop($tagStack); $result .= $tag; } } else if (preg_match("~<([a-z0-9]+)[^/>]*?>~si", $tag, $match)) { array_push($tagStack, $match[1]); $result .= $tag; } else if (preg_match("~<!--.*?-->~si", $tag)) { $result .= $tag; } else { if ($len + mstrlen($tag) < $length) { $result .= $tag; $len += mstrlen($tag); } else { $str = msubstr($tag, 0, $length - $len + 1); $result .= $str; break; } } } $houbu='<'.join($tagStack,'><').'>'; while (!empty($tagStack)) { $qianbu .= '</' . array_pop($tagStack) . '>'; } $result=$result.$qianbu; $html=substr($html,strlen($result)); if($html){ $html=$houbu.$html; $result.=$fenyefu.subHtml($html); } return $result; } /** * 取中文字符串 * * param $string 字符串 * * param $start 起始位 * * param $length 长度 * * param $charset 编码 * * param $dot 附加字串 */ function msubstr($string, $start, $length, $dot = '', $charset = 'UTF-8') { $string = str_replace(array('&', '"', '<', '>', ' '), array('&', '"', '<', '>', ' '), $string); if (strlen($string) <= $length) { return $string; } if (strtolower($charset) == 'utf-8') { $n = $tn = $noc = 0; while ($n < strlen($string)) { $t = ord($string[$n]); if ($t == 9 || $t == 10 || (32 <= $t && $t <= 126)) { $tn = 1; $n++; } elseif (194 <= $t && $t <= 223) { $tn = 2; $n += 2; } elseif (224 <= $t && $t <= 239) { $tn = 3; $n += 3; } elseif (240 <= $t && $t <= 247) { $tn = 4; $n += 4; } elseif (248 <= $t && $t <= 251) { $tn = 5; $n += 5; } elseif ($t == 252 || $t == 253) { $tn = 6; $n += 6; } else { $n++; } $noc++; if ($noc >= $length) { break; } } if ($noc > $length) { $n -= $tn; } $strcut = substr($string, 0, $n); } else { for($i = 0; $i < $length; $i++) { $strcut .= ord($string[$i]) > 127 ? $string[$i] . $string[++$i] : $string[$i]; } } return $strcut . $dot; } /** * 得字符串的长度,包括中英文。 */ function mstrlen($str, $charset = 'UTF-8') { if (function_exists('mb_substr')) { $length = mb_strlen($str, $charset); } elseif (function_exists('iconv_substr')) { $length = iconv_strlen($str, $charset); } else { preg_match_all("/[x01-x7f]|[xc2-xdf][x80-xbf]|xe0[xa0-xbf][x80-xbf]|[xe1-xef][x80-xbf][x80-xbf]|xf0[x90-xbf][x80-f][x80-xbf]|[xf1-xf7][x80-xbf][x80-xbf][x80-xbf]/", $text, $ar); $length = count($ar[0]); } return $length; } $str = "<div><table>x<tr>1s<td>测你<input name='11'/>你好我也好我们是非常好的非常这好似一个这是一个故事的故事试<td>124"; echo subHtml($str);
执行结果为
<div><table>x<tr>1s<td>测你<input name='11'/>你好我也好我</td></tr></table></div>[!--jiuhecai的分页符--]<div><table><tr><td>这好似一个这是一个故事</td></tr></table></div>