1. 程式人生 > >php擷取中文字串方法

php擷取中文字串方法

/**
 * 擷取中文
 * @param stirng $string 擷取內容
 * @param int $sublen 擷取長度
 * @param int $start 開始位置
 * @param string $code 編碼方式
 * @return string
 */
function substr_zh($string, $sublen, $start = 0, $code = 'UTF-8')
{
    if ($code == 'UTF-8') {
        $pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/";
        preg_match_all($pa, $string, $t_string);
        if (count($t_string[0]) - $start > $sublen) {
            return join('', array_slice($t_string[0], $start, $sublen)) . "...";
            //array_slice()在陣列中根據條件取出一段值,引數(陣列,開始位置,[長度])
        } else {
            return join('', array_slice($t_string[0], $start, $sublen));
        }
    } else {
        $start = $start * 2;
        $sublen = $sublen * 2;
        $strlen = strlen($string);
        $tmpstr = '';
        for ($i = 0; $i < $strlen; $i++) {
            if ($i > $start && $i < ($start + $sublen)) {
                if (ord(substr($string, $i, 1)) > 129) {
                    //ord():返回字串第一個字元的ASCII值
                    //substr():返回字串的一部分
                    $tmpstr .= substr($string, $i, 2);
                } else {
                    $tmpstr .= substr($string, $i, 1);
                }
            }
            if (ord(substr($string, $i, 1)) > 129) {
                $i++;
            }
            if (strlen($tmpstr) < $strlen) {
                $tmpstr .= "...";
            }
        }
        return $tmpstr;
    }
}