• <label id="pxtpz"><meter id="pxtpz"></meter></label>
      1. <span id="pxtpz"><optgroup id="pxtpz"></optgroup></span>

        當前位置:雨林木風下載站 > 技術開發教程 > 詳細頁面

        GD輸出漢字的函數的區分(函數代碼系轉帖)

        GD輸出漢字的函數的區分(函數代碼系轉帖)

        更新時間:2022-05-06 文章作者:未知 信息來源:網絡 閱讀次數:

        很早以前找到一個把GB碼轉化為UTF-8的函數,配合一個GB到UNICODE的對照表(gb2312.txt),用于在GD中輸出漢字。后來發現在欲輸出的內容中含有西文字符時,會出現混亂。后來找到了修改后的代碼,解決了問題。現將兩個函數做一對比分析如下。

        首先,這是一個UNICODE到UTF-8編碼轉換的函數,這一部分修改前后沒有變化:
        function u2utf8($c)
        {
        for($i=0;$i<count($c);$i++)
        $str="";
        if ($c < 0x80) {
        $str.=$c;
        }
        else if ($c < 0x800) {
        $str.=(0xC0 | $c>>6);
        $str.=(0x80 | $c & 0x3F);
        }
        else if ($c < 0x10000) {
        $str.=(0xE0 | $c>>12);
        $str.=(0x80 | $c>>6 & 0x3F);
        $str.=(0x80 | $c & 0x3F);
        }
        else if ($c < 0x200000) {
        $str.=(0xF0 | $c>>18);
        $str.=(0x80 | $c>>12 & 0x3F);
        $str.=(0x80 | $c>>6 & 0x3F);
        $str.=(0x80 | $c & 0x3F);
        }
        return $str;
        }

        這里完全是按照UTF-8編碼的規則,通過判斷字符屬于不同的UNICODE編碼段范圍,進行不同的移位和位與操作,以轉化為UTF-8編碼。關于該規則可參考http://www.utf8.org/上的說明。

        這是修改前的GB轉化為UTF-8編碼的函數,其中調用了上面的u2utf8函數。
        function gb2utf8($gb) /* Program writen by sadly www.phpx.com*/
        {
        if(!trim($gb))
        return $gb;
        $filename="gb2312.txt";
        $tmp=file($filename);
        $codetable=array();
        while(list($key,$value)=each($tmp))
        $codetable[hexdec(substr($value,0,6))]=substr($value,7,6);
        $utf8="";
        while($gb)
        {
        if (ord(substr($gb,0,1))>127)
        {
        $this=substr($gb,0,2);
        $gb=substr($gb,2,strlen($gb));
        $utf8.=u2utf8(hexdec($codetable[hexdec(bin2hex($this))-0x8080]));
        }
        else
        {
        $gb=substr($gb,1,strlen($gb));
        $utf8.=u2utf8(substr($gb,0,1));
        }
        }

        $ret="";
        for($i=0;$i<strlen($utf8);$i+=3)
        $ret.=chr(substr($utf8,$i,3));

        return $ret;
        }
        函數中while循環部分,把漢字逐個按照“對照表”轉化為UNICODE,再通過u2utf8函數轉化為UTF-8。但從中可以看出,while循環結束后,又用一個for循環,把每三個字節合成了一個UTF-8字符(見http://www.utf8.org/上的規則說明,每個漢字的UTF-8編碼為三字節),沒有考慮到其中的西文字符(西文字符的UTF-8編碼為一字節)。所以,如果欲輸出的內容中不論是開始時出現西文字符,或是漢字當中穿插西文字符,轉化為UTF-8后,都會被按照“每三個字節截取”的方式截開,導致亂碼。


        以下是修改后的函數:
        function gb2utf8($gb)/* Program writen by sadly modified by agun */
        {
        if(!trim($gb))
        return $gb;
        $filename="gb2312.txt";
        $tmp=file($filename);
        $codetable=array();
        while(list($key,$value)=each($tmp))
        $codetable[hexdec(substr($value,0,6))]=substr($value,7,6);

        $ret="";
        $utf8="";
        while($gb)
        {
        if (ord(substr($gb,0,1))>127)
        {
        $this=substr($gb,0,2);
        $gb=substr($gb,2,strlen($gb));
        $utf8=u2utf8(hexdec($codetable[hexdec(bin2hex($this))-0x8080]));
        for($i=0;$i<strlen($utf8);$i+=3)
        $ret.=chr(substr($utf8,$i,3));
        }
        else
        {
        $ret.=substr($gb,0,1);
        $gb=substr($gb,1,strlen($gb));
        }
        }
        return $ret;
        }

        修改后的函數將 GB轉化為UNICODE、UNICODE轉化為UTF-8、幾個字節合成一個UTF-8字符,這三個步驟在一個循環里完成,尤其是幾個字節合成一個UTF-8字符這一步驟,放在判斷了字符屬于西文還是屬于漢字的條件分支里,據此決定截取一個字節還是三個字節。于是結果正確了!

        溫馨提示:喜歡本站的話,請收藏一下本站!

        本類教程下載

        系統下載排行

        主站蜘蛛池模板: 亚洲成人黄色在线| 国产亚洲AV无码AV男人的天堂| 亚洲视频在线免费看| 成人影片一区免费观看| 国产国拍亚洲精品福利| eeuss影院ss奇兵免费com| 国产成人亚洲综合| 三年片免费高清版 | 亚洲1区2区3区精华液| 最近的中文字幕大全免费版| 色老板亚洲视频免在线观| 无码免费午夜福利片在线| 亚洲人成免费电影| 最近免费中文在线视频| 亚洲欧洲久久精品| 毛片网站免费在线观看| 亚洲国产成人无码AV在线| 日韩高清免费在线观看| 羞羞漫画页面免费入口欢迎你 | 亚洲乱码国产一区三区| 国产成人无码区免费内射一片色欲 | 亚洲人成日本在线观看| 91在线视频免费看| 国产精品亚洲а∨无码播放不卡| 亚洲国产成人a精品不卡在线| EEUSS影院WWW在线观看免费| 亚洲AV无码一区东京热| 青娱分类视频精品免费2| 粉色视频成年免费人15次| 在线日韩日本国产亚洲| 免费无码VA一区二区三区| 在线精品亚洲一区二区| 亚洲精品A在线观看| 最近中文字幕mv免费高清视频8| tom影院亚洲国产一区二区| 亚洲第一区在线观看| 99视频在线精品免费| 亚洲AV成人无码久久WWW| 亚洲精品无码久久千人斩| 性生交片免费无码看人| a在线视频免费观看在线视频三区 a毛片成人免费全部播放 |