网站全面采用UTF-8方法

mac2022-06-30  253

先是概念的理解:

Unicode/UCS的压缩形式--UTF8出现了,套用官方网站的首句话『UTF-8 stands for Unicode Transformation Format-8. It is an octet (8-bit) lossless encoding of Unicode characters.』,由于UTF也适用于编码UCS,故亦可称为『UCS transformation formats (UTF)』 UTF8是以8bits即1Bytes为编码的最基本单位,当然也可以有基于16bits和32bits的形式,分别称为UTF16和UTF32,但目前用得不多,而UTF8则被广泛应用在文件储存和网络传输中。

-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。 至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。 GBK包含全部中文字符, UTF-8则包含全世界所有国家需要用到的字符。 GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准 UTF-8编码的文字可以在各国各种支持UTF8字符集的浏览器上显示。 比如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包。 对于英文比较多的论坛,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。 UTF-8版本虽然具有良好的国际兼容性,但需要比GBK/BIG5版本多占用50%的数据库存储空间,因此并非推荐使用,仅供对国际兼容性有特殊要求的用户使用。

1. 用 vi /etc/httpd/conf/httpd.conf 設定Apache中的编码为:( (记得restart)

AddDefaultCharset UTF-8;

2. 用 vi /etc/php.ini 设置php中的编码为:( (记得restart)

default_charset = "utf-8";

3. 用 vi /etc/my.cnf 设置MySQL中的编码为:( (记得restart)

[mysqld] init_connect='SET NAMES utf8'; default-character-set=utf8; [client] default-character-set = utf8;

4. 建立函数库时选择编码为: (记得清除DB Cache)

DROP DATABASE IF EXISTS `aa`; CREATE DATABASE `aa` DEFAULT CHARACTER SET utf8 COLLATE utf8_unicode_ci; USE `aa`; CREATE TABLE IF NOT EXISTS `aat` ( `id` char(1) NOT NULL default '1', `myStr` varchar(200) default NULL, PRIMARY KEY (`id`) ) ENGINE=MyISAM DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;

5. 用UltraEdit(v11.20a版) 转换所有ANSI格式的php文档转换为UTF-8格式:

File --> Conversions --> ASCII to UTF-8 (Unicoding Editing) ( 在UltraEdit中按Advanced --> configuration --> File Handling --> Unicode/UTF-8 Detection --> 剔选Auto detect utf-8 files )

    如有需要时,可执行Remove BOM.php. 应该用Windows系统的Notepad将php文档由ANSI转为UTF-8时,

  因为文档头有BOM,会引起排版问题或者php程序无错误提示,页面显示空白,需要移除,执行Remove BOM.php即可自动移除.

  Remove BOM.php可由以下网址下载:

http://www.hoyo.idv.tw/hoyoweb/document/view.php?sid=13&author=hoyo&status=view

6. 在php文档中必須加入:

<html><head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> </head><body>

7. 在连接DB的文档中必須加入3行mysql_query才ok:

// 要在真正query DB取出资料前,加入以下3行 mysql_query("SET NAMES 'utf8'"); mysql_query("SET CHARACTER_SET_CLIENT=utf8"); mysql_query("SET CHARACTER_SET_RESULTS=utf8"); $sql = "select * from aat where crid='1'"; $rows = mysql_query($sql);

8. 在php文档中, 如有需要注意: [Optional]

      运用htmlentities和htmlspecialchars时,如下:

$chars = htmlentities($chars,ENT_QUOTES,"UTF-8"); $chars = htmlspecialchars($chars,ENT_QUOTES,"UTF-8");

      并且在显示前要用

$chars = html_entity_decode($chars,ENT_QUOTES,"UTF8");

      如有用过addslashes()或mysql_real_escape_string()记得用以下:

$chars = stripslashes($chars);

      如有需要可以用以下函数转换编码:           

$chars = iconv('Big5','UTF-8',$chars);

<摘自:http://www.cnblogs.com/cy163/archive/2007/05/31/766886.html & http://blog.sina.com.cn/s/blog_6dd65c6f01019b37.html & http://www.verydemo.com/demo_c116_i116823.html>

转载于:https://www.cnblogs.com/ChandlerVer5/p/mysql_utf8.html

相关资源:JSP大文件上传控件-access-utf8

最新回复(0)