民族

php各种编码集详解和当什么情况下展开利用 [php 字符集 显示]

3 10月 , 2018  

图片 1

http://blog.cnsunrun.com/member/blog/blog\_info/30/84

妇好,殷商中盛行的主武丁的皇后。


神州历史及先是各女性军事统帅,女政治家,参与并指挥了对巴方、土方、夷方、羌方等的主要战役。

php各种编码集详解和以什么情况下进行应用

她主持各种祭典,并任占卜之官。管理后宫,母仪天下。

  浏览次数:46  发表时:2011-06-11 23:40       

其又是一样正值诸侯,有和好之领地,向商纳税。

字符是各种文字与符号的总称,包括各国邦文字、标点符号、图形符号、数字相当于。字符集是差不多独字符的聚集,字符集种类比较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、
GB
18030字符集、Unicode字符集等。计算机要可靠之处理各种字符集文字,需要进行字符编码,以便计算机能够分辨与贮各种文字。

它们跟武丁感情深厚,妇好多次养,其中有做了未来底商王,她好后,追谥曰“辛”,后人们尊她呢“母辛”、“后母辛”。

中文文数据大,而且还分为简体中文和繁体中文两种不同书规则的文,而计算机最初是仍英语单字节字符设计之,因此,对汉语字符进行编码,是华语信息交流之技巧基础。本文将遵循字符集的工夫顺序讨论几种典型的字符集,选取几栽代表性的汉语字符集,研究历史由来、特点、技术特点。

武丁多次泛祭祀妇好,并为妇好举行了累累冥婚,将她底阴魂先后许配给了三员先商王:祖乙、太甲、成汤。

ASCII 字符集

01

1.称谓的原故

夏季朝后期,自孔甲乱政以后,夏朝面临内悄然外患,方国诸侯纷纷与夏决裂,及交夏桀继位,夏都是风雨飘摇。

ASCII(American Standard Code for Information
Interchange,美国信相互换标准代码)是根据罗马字母表的如出一辙学电脑编码系统。

使夏桀穷兵黩武,无力扭转乾坤,遭遇高速崛起的成汤。两方在鸣条大战,夏亡商立。

2.特点

成汤在毫厘(河南商丘)建立商朝,然而商朝宫廷中争权夺势,就“兄终弟及”和“父死子继”展开一不善而平等不善王位争夺战,加之自然环境恶劣,内忧外患使商朝数次迁都。

它要用来展示现代英语与外西欧语言。它是今最为通用的单字节编码系统,并一如既往于国际标准ISO
646。

及商第二十个君主主盘庚迁都交殷(河南安阳),终于稳定下来。

3.饱含内容

盘庚之后是其弟小辛,小辛之后是其兄弟小乙。小乙举行上做的相似,但比起真知灼见,他叫儿武丁行役于外。与国民一起干活,而详民苦。

控制字符:回车键、退格、换行键等。

聊乙死后,武丁继位,励精图治,立志匡扶社稷,任用傅说及甘盘等大能之口辅政。在武丁执政中,商朝政治、经济、军事、文化得到前所未有发展,开启了“武丁盛世”。武丁又受成为中兴之主。

只是显示字符:英文大小写字符、阿拉伯数字和西文符号

旋即无异盛世的缔造者是武丁和妇好。他们是两口子,他们吗是君臣。他们融合,治理国家,开疆扩土。

4.术特色

武丁有后妃六十差不多独,先后有三个王后,妇好是商的方国诸侯的女,嫁为武丁举行了外的率先各类皇后。从此开启了其传奇的一生一世。

7个(bits)表示一个字符,共128字符

武丁继位之后,妇好作为王后,管理后宫,服侍武丁,是武丁的老伴。

5.ASCII扩张字符集

乘势时间推移,妇好渐渐焦躁起来,她免喜这样的生,深居后宫,日复一日的重昨天的生存,无聊而无趣。她无思一直很在当时深宫里。

7各项编码的字符集只能支持128只字符,为了表示再多的欧洲经常因此字符对ASCII进行了扩大,ASCII扩展字符集使用8位(bits)表示一个字符,共256字符。

其以是方国诸侯之女,曾数次出动,而现在也为累死在深宫,她而倒出去。

ASCII扩展字符集比ASCII字符集扩充出的号包括表格符号、计算符号、希腊字母和特殊之拉丁符号。 

图片 2

GB2312 字符集

02

 1.称号的原由

辛巳卜,争贞:今者王共人呼妇好伐土方。
辛未卜,争贞:妇好其比沚瞂伐印方,王自东亳(薄)伐捍,陷于妇好立(位)。
贞洁:王令妇好于侯告伐尸方。
辛子卜,□贞:登妇好三千,登旅万,呼伐□。

GB2312又称为GB2312-80字符集,全称为《信息置换用汉字编码字符集·基本集》,由本中国国家标准总局发布,1981年5月1日施行。

高速,妇好之火候便来了,这年夏天,北方边境有外敌入侵,武丁派将领出征,结果双方僵持不下,谁为霸占不交便民,眼看战时拉开,士气低迷,供给消耗加大,武丁很焦急。

2.特点

妇好主动请缨,希望领兵出战,武丁开始有点犹豫,他明白妇好曾在方国领过兵,但现行友好之武将都久攻不下,派妇好去就算会实行也?

GB2312是炎黄国家标准的简体中文字符集。它所录取的方块字都蒙99.75%底运效率,基本满足了汉字的处理器处理需。在中华地与新加坡得到广泛利用。

生非了立志,就占有卜吧,占卜结果显示可以派妇好去,于是妇好领兵出战,像久经沙场的老将,指挥有过,身先士卒,从而充分收获全胜。

3.含有内容

武丁如得至宝,从此开始命妇好与否以领南征北战,征服土方、尸方、巴方、夷方等二十多只小国。为商王朝的开疆扩土立下了未世战功。

GB2312收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共
7445
个图形字符。其中囊括6763独字,其中一级汉字3755个,二级汉字3008单;包括拉丁字母、希腊字母、日文平假名及片假名字母、俄报西里尔字母在内的682独全角字符。 

随即有名的将领沚、侯告等还肯当那个麾下。

4.技巧特色

本着巴方作战中,妇好和武丁合力出击,妇好带领沚和军于巴方西面设下埋伏,断巴方军退路,武丁率领精锐部队自东对巴方展开袭击。两正在军队对巴方展开包围围绕,围歼了巴方。这是神州战争史上记载最为早的伏击战。

(1)分区表示:

“辛子卜,□贞:登妇好三千,登旅万,呼伐□。”

GB2312中对所竣工汉字进行了“分区”处理,每区含有94只字/符号。这种代表方法为称为区位码。

关于这同作战,因为甲骨文有破损,所以是有争辩,普遍认为,这是出于妇好为元帅,出兵一万三千誉为之针对羌方(内蒙、河套一带)的烟尘。

各区包含的字符如下:01-09区为特殊符号;16-55区为一级汉字,按拼音排序;56-87区为二级汉字,按部首/笔画排序;10-15区与88-94区则无闹编码。

马上是甲骨文中记载的出兵最多,影响极其深远的相同次战役。

(2)双字节表示

西北边境,包括古印欧人数在内的异族多次入侵商的领地,抢夺人口、财物,屡伐不止,是协商的一个心头大患,这同一潮妇好领命出征。取得最后获胜。赶走了外族,得到了土地。

鲜只字节中前的字节为率先字节约,后面的字节为次字节。习惯及如第一许节为“高字节”
,而称第二配节为“低字节”。

部族之大方进程之所以未曾面临外族的毁坏。要知与一代的社会风气上的外几独文明古国都受了入侵而终止了文明的重升华。这会战乱对殷商王朝乃至于整个神州历史,都有所伟大的划时代意义。

“高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。

图片 3

5.编码比喻

03

坐GB2312字符集的第一个字“啊”字也条例,它的区号16,位号01,则区位码是1601,在大部分处理器程序中,高字节和低字节分别加0xA0得到程序的汉字处理编码0xB0A1。计算公式是:0xB0=0xA0+16,
0xA1=0xA0+1。

乙卯卜,宾贞:乎(呼)妇好ㄓ(侑)服(俘)于妣癸。
丁巳卜,槱,妇好御于父乙。
贞洁:妇好有匚(报)于四妣,槱。
呼妇好有勺(礿)于父亲〔乙〕。
贞洁:勿乎妇好往燎。
甲戌卜,贞:妇好不向于妣庚。

BIG5 字符集

宏大战功的妇好不仅发生代表征伐大权的负用器钺,还有属于自己之封地。这在商朝以外的任何朝代都是唯一的。

1.称的案由

妇好在平叛了多只小国后,也有了属于自己的小国,因此它们并无常停在商朝嫔妃,她在温馨的领地里来自己之禁。因此其和武丁大部分时候是异地而居。

而如大五码或五大码,1984年是因为台湾财团法人信息工业策进会和五间软件商店宏碁
(Acer)、神通 (MiTAC)、佳佳、零壹 (Zero One)、大众
(FIC)创立,故称大五码。

它们保管好的领地,有协调之农奴和军队,听调出兵。按时缴纳赋税。

Big5码的发生,是因马上台湾不同厂商各自出不同之编码,如倚天码、IBM
PS55、王安码等,彼此不能够匹配;另一方面,台湾政府这没推出官方的汉字编码,而中华陆上的GB2312编码亦未生出收录繁体中文字。

“国的大事,在祀与军事。”

2.特点

妇好逐渐成为武丁统治集团的严重性成员,经常受命主持祭天、祭先祖、祭神泉等个祭典,又任占卜之官。

Big5字符集共录取13,053只中文字,该字符集在中国台湾使用。耐人寻味的凡拖欠字符集重复地引用了零星个一律的配:“兀”(0xA461和0xC94A)、“嗀”(0xDCD1及0xDDFC)。

以商代,人们迷信鬼神,崇尚天命,非常流行祭祀占卜,特别是商王室和奴隶主统治阶级,几乎拥有国家大事都使勤占卜、祈问鬼神。因此,祭祀是最为重大之国务活动之一。而妇好就是神职人员,最高祭司,是国大事之严重性官员。

3.字符编码方法

老公会召开的,妇好都能够开,并且做的比男人更好;而老公不可知举行的,妇好也举行的大好。

Big5码使用了双许节储存方法,以半只字节来编码一个配。第一只字节称为“高位字节”,第二独字节称为“低位字节”。高位字节的编码范围0xA1-0xF9,低位字节的编码范围0x40-0x7E及0xA1-0xFE。

其是武丁的枪杆子将领,方国诸侯,最高祭司,同时其吧是武丁的娘娘,一皇家之主,母仪天下。

各编码范围对应之字符类型如下:0xA140-0xA3BF为标点符号、希腊字母和特殊符号,另外于0xA259-0xA261,存放了双音节度量衡单位用字:兙兛兞兝兡兣嗧瓩糎;0xA440-0xC67E吧常用汉字,先照笔划再按照部首排序;0xC940-0xF9D5乎潮常因此汉字,亦凡先期随笔划再依部首排序。

武丁的后妃多出自治下之方国,都是地位尊重的人,成为武丁后妃后,也生局部生出温馨的领地,因此妇好经常召见后妃。

4.Big5 的局限性

为表统治阶级的意志,她若见面德高望重的老前辈,抓捕逃跑的奴隶罪犯。以解武丁的后顾之忧。

尽管Big5码内涵盖一万几近单字符,但是没设想社会及流通的全名、地名用配、方言用配、化学与生物科等之所以配,没有含日文平假名及片假名字母。

图片 4

例如台湾看来“着”为“著”的异体字,故并未选用“着”字。康熙字典中的有些部首用配(如“亠”、“疒”、“辵”、“癶”等)、常见的丁名用字(如“堃”、“煊”、“栢”、“喆”等)
也没用至Big5里。

04

GB18030 字符集

贞洁:惟唐取妇好?
己卯卜,宾贞:惟帝取妇好?

1.称号的原故

妇好身兼数职,精力旺盛,然而它们毕竟是单太太,身体飞吃不脱。

GB
18030的全称是GB18030-2000《信息置换用汉字编码字符集基本凑的恢弘》,是我国政府为2000年3月17日颁发的新的汉字编码国家标准,2001年8月31日晚当华夏市场上披露的软件要符合本专业

于呢武丁生育几单子女以后就是挺了。

2.特点

妇好不仅是武丁的活伴侣,也是他的事业伙伴,他拿她圈之不胜重复,在其生前,关心它底全,反复占卜她的毛病和生产情形。

GB
18030字符集标准的出名经过广大介入和论证,来自国内外著名信息技术行业之店堂,信息产业部和原国家质量技术监督局协同实施。

它的黑马长逝使武丁悲痛欲绝。他拿其下葬在大团结的宫殿旁边,以期日夜守护着它们。

GB
18030字符集标准解决汉字、日文假名、朝鲜语和华少数民族文字组成的大字符集计算机编码问题。该专业的字符总编码空间超过150万单编码位,收录了27484单字,覆盖中文、日文、朝鲜语和中华少数民族文字。满足中国陆上、香港、台湾、日本和韩国顶东亚地区信息交换多文种、大字量、多用、统一编码格式的求。并且和Unicode
3.0本兼容,填补Unicode扩展字符字汇“统一汉字扩展A”的始末。并且和以前的国度字符编码标准(GB2312,GB13000.1)兼容。

其的战神形象让其异常后,武丁数次祭祀她,让它保佑出征顺利,护佑大商。

3.编码方法

新生,武丁认为自己的力量不足以守护阴间的妇好。于是,他引领儿孙们吧妇好举行了累累冥婚,将它们底在天之灵先后许配给商王祖乙、太甲、成汤。让大多位先王守护妇好,也守护大商的国家。

GB
18030正经以单字节、双字节跟四字节老三种植方法对字符编码。单字节部分用0×00至0×7F码(对应于ASCII码的相应码)。双字节片,首字节码从0×81至0×FE,尾字节码位分别是0×40到0×7E和0×80到0×FE。四字节有的采用GB/T
11383勿运的0×30及0×39当针对双字节编码扩充的后缀,这样扩大的季字节编码,其范围吗0×81308130届0×FE39FE39。其中第一、三只字节编码码位均为0×81至0×FE,第二、四独字节编码码位均为0×30至0×39。

妇好的毕生多传奇:

4.含的情

其嫁为武丁,生儿育女;

双字节有些用内容要不外乎GB13000.1不折不扣CJK汉字20902单、有关标点符号、表意文字描述称13只、增补的方块字和部首/构件80独、双字节编码的欧元符号等。  四字节有些用了上述双字节字符之外的,包括CJK统一汉字扩充A在内的GB
13000.1丁的凡事字符。

它们贵呢上后,母仪天下;

Unicode字符集

它南征北战,戎马一生;

1.称的原由

其祝福占卜,决策国事;

Unicode字符集编码是Universal Multiple-Octet Coded Character Set
通用多八号编码字符集的简称,是出于一个叫作也 Unicode 学术学会(Unicode
Consortium)的单位制定的字符编码系统,支持现今世界各种不同语言的封皮文件的置换、处理和展示。该编码为1990年上马研发,1994年标准公布,最新版本是2005年3月31日之Unicode
4.1.0。

其保管领地,进贡纳税。

2.特征 

讽刺的是,她是中兴之主武丁的娘娘,历史古籍中也少她底记载,而妺喜、妲己跟了夏桀、帝辛却被御用文人谩骂千年。

Unicode是一律种于电脑及利用的字符编码。它吧每种语言中的每个字符设定了联以唯一的次上制编码,以满足超过语言、跨平台展开文本转换、处理的渴求。


3.编码方法

1976年当河南安阳小屯西北发现该总体墓葬,在现存的甲骨文献中,她底名频频面世,仅于安阳殷墟出土的1万余切开甲骨中,提和她底虽生200差不多不善。

Unicode
标准始终以十六进制数字,而且每当写时在前方加上前缀“U+”,例如字母“A”的编码为
004116 和字符“?”的编码为 20AC16。所以“A”的编码书写也“U+0041”。

当下员三千大抵年前之女神竟走上前我们的视野。

4.UTF-8 编码 

UTF-8凡是Unicode的中一个以方法。 UTF是 Unicode Translation
Format,即把Unicode转做某种格式的意思。

UTF-8便于不同的处理器之间下网络传输不同语言和编码的文字,使得双字节之Unicode能够以现存的拍卖单字节的网及科学传输。

UTF-8以可转移长字节来储存
Unicode字符,例如ASCII字母继续用1字节囤积,重音文字、希腊字母或西里尔字母等利用2字节来储存,而常用之汉字就要采取3字节。辅助平面字符则使用4字节。

5.UTF-16 和 UTF-32 编码 

UTF-32、UTF-16 和 UTF-8 是 Unicode
标准的编码字符集的字符编码方案,UTF-16 使用一个要有限个未分配的 16
位代码单元的队对 Unicode 代码点进行编码;UTF-32 即将每一个 Unicode
代码点表示为相同值的 32 位整数。

 

php 各种以乱码问题之缓解方法

1) 使用 标签设置页面编码

这标签的企图是声称客户端的浏览器用啊字符集编码显示该页面,xxx 可以啊
GB2312、GBK、UTF-8(和 MySQL 不同,MySQL 是
UTF8)等等。因此,大部分页面可以动用这种办法来报浏览器显示是页面的时刻用什么编码,这样才无会见促成编码错误而产生乱码。但是片时候咱们会意识发矣当下句还是很,不管
xxx 是啊一样种植,浏览器采用的一味犹是平等栽编码,这个情本身后会谈及。

请求小心, 是属于 HTML 信息之,仅仅是一个扬言,仅表明服务器已将 HTML
信息污染至了浏览器。

2) header(“content-type:text/html; charset=xxx”);

其一函数 header() 的意是将括号内的消息作到 http
标头。如果括号里的始末呢和遭遇所说那样,那作用与
标签基本相同,大家对待第一独看发现字符都多的。但是差之是要起应声段函数,浏览器就是会永远使你所求的
xxx
编码,绝对不见面不纵话,因此是函数是甚有因此的。为什么会这样呢?那就算得说说
http 标头和 HTML信息的区别了:

http 标头是服务器因为 http 协议传送 HTML 信息到浏览器前所送出的字串。而
标签是属于 HTML 信息之,所以 header() 发送的始末先到达浏览器,通俗点就是
header() 的预级高于 (不掌握但免可以如此说道)。假如一个 php
页面既出header(“content-type:text/html;charset=xxx”),又起,浏览器就是单单认前者
http 标头而无认 meta 了。当然是函数只能当 php 页面内用。

同等也养起一个题材,为什么前者就绝起作用,而后者有时候就异常啊?这就算是搭下去要提的Apache
的案由了。

3) AddDefaultCharset

Apache 根目录的 conf 文件夹里,有一切 Apache 的布局文档 httpd.conf。

故而文本编辑器打开 httpd.conf,第 708 行(不同版本可能两样)有
AddDefaultCharset
xxx,xxx为编码名称。这行代码的意思:设置总体服务器内之网页文件 http
标头里之字符集为你默认的 xxx字符集。有应声行,就一定给让每个文件还加以了一行
header(“content-type:text/html; charset=xxx”)。这生虽知晓为何明明
设置了凡 utf-8,可浏览器始终以 gb2312 的因。

设若网页里有 header(“content-type:text/html;
charset=xxx”),就管默认的字符集改也公设置的字符集,所以这个函数永远有因此。如果将
AddDefaultCharset xxx 前面加个”#”,注释掉这句,而且页面里不带有
header(“content-type…”),那是时段就是轮至 meta 标签由作用了。

下面列有上述之先顺序:

header(“content-type:text/html; charset=xxx”)

.. AddDefaultCharset xxx

..

而你是 web
程序员,建议给您的每个页面还加个header(“content-type:text/html;charset=xxx”),这样就足以确保她当旁服务器都能够是显示,可移植性也于强。

4) php.ini 中的 default_charset 配置:

php.ini 中的 default_charset = “gb2312” 定义了 php
的默认语言字符集。一般推荐注释掉此行,让浏览器根据网页头挨之 charset
来机关选择语言而不做一个强制性的确定,这样虽足以以同服务器上提供多种语言的网页服务。

,


相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图