犬者
“说了你又不听,听又不懂,懂又不做,做又做错,错又不认,认又不改,改又不服,不服也不说,那叫我怎么办?!”

【电脑】一个奇迹

烦了我一天,让我无比抓狂的类型转换终于搞定了…

真的很开心……这个问题偶问了QM……他都没有看出使用

pass = md5.ComputeHash(data)
temp = System.Text.Encoding.UTF8.GetString(pass)
word = System.Text.Encoding.UTF8.GetBytes(temp)

的问题在哪里……

似乎大家都把UTF8跟unicode看成是一个东西了……他只是告诉俺用UTF8.GetString一定会有问题……“utf8遇到一个大于128的byte之后,就当作是unicode的三个byte的第一个

然后,偶就尝试着把UTF8.GetString换成Unicode.GetString……然后,问题就解决了……兴奋了好久好久……

难道UTF-8的编码有问题么?我一直认为UTF-8就是unicode……至少,在VS.Net里面创建一个web project,默认的编码就是UTF-8……博客风已开始用的也是UTF-8的……后来偶考虑到博客风将会面向中国学生,所以,才把编码换成了GB2312……

突然之间,觉得unicode的出现是一个奇迹……或者说,神迹……

unicode是在电脑上面使用的字符编码,必须是由计算机专家去实现具体的编码设计……但是,哪个计算机学家可以了解各种语言的字符特点?哪个、或者哪批计算学家可以根据世界上所有实际上存在的语言设计出一套方案来表示全世界的语言??必须有语言学家参与在内……而且不是一个,而是很多很多……unicode所包含的是世界上所有实际存在的语言字符……没有一个语言学家可以精通所有的语言……很想知道语言专家们与电脑专家用的是什么“语言”沟通的……怎么一个习惯英文的computer architect了解到中文、甚至孟加拉语, 旁遮普语果鲁穆奇字符(Gurmukhi)等字符的规律、设计出一套完美的解决方案?

事实上,在DOS时代,在电脑上使用中文都是很大的问题……各种各样的中文平台都尝试着去解决这个问题……最早的CCDOS是严援朝一个人用debug(现在学电脑的孩子,还有谁知道debug这个DOS下面历史悠久的工具?)写出来的……CCDOS其实到了90年代后期,我开始用电脑的时候,已经被淘汰了……流行的是鲍岳桥的UCDOS……无比怀念UCDOS……事实上,经历过DOS的中国人都会对UCDOS有着深厚的情结,记得到了windows 98流行的年代(其实,现在还是windows 98流行的年代,在国内买兼容机,倘若不跟商家特别讲明要装windows XP,汕头的商家一定会给你装上windows 98……因为windows 98可以用ghost,装起来快……因为98对硬件要求没有XP敏感,质量稍微有问题的机器也可以跑98……),还有网友弄出UCDOS的精简怀念版什么的……UCDOS 7.33成了DOS下中文平台的绝响……因为,到了windows时代,微软推出了中文版的windows,中文版windows的“DOS”自动支持中文……不过windows 3.1在进行汉化的时候,也是经过粉长的过程……经过了微软与中国政府长久的协商(确切的说是谈判)才搞出来的……而大陆有GB的编码,台湾有GIB5编码……两者毫不兼容……看不出大陆跟台湾在这方面有任何合作的可能……台湾到现在还是不接受汉字拼音……除了传统的注音符号,记得前段时间还要搞另一套拼音方案出来,誓要跟大陆干到底……

unicode不仅仅是电脑专家与语言学者这些在象牙塔里面的人可以捣鼓出来的……还需要国际组织、各国政府的密切配合……光汉字进入电脑就经历了漫长的历程……

在我看来unicode的出现,纯粹就是一个奇迹……不……一个神迹……

古巴比伦的巴别塔触怒了上帝之后,人类的语言就混乱了。
——《圣经·旧约》-《创世纪》第11章1-9节

现在终究出现了unicode……从某种一样上说,unicode已经把人类所有的语言都统一起来了……

是上帝宽恕了人类么?

unicode又是否是人类建造另一座巴别塔,承受天谴的开端?

562
问天 @2/2/2004 3:34:28 AM
View blogs in this category:电脑


amadeo 在 2/2/2004 4:30:43 AM 说:

some characters in GB.18030 is not currently in unicode, and others although included are not very well reflected (some similar characters are two characters in 18030, but only 1 in unicode). of course, this is rarely a problem because unicode fully encompass the GBK.
Wuvist 在 2/2/2004 3:59:16 AM 说:

UTF-8 and Unicode FAQ: http://www.linuxforum.net/books/UTF-8-Unicode.html
零度冰吻 在 2/2/2004 3:48:14 AM 说:

不是神迹……那是历史的必然……历史是需要英雄和奠基者的……大哥你也想吗

Please leave your comment here

 
  名字:
  主页:
  内容:
 

   


Navigation
Blogwind
犬者首页
Contact


个人档案


“说了你又不听,听又不懂,懂又不做,做又做错,错又不认,认又不改,改又不服,不服也不说,那叫我怎么办?!”



Categories
死结(27)
电脑(174)
心情(177)
天影(25)
乱弹(207)
博客(80)
音乐(18)
饕餮(30)
读书(19)
电影(28)
网摘(5)
希望(35)
汕头(10)
经济(5)
苹果(19)
跋涉(4)



Archive
2008年9月
2008年8月
2008年7月
2008年6月
2008年5月
2008年4月
2008年3月
2008年2月
2008年1月
2007年12月
2007年11月
2007年10月
2007年9月
2007年8月
2007年7月
2007年6月
2007年5月
2007年4月
2007年3月
2007年2月
2007年1月
2006年12月
2006年11月
2006年10月
2006年9月
2006年8月
2006年7月
2006年6月
2006年5月
2006年4月
2006年3月
2006年2月
2006年1月
2005年12月
2005年11月
2005年10月
2005年9月
2005年8月
2005年7月
2005年6月
2005年5月
2005年4月
2005年3月
2005年2月
2005年1月
2004年12月
2004年11月
2004年10月
2004年9月
2004年8月
2004年7月
2004年6月
2004年5月
2004年4月
2004年3月
2004年2月
2004年1月
2003年12月



My Links
5G
bloglines
时尚摄影师奇科的博客
我们的漫画
颜如玉
最爱卫斯理

RSS 2.0

Username:
Password:
 Remember me