向's profileWXPhotosBlogListsMore Tools Help

Blog


    June 02

    windows环境下Unicode编程总结

    Windows环境下Unicode编程总结

    UNICODE环境设置

    在安装Visual Studio时,在选择VC++时需要加入unicode选项,保证相关的库文件可以拷贝到system32下。

     

    UNICODE编译设置:

    C/C++, Preprocessor difinitions 去除_MBCS,加_UNICODE,UNICODE

    ProjectSetting/link/output 中设置EntrywWinMainCRTStartup

    反之为MBCSANSI)编译。

     

    Unicode :宽字节字符集

     1. 如何取得一个既包含单字节字符又包含双字节字符的字符串的字符个数?

    可以调用Microsoft Visual C++的运行期库包含函数_mbslen来操作多字节(既包括单字节也包括双字节)字符串。

    调用strlen函数,无法真正了解字符串中究竟有多少字符,它只能告诉你到达结尾的0之前有多少个字节。

     2. 如何对DBCS(双字节字符集)字符串进行操作?

    函数 描述

    PTSTR CharNext LPCTSTR ; 返回字符串中下一个字符的地址

    PTSTR CharPrev LPCTSTR, LPCTSTR ); 返回字符串中上一个字符的地址

    BOOL IsDBCSLeadByte( BYTE ) 如果该字节是DBCS字符的第一个字节,则返回非0

     

    3. 为什幺要使用Unicode

    1 可以很容易地在不同语言之间进行数据交换。

    2 使你能够分配支持所有语言的单个二进制.exe文件或DLL文件。

    3 提高应用程序的运行效率。

    Windows 2000是使用Unicode从头进行开发的,如果调用任何一个Windows函数并给它传递一个ANSI字符串,那幺系统首先要将字符串转换成Unicode,然后将Unicode字符串传递给操作系统。如果希望函数返回ANSI字符串,系统就会首先将Unicode字符串转换成ANSI字符串,然后将结果返回给你的应用程序。进行这些字符串的转换需要占用系统的时间和内存。通过从头开始用Unicode来开发应用程序,就能够使你的应用程序更加有效地运行。

    Windows CE 本身就是使用Unicode的一种操作系统,完全不支持ANSI Windows函数

    Windows 98 只支持ANSI,只能为ANSI开发应用程序。

    Microsoft公司将COM16Windows转换成Win32时,公司决定需要字符串的所有COM接口方法都只能接受Unicode字符串。

     

    4. 如何编写Unicode源代码?

    Microsoft公司为Unicode设计了WindowsAPI,这样,可以尽量减少代码的影响。实际上,可以编写单个源代码文件,以便使用或者不使用Unicode来对它进行编译。只需要定义两个宏(UNICODE_UNICODE),就可以修改然后重新编译该源文件。

    _UNICODE宏用于C运行期头文件,而UNICODE宏则用于Windows头文件。当编译源代码模块时,通常必须同时定义这两个宏。

     

    5. Windows定义的Unicode数据类型有哪些?

    数据类型 说明

    WCHAR Unicode字符

    PWSTR 指向Unicode字符串的指针

    PCWSTR 指向一个恒定的Unicode字符串的指针

    对应的ANSI数据类型为CHARLPSTRLPCSTR

    ANSI/Unicode通用数据类型为TCHARPTSTR,LPCTSTR

     

    6. 如何对Unicode进行操作?

    字符集 特性 实例

    ANSI 操作函数以str开头 strcpy

    Unicode 操作函数以wcs开头 wcscpy

    MBCS 操作函数以_mbs开头 _mbscpy

    ANSI/Unicode 操作函数以_tcs开头 _tcscpyC运行期库)

    ANSI/Unicode 操作函数以lstr开头 lstrcpyWindows函数)

    所有新的和未过时的函数在Windows2000中都同时拥有ANSIUnicode两个版本。ANSI版本函数结尾以A表示;Unicode版本函数结尾以W表示。Windows会如下定义:

    #ifdef UNICODE

    #define CreateWindowEx CreateWindowExW

    #else

    #define CreateWindowEx CreateWindowExA

    #endif // !UNICODE

     

    7. 如何表示Unicode字符串常量?

    字符集 实例

    ANSI “string”

    Unicode L“string”

    ANSI/Unicode T(string)_TEXT(string)if( szError[0] == _TEXT(J) ){ }

     

    8. 为什幺应当尽量使用操作系统函数?

    这将有助于稍稍提高应用程序的运行性能,因为操作系统字符串函数常常被大型应用程序比如操作系统的外壳进程Explorer.exe所使用。由于这些函数使用得很多,因此,在应用程序运行时,它们可能已经被装入RAM

    如:StrCatStrChrStrCmpStrCpy等。

     

    9. 如何编写符合ANSIUnicode的应用程序?

    1 将文本串视为字符数组,而不是chars数组或字节数组。

    2 将通用数据类型(如TCHARPTSTR)用于文本字符和字符串。

    3 将显式数据类型(如BYTEPBYTE)用于字节、字节指针和数据缓存。

    4 TEXT宏用于原义字符和字符串。

    5 执行全局性替换(例如用PTSTR替换PSTR)。

    6 修改字符串运算问题。例如函数通常希望在字符中传递一个缓存的大小,而不是字节。这意味着不应该传递sizeof(szBuffer),而应该传递(sizeof(szBuffer)/sizeof(TCHAR)。另外,如果需要为字符串分配一个内存块,并且拥有该字符串中的字符数目,那幺请记住要按字节来分配内存。这就是说,应该调用

    malloc(nCharacters *sizeof(TCHAR)),而不是调用malloc(nCharacters)