没有合适的资源?快使用搜索试试~ 我知道了~
各种字符编码间的转换方法:MultiByteToWideChar和MultiByteToWideChar.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 163 浏览量
2022-07-03
11:38:01
上传
评论
收藏 135KB DOCX 举报
温馨提示
试读
20页
。。。
资源推荐
资源详情
资源评论
MultiByteToWideChar和 MultiByteToWideChar对各种字
int WideCharToMultiByte(
UINT CodePage,
DWORD dwFlags,
LPCWSTR lpWideCharStr,
int cchWideChar,
LPSTR lpMultiByteStr,
int cbMultiByte,
LPCSTR lpDefaultChar,
LPBOOL lpUsedDefaultChar
);
此函数把宽字符串转换成指定的新的字符串,如 ANSI,UTF8 等,新字符串
不必是多字节字符集。参数:
CodePage: 指定要转换成的字符集代码页,它可以是任何已经安装的或系统
自带的字符集,你也可以使用如下所示代码页之一。
参数说明:
1、CodePage——指定要转换成的字符集代码页,它可以是任何已经安装的或
系统自带的字符集,可选择以下代码页:
CP_ACP //当前系统 ANSI 代码页
CP_MACCP //当前系统 Macintosh 代码页
CP_OEMCP //当前系统 OEM代码页,一种原始设备制造商硬件扫描码
CP_SYMBOL //Symbol 代码页,用于 Windows 2000 及以后版本
CP_THREAD_ACP //当前线程 ANSI 代码页,用于 Windows 2000 及以
后版本
CP_UTF7 //UTF-7,设置此值时 lpDefaultChar 和 lpUsedDefaultChar 都
必须为 NULL
CP_UTF8 //UTF-8,设置此值时 lpDefaultChar 和 lpUsedDefaultChar 都
必须为 NULL
用 GetLocaleInfo 函数获取当前系统的代码页,936: 简体中文, 950: 繁
体中文,949:韩文
2、dwFlags—— 一般用 0 就可以了
指定是否转换成预制字符或合成的宽字符,对控制字符是否使用像形文
字,以及怎样处理无效字符:
MB_PRECOMPOSED //总是使用预制字符,即有单个预制字符时,就不
会使用分解的基字符和不占空间字符。此为函数的默认选项,不能和
MB_COMPOSITE 合用 MB_COMPOSITE //总是使用分解字符,即总是使用基
字符+不占空间字符的方式
MB_ERR_INVALID_CHARS //设置此选项,函数遇到非法字符就失败并返回错
误码
4、cbMultiByte //要转换字符串的长度,-1 表示转换到字符串结尾。返回原字符
串长度。0 作为结束符的字符串
5、lpWideCharStr//接收转换后输出的宽字符串的缓冲,如果为 NULL, 就是代
表计算生成的字符串的长度。
6、cchWideChar//输出缓冲区大小,转化生成的 unicode 字符串缓存的容量。
如果为 0,lpMultiByteStr 将被忽略,函数将返回所需缓冲区大小而不同
为 0 表示调用失败;当 cchWideChar 为 0 时,函数将返回所需缓冲区大小
int BufSize = MultiByteToWideChar(936,0,s,-1,NULL,0); //计算简体中文字符串
s 转成 widestring 之后占用的内存字节数…… //在此处为 wsbuf 分配内存
BufSize 个字节
MultiByteToWideChar(936,0,s,-1,wsbuf,BufSize); //把简体中文字符串 s 转化
为 unicode 的 WideString
最常用的应该是 CP_ACP 和 CP_UTF8 了,前者将宽字符转换为 ANSI,后者转
换为 UTF8。
例一:Unicode 转换到 GBK
#include <Windows.h>
#define CODE_PAGE_GB18030 54936
int Unicode2GBK( wchar_t *pUnicode, char** ppDest)
{ // get the size of the dest string
const int size = ::WideCharToMultiByte( CODE_PAGE_GB18030, 0/* you can
do more for it*/,
pUnicode, -1, 0, 0, 0, 0 );
if ( size == 0 ) { return -1; }
int ret = ::WideCharToMultiByte( CODE_PAGE_GB18030, 0, pUnicode, -1,
pDestString, size, 0, 0 );
if( ret == 0 ) { delete pDestString; return -1; }
else { *ppDest = pDestString; return 0; } }
例二:字串转换
char* pszMultiByte;
iSize = WideCharToMultiByte(CP_ACP, 0, pwszUnicode, -1, NULL, 0, NULL,
NULL);
pszMultiByte = (char*)malloc((iSize+1)/**sizeof(char)*/);
WideCharToMultiByte(CP_ACP, 0, pwszUnicode, -1, pszMultiByte, iSize,
NULL, NULL);
dwFlags: 指定如何处理没有转换的字符, 但不设此参数函数会运行的更快一
些,我都是把它设为 0。 可设的值如下表所示:
WC_NO_BEST_FIT_CHARS 把不能直接转换成相应多字节字符的 Unicode 字
符转换成 lpDefaultChar 指定的默认字符。也就是说,如果把Unicode 转换成多
字节字符,然后再转换回来,你并不一定得到相同的 Unicode 字符,因为这期
间可能使用了默认字符。此选项可以单独使用,也可以和其他选项一起使用。
WC_COMPOSITECHECK 把合成字符转换成预制的字符。它可以与后三个选
项中的任何一个组合使用,如果没有与他们中的任何一个组合,则与选项
WC_SEPCHARS 相同。
WC_ERR_INVALID_CHARS 此选项会致使函数遇到无效字符时失败返回,并
且 GetLastError 会返回错误码 ERROR_NO_UNICODE_TRANSLATION。否则
函数会自动丢弃非法字符。此选项只能用于 UTF8。
WC_SEPCHARS 转换时产生单独的字符,此是默认转换选项,与
WC_COMPOSITECHECK 一起使用
WC_DEFAULTCHAR 转换时使用默认字符代替例外的字符,(最常见的
如’?,’与) WC_COMPOSITECHECK 一起使用。
当指定 WC_COMPOSITECHECK 时,函数会将合成字符转换成预制字符。
合成字符由一个基字符和一个不占空间的字符(如欧洲国家及汉语拼音的音标)
组成,每一个都有不同的字符值。预制字符有一个用于表示基字符和不占空间字
符的合成体的单一的字符值。
当指定 WC_COMPOSITECHECK 选项时,也可以使用上表列出的最后 3 个
选项来定制预制字符的转换规则。这些选项决定了函数在遇到宽字符串的合成字
符没有对应的预制字符时的行为,他们与WC_COMPOSITECHECK 一起使用,
如果都没有指定,函数默认 WC_SEPCHARS。
对于 UTF8,dwFlags 必须为 0 或 WC_ERR_INVALID_CHARS,否则函数
都将失败返回并设置错误码 ERROR_INVALID_FLAGS,你可以调用
GetLastError 获得。
lpUsedDefaultChar:开关变量的指针,用以表明是否使用过默认字符。对于要
求此参数为 NULL 的 dwFlags
ERROR_INVALID_PARAMETER。lpDefaultChar 和 lpUsedDefaultChar 都设
剩余19页未读,继续阅读
资源评论
G11176593
- 粉丝: 6643
- 资源: 3万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功