Null结尾的多字节字符串

存储在字符串中的每个字符占用一个字节以上。用来表示多字节字符串中的字符编码是特定于语言环境的：它可能是UTF-8，GB18030，EUC-JP或SHIFT-JIS等等。例如，char数组{'\xe4','\xbd','\xa0','\xe5','\xa5','\xbd','\0'}是NTMBS，它以UTF-8多字节编码包含字符串"你好"：前三个字节编码了字符“你”，接下来的三个字节编码了字符“好”。以GB18030编码的相同字符串是char数组{'\xc4', '\xe3', '\xba', '\xc3', '\0'}，其中每两个字符被编码为双字节的序列。

在一些多字节编码中，任何给定的多字节字符序列都可能代表不同的字符，取决于前一个字节序列，被称为“移位序列”。这种编码被称为状态相关：当前的移位状态的知识需要用来解释每个字符。如果NTMBS的开始和结束都位于下列初始移位状态，那么它是有效的：如果使用了移位序列，相应的非移位序列应出现在Null字符之前。例如7位的JIS，BOCU-1和SCSU都属于这种编码。

。一个多字节字符串是布局兼容的空终止字节的字符串（非关税壁垒），可以存储，复制，并探讨了使用同样的设施，除了计算的字符数。如果是在正确的语言环境中，I / O功能，同时处理多字节字符串。多字节字符串可以被转换成宽字符串的std::codecvt成员函数，std::wstring_convert，或以下的语言环境相关的转换函数：。

在头文件 `<cstdlib>` 中定义
mblen	返回下一个多字节字符的字节数原文： returns the number of bytes in the next multibyte character 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]
mbtowc	将下一个多字节字符转换为宽字符原文： converts the next multibyte character to wide character 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]
wctomb	将宽字符转换为多字节字符形式原文： converts a wide character to its multibyte representation 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]
mbstowcs	将多字节字符串转换为宽字符串原文： converts a narrow multibyte character string to wide string 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]
wcstombs	将宽字符串转换为多字节字符串原文： converts a wide string to narrow multibyte character string 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]
在头文件 `<cwchar>` 中定义
mbsinit	检查mbstate_t对象是否代表初始移位状态原文： checks if the mbstate_t object represents initial shift state 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]
btowc	如果可能的话，将单字节字符扩展为宽字符原文： widens a single-byte narrow character to wide character, if possible 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]
wctob	如果可能的话，将宽字符缩小为单字节字符原文： narrows a wide character to a single-byte narrow character, if possible 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]
mbrlen	返回给定状态下的，下一个多字节字符的字节数原文： returns the number of bytes in the next multibyte character, given state 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]
mbrtowc	在给定的状态下，将下一个多字节字符转换为宽字符原文： converts the next multibyte character to wide character, given state 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]
wcrtomb	在给定的状态下，将宽字符转换为多字节字符形式原文： converts a wide character to its multibyte representation, given state 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]
mbsrtowcs	在给定的状态下，将多字节字符串转换为宽字符串原文： converts a narrow multibyte character string to wide string, given state 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]
wcsrtombs	在给定的状态下，将宽字符串转换为多字节字符串原文： converts a wide string to narrow multibyte character string, given state 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]
在头文件 `<cuchar>` 中定义
mbrtoc16 （C++11）	从多字节字符串生成下一个16位宽字符原文： generate the next 16-bit wide character from a narrow multibyte string 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]
c16rtomb （C++11）	将16位宽字符转换为多字节字符串原文： convert a 16-bit wide character to narrow multibyte string 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]
mbrtoc32 （C++11）	从多字节字符串生成下一个32位宽字符原文： generate the next 32-bit wide character from a narrow multibyte string 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]
c32rtomb （C++11）	将32位宽字符转换为多字节字符串原文： convert a 32-bit wide character to narrow multibyte string 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (函数) [edit]

[编辑] 类型

在头文件 `<cwchar>` 中定义
mbstate_t	迭代多字节字符串所需的转换状态信息原文： conversion state information necessary to iterate multibyte character strings 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (类) [edit]

[编辑] 宏

在头文件 `<climits>` 中定义
MB_LEN_MAX	多字节字符的最大字节数原文： maximum number of bytes in a multibyte character 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (常量宏) [edit]
在头文件 `<cstdlib>` 中定义
MB_CUR_MAX	在当前的Clocale (宏变量)多字节字符的最大字节数原文： maximum number of bytes in a multibyte character in the current C locale (宏变量) 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 [edit]
在头文件 `<cuchar>` 中定义
__STDC_UTF_16__	表示mbrtoc16和c16rtomb使用UTF-16编码。原文： indicates that UTF-16 encoding is used by mbrtoc16 and c16rtomb 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (常量宏)
__STDC_UTF_32__	表示mbrtoc32和c32rtomb使用UTF-32编码。原文： indicates that UTF-32 encoding is used by mbrtoc32 and c32rtomb 这段文字是通过 Google Translate 自动翻译生成的。您可以帮助我们检查、纠正翻译中的错误。详情请点击这里。 (常量宏)

[编辑] 另见

C语言文档 for Null-terminated multibyte strings

来自“http://zh.cppreference.com/mwiki/index.php?title=cpp/string/multibyte&oldid=39343”

语言
概念
实用工具库
字符串库
容器库
算法库
迭代器库
数值算法库
输入/输出库
本地化库
正则表达式库（C++11）
原子操作库（C++11）
线程的支持库（C++11）

cppreference.com

搜索

名字空间

变换

查看

操作

Null结尾的多字节字符串

目录

[编辑] 多字节/宽字符转换

[编辑] 类型

[编辑] 宏

[编辑] 另见

导航

工具箱