c语言us16 t,使用C ++将越南语字符编码为USASCII,ISO88591,UTF8,UTF16BE,UTF16LE,UTF16(示例代码)...

我已经编辑了我的帖子。当前,我正在尝试对用户的输入字符串进行编码,然后将其转换为每种编码格式。我可以使用Unicode完美地做到这一点,而且我认为输入String的格式为UTF-8。如果我的inputString是“ Hello”。但是,当我尝试输入“Tôi”之类的字符串时,我不知道该怎么做。enum Encodings { USASCII, ISO88591, UTF8, UTF16BE, UTF16LE, UTF16, BIN, OCT, HEX };

switch (Encodings)

{

case USASCII:

ASCIIToHex(inputString, &ascii); //hello output 48656C6C6F

return new ByteField(ascii.c_str());

case ISO88591:

ASCIIToHex(inputString, &ascii);//hello output 48656C6C6F

//tôi output 54F469

return new ByteField(ascii.c_str());

case UTF8:

ASCIIToHex(inputString, &ascii);//hello output 48656C6C6F

//tôi output 54C3B469

return new ByteField(ascii.c_str());

case UTF16BE:

ToUTF16(inputString, &ascii, Encodings);//hello output 00480065006C006C006F

//tôi output 005400F40069

return new ByteField(ascii.c_str());

case UTF16:

ToUTF16(inputString, &ascii, Encodings);//hello output FEFF00480065006C006C006F

//tôi output FEFF005400F40069

return new ByteField(ascii.c_str());

case UTF16LE:

ToUTF16(inputString, &ascii, Encodings);//hello output 480065006C006C006F00

//tôi output 5400F4006900

return new ByteField(ascii.c_str());

}

void StringUtilLib::ASCIIToHex(std::string s, std::string * result)

{

int n = s.length();

for (int i = 0; i < n; i++)

{

unsigned char c = s[i];

long val = long(c);

std::string bin = "";

while (val > 0)

{

(val % 2) ? bin.push_back('1') :

bin.push_back('0');

val /= 2;

}

reverse(bin.begin(), bin.end());

result->append(ConvertBinToHex(bin));

}

}

std::string ToUTF16(std::string s, std::string * result, int encodings) {

int n = s.length();

if (encodings == UTF16) {

result->append("FEFF");

}

for (int i = 0; i < n; i++)

{

int val = int(s[i]);

std::string bin = "";

while (val > 0)

{

(val % 2) ? bin.push_back('1') :

bin.push_back('0');

val /= 2;

}

reverse(bin.begin(), bin.end());

if (encodings == UTF16 || encodings == UTF16BE) {

result->append("00" + ConvertBinToHex(bin));

}

if (encodings == UTF16LE) {

result->append(ConvertBinToHex(bin) + "00");

}

}

}

std::string ConvertBinToHex(std::string str) {

long long temp = atoll(str.c_str());

int dec_value = 0;

int base = 1;

int i = 0;

while (temp) {

int last_digit = temp % 10;

temp = temp / 10;

dec_value += last_digit * base;

base = base * 2;

}

char hexaDeciNum[10];

while (dec_value != 0)

{

int temp = 0;

temp = dec_value % 16;

if (temp < 10)

{

hexaDeciNum[i] = temp + 48;

i++;

}

else

{

hexaDeciNum[i] = temp + 55;

i++;

}

dec_value = dec_value / 16;

}

str.clear();

for (int j = i - 1; j >= 0; j--) {

str = str + hexaDeciNum[j];

}

return str;

}

答案

-64是À的正确表示形式,如果您使用带符号的char和CP1258。如果需要正数,则需要先强制转换为unsigned char。

如果确实使用CP1258,则可能在Windows上。要将输入字符串转换为UTF-16,您可能要使用Windows平台API,例如MultiByteToWideChar,它接受代码页参数(当然,您必须使用正确的代码页)。另外,您可以尝试使用MultiByteToWideChar之类的标准功能,但在使用之前必须正确设置语言环境。

您可能会发现在整个应用程序中更容易切换到宽字符,并且避免大多数转码。

作为旁注,仅将整数转换为二进制以将其转换为十六进制不是显示整数的十六进制表示的简单有效的方法。

另一答案

这个问题还不清楚。要编码某些东西,您需要输入吗?因此,当您说“将越南字符编码为UTF8,UTF16”] >>转换为UTF-8 / 16之前,您的输入字符串是什么,编码是什么?您如何输入?从文件还是控制台?

为什么在地球上先转换为二进制然后转换为十六进制?您可以从字节直接打印为二进制和十六进制,而无需从二进制转换为十六进制。请注意,将其转换为二进制代码对于测试是很好的,但是在生产代码中效率非常低下。我也不知道您的意思是“但是如果我的字母是越南语字母的”Á“或”À“,我将无法获得它的价值”。请显示mbstowcs以及输入/输出

但是我想您只想从源代码中的字符串文字(例如“ÁÀ”)输出UTF编码的字节。在那种情况下,它不被称为“编码字符串”,而仅仅是“输出字符串”

Unicode中的mbstowcs和minimal, reproducible example都可以用Á(U + 00C1和U + 00C0)或À(A + U + 0301 ◌́ / U + 0300 represented)表示。您可以通过在Unikey中选择“ Unicode语法”或“ Unicode语法”在它们之间切换。假设您具有字符串文字形式的那些字符,然后precomposed characters包含一系列与源文件编码中的上述字母相对应的字节。因此,根据将* .cpp文件另存为(CP1252,CP1258,UTF-8 ...)的编码,输出字节值将有所不同

要强制执行UTF-8 / 16/32编码,只需分别使用combining characters,std::string str = "ÁÀ"和u8后缀以及正确的类型(u,U,char8_t或char16_t /char32_t/ std::u8string)std::u16string

然后只需使用std::u32string获取基础缓冲区并打印字节。在C ++ 14中std::u8string utf8 = u8"ÁÀ";

std::u16string utf16 = u"ÁÀ";

std::u32string utf32 = U"ÁÀ";尚不可用,因此只需将文件另存为UTF-8并使用c_str()。同样,您可以直接从std::u8string读取std::string以打印用户输入字符串的编码

编辑:

要在UTF编码之间进行转换,请使用标准的std::u*string,std::cin,std::codecvt ...

处理非Unicode编码比较棘手,需要一些外部库,例如std::codecvt或与操作系统有关的API在Windows上为[std::wstring_convert和std::wstring_convert]

仅限于ISO-8859-1,它很容易,但是您仍然需要许多查找表,并且没有办法在不丢失信息的情况下将其他编码转换为ASCII

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/469896.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux一些基础知识

linux面试题及答案 一&#xff0e;填空题&#xff1a; 1. 在Linux系统中&#xff0c;以 文件 方式访问设备 。 2. Linux内核引导时&#xff0c;从文件 /etc/fstab 中读取要加载的文件系统。 3. Linux文件系统中每个文件用 i节点来标识。 4. 全部磁盘块由四个部分组成&#xff…

这本轻小说真厉害 2016

傲娇御坂美琴成轻小说女王一姐 轻小说排名公布 到了年底,作为轻小说的粉丝就没有理由不关注“这本轻小说真厉害!”的相关评选吧?腾讯动漫此前曾经报道过《OVERLORD》以及《龙王的工作》获得榜首殊荣的消息。而近日,年度的最佳作品、最佳角色以及最佳插画师等奖项也已经公布,快…

IDEA初次使用Tomcat运行项目(如何添加加载项目到Tomcat)

IDEA中Tomcat设置说明 Tomcat最好使用干净的版本 不同的版本适配不同的JDK 设置Tomcat基本信息 加载项目&#xff08;war和war exploed模式简单说明&#xff09; 配置完项目后警告消失 应用后启动 选择相应的模式即可

回溯算法背包问题迭代c语言,回溯法解决0_1背包问题(迭代和递归)

问题&#xff1a;0/1背包问题例子:weight数组代表物品重量&#xff0c;value数组代表物品价值&#xff0c;M代表背包容量。背包是按单位价值递减的顺序排列的&#xff0c;即value[i]/weight[i]>value[i-1]/weight[i-1].const int weight[Max]{1,11,21,23,33,43,45,55};const…

ISE应用入门的一些问题

1、怎样添加IP 2、怎样用modelsim调用IP生成的仿真文件。 今天用modelsim仿真ISE生成的DDR IP IP核的地址&#xff1a;E:\FPGA\MIS607\Mis607B\update\CH09_DDR_TEST\MiS607B_DDR3_Test\DDR3_Test\ipcore_dir\mig_ddr3_control\example_design\sim\functional 所以要把modelsim…

linux模块加载和模块卸载时出现的问题

在编写驱动程序的时候有时候会出现这种情况&#xff0c;模块加载之后不能卸载或卸载之后不能在加载&#xff0c;cat /proc/devices 后发现设备还占用着设备号&#xff0c;这种情况下&#xff0c;再次加载驱动模块肯定不会成功&#xff0c;必须重新启动才可以解决。最近仔细看书…

IDEA中中文乱码问题解决方案

1.修改idea安装目录下的两个文件 C:\Program Files\JetBrains\IntelliJ IDEA 2017.1.4\bin\idea.exe.vmoptions C:\Program Files\JetBrains\IntelliJ IDEA 2017.1.4\bin\idea64.exe.vmoptions 在这两个文件下增加一行: -Dfile.encodingUTF-8 2.做此修改后,tomcat运行日志会…

linux 6.2 期末考试题,redhat6.2-linux考试试卷(带部分答案)

这个是初学redhat6.2的考试内容,带答案(实做的,水平有限,不完整答案)--------------------------------------------------------------------------------------------装 订 线-----------------------------------------------------------------------------------------广东…

ios几个重要方法

加载类到内存&#xff0c;程序刚启动的时候调用&#xff0c;调用在main函数之前 1.(void)load{} 初始化类&#xff0c;类第一次使用的时候调用一次 2.(void)initialize{ } 控制器的视图架构&#xff0c;设置控制器的根view&#xff0c;重写该方法后&#xff0c;以该方法为主&am…

C++中extern “C”含义深层探索

1.引言 C语言的创建初衷是“a better C”&#xff0c;但是这并不意味着C中类似C语言的全局变量和函数所采用的编译和连接方式与C语言完全相同。作为一种欲与C兼容的语言&#xff0c;C保留了一部分过程式语言的特点&#xff08;被世人称为“不彻底地面向对象”&#xff09;&…

video4linux 安装,【精品博文】Video4linux 下视频编程的流程

最近一直在忙基金申报&#xff0c;今天终于顺利提交了&#xff0c;剩下的就看缘分啦。今天有时间写写Video4linux 下视频编程的流程。Video4linux(简称 V4L),是linux 中关于视频设备的内核驱动。现在已有Video4linux2&#xff0c;还未加入linux 内核&#xff0c;使用的时候要自…

TVP5150真正的驱动起来了

几个注意的地方&#xff1a; 1、驱动TVP5150所需要的是IIC来驱动、IIC的时序一定要搞清楚、还有IIC的读写时序、 刚开始的时候并尝试从里面读寄存器、没有成功、可能有些寄存器不能读、2、硬件一定要检查清楚&#xff0c;TVP5150用到的电源有3.3V 1.8V、用电压表测量好、3、检查…

intellij IDEA--- 报inspects a maven model for resolution problems

解决方法是&#xff1a; 第一种&#xff1a; 找到pom.xml 右击 --> Maven --> reImport 第二种方法&#xff1a; 第三种 <properties><junit.version>4.11</junit.version><spring.version>4.3.14.RELEASE</spring.version></prop…

spring AOP自定义注解方式实现日志管理

转&#xff1a;spring AOP自定义注解方式实现日志管理 今天继续实现AOP&#xff0c;到这里我个人认为是最灵活&#xff0c;可扩展的方式了&#xff0c;就拿日志管理来说&#xff0c;用Spring AOP 自定义注解形式实现日志管理。废话不多说&#xff0c;直接开始&#xff01;&…

GPG96244QS1屏驱动难题

void Gpg_Master(unsigned int Data) {unsigned int temp 0b1000000000000000;Master_SCK1;ENABLE_244QS1();//初始化前使能片选_delay(10);DISABLE_244QS1();Master_SCK0; //Generate SCK Clockdo{Master_SDI Data &temp;Master_SCK1; _delay(10); Master_SCK0; //Gener…

ERROR 2384 — [ main] o.s.boot.SpringApplication : Application run failed

springboot数据库建表运行后报错&#xff1a; ERROR 2384 — [ main] o.s.boot.SpringApplication : Application run failed org.springframework.beans.factory.BeanCreationException: Error creating bean with name ‘entityManagerFactory’ defined in class path res…

linux装机量,在没有盗版的世界 Linux桌面的装机量可能占比达到40%

近日&#xff0c;由奥斯陆大学经济学系博士生Arne Rogde Gramstad公布的“Software Piracy and Linux Adoption”研究报告&#xff0c;发现了Linux系统装机量和软件盗版之间的潜在关联。在这份报告中引用了商业软件联盟(BSA)自2012年以来从104 个国家收集的盗版软件信息&#x…

初识Paramiko

简介&#xff1a; paramiko是用python语言写的一个模块&#xff0c;遵循SSH2协议&#xff0c;支持以加密和认证的方式&#xff0c;进行远程服务器的连接。跟常用软件xshell 、xftp功能一样&#xff0c;但是可以连接多台服务器&#xff0c;进行复杂的操作。 安装 &#xff1a; p…

gpg96244qs1屏驱动起来了

驱动屏需要注意的地方&#xff1a; 1、首先一定要保证通信、当然电路图什么的肯定是确保是好的1.1 这个屏用的是SPI通信、验证通信的方法是读寄存器里面的一个默认值&#xff0c;如果读出来的是原来的默认值的话&#xff0c;就说明是正确的、用示波器看SPI线的数据线、有一个高…