
两段看起来一模一样的文字,竟然有着不同的内部编码,有没有什么方法可以将它们相互转换?
2016-09-11
\Uc2a4\Ud06c\Ub9b0\Uc0f7 2016-09-11 \Uc624\Uc804 2016-09-11
\U1109\U1173\U110f\U1173\U1105\U1175\U11ab\U1109\U1163\U11ba 2016-09-11 \U110b\U1169\U110c\U1165\U11ab @imn1 已找到解决方案,非常感谢你的指点!
NSString *tc = @""; NSLog(@"tc: '%@'", tc); NSString *cc = [tc precomposedStringWithCompatibilityMapping]; NSLog(@"cc: '%@'", cc); 1 imn1 2016-09-16 12:01:49 +08:00 第一个是 unicode 第二个是键码(拆字),拆字后的 unicode ,懂韩语或其输入法的会知道 如 (c2a4) 拆成 (1109) 和 (1173) |
2 imn1 2016-09-16 12:12:18 +08:00 看上去第二个是输入错误引起的 如第一例中 ,韩语常用输入是二或三键构成一个字(空格断字), 1105 , 1175 , 11ab ,刚好就是第二例中的 感觉是输入法用错了,韩文有输入法是 2 键输入,但输入的人仍然用了习惯的三键,就变成第二例 |