面试的时候遇到过这么一道题,golang中如何处理中文字符串,我没太明白是问的什么,就说用buffer处理,转换成二进制。然后就没然后了,回来查了一下,这是问的go数据类型的知识点,很基本的知识点。
ascii 只有128个字符,英语足够了。
但是其他语言比如中文字符太多了,需要更大的集合,所以出现了Unicode。
但是Unicode只是一个符号集,没有说这个符号如何存储
所以出现了各种编码规则,比如utf-8,所以说utf-8只是一个编码规则,是Unicode的一种实现方式。
golang底层使用utf-8来实现的,下边是例子
package main
import "fmt"
func main() {
str := "严"
//十六进制
fmt.Printf("%x\n", str)
// 二进制,普通for循环按照字节遍历
for i := 0; i < len(str); i++ {
fmt.Printf("%b", str[i])
}
fmt.Println("")
// 用下标遍历,for range按照字符遍历,字符只有一个,但是输出的是字节,
// 所以只输出第一个字节
for i := range str {
fmt.Printf("%b", str[i])
}
fmt.Println("")
// for range 遍历,这次输出的是值,才能打印中文字符串
for _, v := range str {
fmt.Printf("%c", v)
}
fmt.Println("")
}