ascii,Unicode,utf-8与golang的关系

mac2025-01-16  10

面试的时候遇到过这么一道题,golang中如何处理中文字符串,我没太明白是问的什么,就说用buffer处理,转换成二进制。然后就没然后了,回来查了一下,这是问的go数据类型的知识点,很基本的知识点。

ascii 只有128个字符,英语足够了。

但是其他语言比如中文字符太多了,需要更大的集合,所以出现了Unicode。

但是Unicode只是一个符号集,没有说这个符号如何存储

所以出现了各种编码规则,比如utf-8,所以说utf-8只是一个编码规则,是Unicode的一种实现方式。

golang底层使用utf-8来实现的,下边是例子

package main import "fmt" func main() { str := "严" //十六进制 fmt.Printf("%x\n", str) // 二进制,普通for循环按照字节遍历 for i := 0; i < len(str); i++ { fmt.Printf("%b", str[i]) } fmt.Println("") // 用下标遍历,for range按照字符遍历,字符只有一个,但是输出的是字节, // 所以只输出第一个字节 for i := range str { fmt.Printf("%b", str[i]) } fmt.Println("") // for range 遍历,这次输出的是值,才能打印中文字符串 for _, v := range str { fmt.Printf("%c", v) } fmt.Println("") }

 

最新回复(0)