В современном мире невозможно работать только со строками, состоящими исключительно из ASCII символов. Везде используются нестандартные знаки, языки отличные от латиницы и эмодзи. Для работы с такими Юникод символами в Go представлен тип данных rune
:
package main
import (
"fmt"
)
func main() {
emoji := []rune("привет😀")
for i := 0; i < len(emoji); i++ {
fmt.Println(emoji[i], string(emoji[i])) // выводим код символа и его строковое представление
}
}
Вывод:
1087 п 1088 р 1080 и 1074 в 1077 е 1090 т 128512 😀
rune
— это алиас к int32
. Как и байты, руны были созданы для отличия от встроенного типа данных. Каждая руна представляет собой код символа стандарта Юникод. Строка свободно преобразуется в []byte
и []rune
, но эти 2 типа данных не конвертируются между собой напрямую:
s := "hey😉"
rs := []rune([]byte(s)) // cannot convert ([]byte)(s) (type []byte) to type []rune
bs := []byte([]rune(s)) // cannot convert ([]rune)(s) (type []rune) to type []byte
В Go присутствует синтаксический сахар при обходе строки. Если использовать конструкцию for range
, строка автоматически будет преобразована в []rune
, то есть обход будет по Юникод символам:
package main
import (
"fmt"
)
func main() {
emoji := "привет😀"
for _, ch := range emoji {
fmt.Println(ch, string(ch)) // выводим код символа и его строковое представление
}
}
Вывод:
1087 п 1088 р 1080 и 1074 в 1077 е 1090 т 128512 😀
Остались вопросы? Задайте их в разделе «Обсуждение»
Вам ответят команда поддержки Хекслета или другие студенты