读取非UTF8编码的文件内容并正确打印出来

2024年 2月 6日 101.8k 0

读取非utf8编码的文件内容并正确打印出来

问题内容

我尝试读取非utf8编码的文件并打印出内容。喜欢:

content, _ := os.readfile("example.csv")
fmt.println(string(content))

登录后复制

输出:

���������������������������

然后,我尝试转换符文的内容并将其解码为 utf8,如下所示:

br := make([]rune, 0)
for len(content) > 0 {
r, size := utf8.DecodeRune(content)
br = append(br, r)
content = content[size:]
}
fmt.Println(string(br))

登录后复制

但是结果是一样的。我怎样才能获得正确的内容?
ps:我不知道文件编码类型,它们可以是raditionalchinese.big5或japanese.shiftjis等几种类型,并且内容不能是文件。它可以是一个字符串。

正确答案

很可能您需要来自 golang.org/x/ 的软件包text/encoding 层次结构。

特别是 golang.org/x/text/encoding /charmap 允许创建 encoding。Decoder 能够将传统非 UTF-8 编码中的字节流转换为 Go 原生的 UTF-8 编码数据流。

以上就是读取非UTF8编码的文件内容并正确打印出来的详细内容,更多请关注每日运维网(www.mryunwei.com)其它相关文章!

相关文章

JavaScript2024新功能:Object.groupBy、正则表达式v标志
PHP trim 函数对多字节字符的使用和限制
新函数 json_validate() 、randomizer 类扩展…20 个PHP 8.3 新特性全面解析
使用HTMX为WordPress增效:如何在不使用复杂框架的情况下增强平台功能
为React 19做准备:WordPress 6.6用户指南
如何删除WordPress中的所有评论

发布评论