Vim中文件编码处理与重新打开乱码文件详解

Nita ·

更新时间:2024-11-10

· 792 次阅读

前言

Vim 中有两个与编码有关的变量，如果理解了基本就不会再为编码问题头疼了。

encoding ：Vim 内部编码，例如 buffer、寄存器、文本等。这个值一般用户不要设置，另外打开 Vim 之后再设置这个值也是没有意义的。大家可以将这个值看作是 Vim 程序自己的变量，如果在工作中遇到文件的编码问题，和 encoding 这个变量是万万没有关系的。 fileencoding ：顾名思义了，就是文件的编码。

此外还有一个值，叫 fileencodings 是个复数。一般我们将这个值在 vimrc 中设置，Vim 打开一个文件的时候回根据 fileencodings 里面设置的顺序来猜测文件的编码。比如这样设置：


set fileencodings=ucs-bom,utf-8,cp936,gb18030,big5,euc-jp,euc-kr,latin1

那么有时候 Vim 猜错了，打开的文件显示乱码怎么办呢？（ps：通常 Vim 打开文件的时候乱码是因为你的 fileencodings 里面没有写某个编码，所以 Vim 没有猜对。例如从上面的设置中删掉 gb18030 ，那么打开这种编码的文件的时候你会发现 fileencoding 的值是 latin1 ，而文件的显示是乱码）

这时候你可能想到设置 fileencoding 的值，但是此时我们的文件已经打开了，你设置后会发现 Vim buffer 的状态变成了 Edited 。而文件依然显示乱码，没有变化。具体的原因后文会详细解释。

正确的做法是以特定编码重新打开文件，例如在 Vim 中使用重新打开命令 :e ++enc=gb2312 ，其中 ++enc 是一个选项，可以指定使用的编码。打开后你会发现 Vim 按照你指定的形式打开了文件，但是文件变成了 readonly 状态，如果要修改，设置 :set noreadonly 就好。

其实原理有点像 Python 里面有人提出的三明治模型：

Python 在从流（例如网络，文件 I/O 的时候），拿到的是 bytes ，通过 decode() 变成 str 而 Vim 在读入一个文件的时候，根据 fileencoding （用户设置的或者通过 fileencodings 猜测，将其转换成内部 encoding 的编码方式。

Python 在写入文件的时候，用 encode() 变成 bytes 再写。而 Vim 从 buffer 写到文件的时候，也是将数据从内部的 encoding 转换成 fileencoding 再写入。

这也就解释了为什么乱码的时候在 Vim 中修改 fileencoding 没什么卵用。

因为在打开文件之后设置 fileencoding 的值不会改变已经载入到 Vim buffer 中的数据，此时的数据已经是转换完成了的，这个设置只会改变写入的时候使用目前的 fileencoding 来写入，所以总结起来就是“打开文件使用了一个编码，写入文件的时候使用了另一个编码”。

而对乱码正确的需求应该是：我想要以特定的编码形式打开这个文件。

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对软件开发网的支持。

参考：

help :edit help fileencoding help ++enc VIM 文件编码识别与乱码处理 您可能感兴趣的文章:解决linux下vim中文乱码的方法

编码乱码 vim

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Python2 内置函数大全

Irisa 2020-05-14

707

Pandas操作CSV文件的读写实现方法

Uma 2020-10-15

530

Docker如何使用link建立容器之间的连接

Ailis 2021-06-18

684

如何解决freemarker静态化生成html页面乱码的问题

Danica 2023-01-13

1843

Linux命令之mkdir，cat，touch，vi/vim的详解

Lala 2023-01-15

1203

Python实现类别变量的独热编码

Sabah 2023-02-18

909

5个ChatGPT功能帮助你提升日常编码效率

Isis 2023-02-18

391

Windows下CMD执行Go出现中文乱码的解决方法

Bonnie 2023-02-26

390

C#字符集编码的使用及说明

Rasine 2023-02-26

257

基于C#实现乱码视频效果

Kohana 2023-02-26

828

深入理解JavaScript中的Base64编码字符串

Trina 2023-02-26

794

解读Base64编码中为什么会有等号(=)问题

Tia 2023-03-06

1331

Jmeter测试时遇到的各种乱码问题及解决

Kathy 2023-03-11

448

IDEA中的Tomcat中文乱码问题

Oceana 2023-03-11

342

如何使用python批量修改文本文件编码格式

Gitana 2023-03-25

129

使用Python批量对文本文件编码互转的方法

Karli 2023-03-25

1962

深入解析Golang中JSON的编码与解码

Oceana 2023-05-12

1544

C#string转换为几种不同编码的Byte[]的问题解读

Phaedra 2023-05-12

1165

js解决url传递中文参数乱码问题的方法详解

Octavia 2023-05-12

932

docker容器中文乱码的解决方法

Welcome 2023-05-13

1634

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座