-
我用 Python 读写文件一直好好的,可代码一换到别的机器上跑,要么读出来一堆乱码、要么直接抛 UnicodeDecodeError,排查半天才发现我从来没指定过编码、一直在默默依赖一个会随环境变的默认值的深度复盘
我有段处理文本文件的 Python 代码,读文件、处理、写回去,写法朴实:open(path) 读、open(path,'w') 写,从没想过编码。在我开发机上一直稳稳当当,中文各种字符读写都分毫不差。可部署到别的机器、或同事在不同系统上跑就爆发了:有的环境读出来的中文变成锟斤拷似的乱码,有的直接抛 UnicodeDecodeError 崩溃。同一段代码同一个文件,在我这儿好端…- 0
- 0
-
本地能读换环境就崩:Python 字符编码避坑复盘
有个 Python 脚本功能很简单:读一个文本文件处理里面的数据,我在自己的 Mac 上开发测试跑得顺顺当当处理了成千上万条都没事。可一上线到生产服务器、或换一批从别的系统导出的文件来处理,它就时不时啪一声崩掉抛出 UnicodeDecodeError: utf-8 codec can not decode byte 0xb4。明明同样的代码同样的逻辑在我这儿好好的,换个环境换个文件就解码失败。查…- 0
- 0
-
字符编码与乱码完全指南:从一次"数据库里的中文全变成了问号"看懂 UTF-8、字节与编码声明
2020 年我做一个系统要处理大量文本用户的昵称文章的正文上传上来的文件存字符串读字符串这件事我压根没多想第一版我做得很省事字符串嘛就是一串字存进去读出来不就行了读写文件直接 open 存数据库直接塞从来不操心什么编码不编码的本地开发时真不错我自己存个中文昵称写段中文正文读出来打到屏幕上一个字不差几行代码搞定我心里很踏实可等这个系统真正上线还经历了一次从老系统导数据又换了台服务器一串问题冒了出来第…- 0
- 0
-
文件中文全是乱码:一次 Linux 字符编码与字节转换的排查复盘
同事用微信发来一个 order.csv 让导数据库,存到 Linux 服务器上 cat 一看满屏鬼画符一个中文都认不出,以为文件传坏了让重发还是乱,可同事说他用 Excel 打开公司名地址清清楚楚全是好好的中文,同一个文件他说正常我说乱码。排查梳理:文件里存的从来不是字是一串字节 0 到 255 的数字,字节本身没有意义要把字节变成人能读的字符必须有一本叫编码的翻译词典,GBK 这本词典说 b9 …- 0
- 0
-
字符编码完全指南:从 ASCII 到 Unicode 再到 UTF-8,一次彻底搞懂
乱码,大概是每个开发者都遇到过的"灵异事件":数据库里好好的中文,取出来变成一堆问号;别人发来的文件,打开全是"锟斤拷";网页一打开,满屏方块。这些问题的根源,都在"字符编码"这四个字上。这篇文章把 ASCII、Unicode、UTF-8 这条主线一次性讲透,再补上 UTF-16、乱码排查、数据库编码、emoji 这些实战话题 —— 看完…- 14
- 0
UTF-8
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!





