2022年 11月 13日

python中文读_python读取中文

如何从文件中读取300个汉字?

看起来很简单,但很容易掉坑里了。

一开始我这么写:

try:

fd = codecs.open(os.path.join(settings.TEXT_CONTENT_DIR,channel_name.lower(), article_id), encoding=’utf-8′)

#fd = open(os.path.join(settings.TEXT_CONTENT_DIR,channel_name.lower(), article_id))

text = fd.read(300)

fd.close()

except Exception, e:

print “content.load() Error:”, e

但是文件中如果是中英文夹杂怎么办?

因为 utf8编码是变长的,所以很有可能会读出半个汉字。

解决办法:

1.写文件时指定 utf8编码:

import codecs

fd = codecs.open(conf.data_directory + os.sep + conf.text_directory + os.sep + channel_name + os.sep + str(id),

‘w+’, “utf-8”)

fd.write(text)

fd.close()

http://segmentfault.com/q/1010000000131965

2.指定 utf8读文件:

try:

fd = codecs.open(os.path.join(settings.TEXT_CONTENT_DIR,channel_name.lower(), article_id), encoding=’utf-8′)

#fd = open(os.path.join(settings.TEXT_CONTENT_DIR,channel_name.lower(), article_id))

text = fd.read(settings.TAG_ARTICLE_CHARACTERS_NUMBERS)

fd.close()

except Exception, e:

print “content.load() Error:”, e

http://blog.sina.com.cn/s/blog_630c58cb0100vqtc.html

python读取中文文件编码问题

python 读取中文文件后,作为参数使用,经常会遇到乱码或者报错asii错误等. 我们需要对中文进行decode(‘gbk’) 如我有一个data.txt文件有如下内容: 百度 谷歌 现在想读取文件 …

转 python 读取中文文件名/中文路径

python直接读取中文路径的文件时失败,可做如下处理: inpath = ‘D:/work/yuanxx/在线导航/驾车导航/walk_log/20130619_172355.txt’ uipath …

Python 读取文件中unicode编码转成中文显示问题

Python读取文件中的字符串已经是unicode编码,如:\u53eb\u6211,需要转换成中文时有两种方式 1.使用eval: eval(“u”+”\'” …

python第二十九课——文件读写(读取读取中文字符)

演示:读取中文字符 结论: 1).如果不设置encoding,默认使用gbk进行编解码 2).如果编码和解码不一致,最终导致报错,但是一旦设置了errors=’ingore’,那么就不会报错,而采取乱 …

论 Python Opencv 中文路径及中文文件名图像文件读取的两种方式

python 2中对于中文字符的处理可谓是诟病已久,虽然python 3 使用统一编码解决了中文字符串的问题,但在使用opencv中imread函数读取中文路径图像文件时仍会报错. 1) 借助nump …

Python读取SQLite文件数据

近日在做项目时,意外听说有一种SQLite的数据库,相比自己之前使用的SQL Service甚是轻便,在对数据完整性.并发性要求不高的场景下可以尝试! 1.SQLite简介: SQLite是一个进程内 …

python 读取文件read.csv报错 OSError: Initializing from file failed

小编在用python 读取文件read.csv的时候 报了一个错误 OSError: Initializing from file failed 初始化 文件失败 检查了文件路径,没问题 那应该是我文 …

使用python读取MS-SQL数据库

使用python读取MS-SQL中的数据,这里使用到模板pymssql. 因为不是python自带的模板,所以首先需要使用pip安装,对应命令:pip install pymssql 建立main.p …

随机推荐

最全面的NSDateHelper 分享

NSDateUtil 分享 (ios开发交流群:486468672) 代码下载:https://github.com/foxswang/NSDateUtil 史上最全面NSDate Utility 没 …

ecshop 重置后台密码 MD5+salt

ecshop密码加密方式: MD5 32位+salt,简单来说就是明文密码用MD5加密一次,然后在得到的MD5字符后边加上salt字段值(salt值为系统随机生成,生成以后不再改变)再进行一次MD5加 …

关于phpcmsv9更新缓存出现链接被重置的问题

今天安装phpcmsv9后更新缓存出现链接被重置的错误,..找了半天原因. . .原来是apache配置里面的keepAlive显示的是off,,应该将其改为on…然后重新启动apache….

CSS美化 input type=file 兼容各个浏览器(转)

HTML代码:

< …

linux下安装配置svn独立服务器

subversion(以下简称svn)是近年来崛起的版本管理工具,是cvs的接班人. svn服务器有2种运行方式:独立服务器和借助apache.2种方式各有利弊. file:/// 直接版本库访问(本 …

uva 12003 Array Transformer (大规模阵列)

白皮书393页面. 乱搞了原始数组中.其实用另一种阵列块记录. 你不能改变原始数组. 请注意,与原来的阵列和阵列块的良好关系,稍微细心处理边境.这是不难. #include

WebForm 文件上传

//Button1的点击事件 //FileUpload1.FileName为所传文件的名字. //以DateTime.Now.ToString(“yyyyMMddhhmmssms” …

How to support comparators in our sort implementations&quest;

上图是普林斯顿算法课part1.Mergesort章节给出的参考代码,可以发现这个代码有三处警告.造成的隐患就是我们无法在类型检查时发现送入sort()函数的数组元素类型和Comparator的泛型不 …

C&num; SQLite 数据库操作

C# SQLite 数据库操作学习 运行环境:Window7 64bit,.NetFramework4.61,C# 7.0 参考: SQLite 官网 SQL As Understood By SQL …