手机版
你好,游客 登录 注册 搜索
背景:
阅读新闻

fgetcsv之在Ubuntu 10.10下不能解析中文的问题

[日期:2011-08-10] 来源:Linux社区  作者:xiaoyaoxia [字体: ]

这篇(http://www.linuxidc.com/Linux/2011-08/40394p2.htm)叙述了用fgets的方法来代替fgetcsv读取csv文件,后来发现,如果不使经过处理而直接代替,还是有问题:着实让我郁闷了很久啊。

首先,fgetcsv在处理的时候,会正确的处理一行中的内容,就算我行中含有换行符和,,都可以处理掉,正确的解析出来。而如果用fgets,那么这些都需要自己做,当然网上也给出了一个重写fgetcsv的方法,当然用的使正则,这个效率上需要斟酌啊。

但是fgetcsv却有个问题,就如我上一篇中提到的,地区的设置,当然setlocale(LC_ALL, 'zh_CN');事实证明是可以解决的,但是这个是在我WIN下测试的情况下。当我转移到Ubuntu来测试的时候,悲剧发生了。

虽然我的ubuntu系统使中文的系统,可是用的local是zh_CN.UTF8的,并没有zh_CN.GBK的,于是乎,中文字不能解析的情景再次上演了。

当然前辈的肩膀总是伟大的,在互联网的推动下,一切都有办法解决。

我先是更新了下语言包,系统->管理->语言支持。第一次打开的时候提示我没有安装完全,需要升级,于是我升级了,可是在命令行中查看locale -a的时候,仍然没有zh_CN:

www.linuxidc.com@ubuntu:/usr/www/GBKHost/test$ locale -a
C
POSIX
zh_CN.utf8
zh_HK.utf8
zh_SG.utf8
zh_TW.utf8

于是我这样做:

1、修改local文件,添加zh_CN支持:

sudo vi /var/lib/locales/supported.d/local

在第一行前插入一行zh_CN 为了万一,我也插入了zh_CN.GBK GBK这行

保存。

2、设置支持包

sudo locale-gen zh_CN

sudo locale-gen zh_CN.GBK

3、 再次运行locale -a

www.linuxidc.com@ubuntu:/usr/www/GBKHost/test$ locale -a

C

POSIX

zh_CN

zh_CN.gb2312

zh_CN.gbk

zh_CN.utf8

zh_HK.utf8

zh_SG.utf8

zh_TW.utf8

终于有了。

再次去运行下csv导入页面(当然含有setlocale(LC_CTYPE, 'zh_CN')操作了),成功!

linux
相关资讯       Ubuntu教程 
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数

       

评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款