一个文件是以UTF-8无BOM格式编码,文件里存的都是字符串。
我现在要读出来,但发现英文正常,所有中文都是乱码。
我把文件转化成ANSI格式编码,发现文件里的中文也变成乱码了。。。
我怎样才能正常读出文件中的字符串呢?求解
------解决方案--------------------
这个,UTF-8 文件,11212.txt时楼主的内容.
irb(main):001:0> File.open('11212.txt','r'){|line|puts line}
#<File:0xb789a9b0>
=> nil
irb(main):002:0> File.open('11212.txt','r').each{|line|puts line}
一个文件是以UTF-8无BOM格式编码,文件里存的都是字符串。
我现在要读出来,但发现英文正常,所有中文都是乱码。
我把文件转化成 ANSI格式编码,发现文件里的中文也变成乱码了。。。
我怎样才能正常读出文件中的字符串呢?求解
=> #<File:11212.txt>
irb(main):003:0>
这就是ruby默认的utf-8编码,读出来没有任何问题.
------------------不太理解楼主的问题可以详细点吗---------------------------
如果你不想utf-8输出,如果楼主是window下,可以转换成GBK编码即可了.操作如下
- Java code
require 'iconv' def utf82gb(str) Iconv.iconv("GBK",'UTF-8',str.to_s) end out = File.new("gb.txt",'w') File.open('11212.txt','r').each{|line|out.puts utf82gb(line)}