这里会显示出您选择的修订版和当前版本之间的差别。
— |
python-basic:chardet [2010/06/02 01:18] (当前版本) |
||
---|---|---|---|
行 1: | 行 1: | ||
+ | ====== python 编码 检测 ====== | ||
+ | 使用 chardet 可以很方便的实现字符串/文件的编码检测 | ||
+ | |||
+ | 例子如下: | ||
+ | |||
+ | <code python> | ||
+ | >>> import urllib | ||
+ | >>> rawdata = urllib.urlopen('http://www.google.cn/').read() | ||
+ | >>> import chardet | ||
+ | >>> chardet.detect(rawdata) | ||
+ | {'confidence': 0.98999999999999999, 'encoding': 'GB2312'} | ||
+ | >>> | ||
+ | </code> | ||
+ | |||
+ | chardet 下载地址 http://chardet.feedparser.org/ |