Pythonで日本語を扱う設定いろいろ

入門自然言語処理に書いてあった方法.

デフォルトエンコーディングがASCIIになっているので,
最初にutf-8に設定する方法がある.

import sys
#インタプリタ起動時にsetdefaultencoding()関数は
# 削除されるのでsysをもう一度リロードする
reload(sys)
sys.setdefaultencoding('utf-8')

この方法はインタプリタ起動時にいちいちやらないといけないので
(pythonフォルダ)/usr/lib/python2.x/あるいは
/usr/lib/python2.x/site-packages/にある
sitecustomize.pyに以下を記入する.