/diary/20120203

!Streamでpublic_timelineを取る
あー 今考えると日本のやつだけとかできた気がする…

とれた全Twitから 日本語のやつだけを抽出（ひらがな、カタカナを含むTwit）
288370twits
16hで18万か…解析できないかなぁ…

メモリにデータをつまないように解析を開始…。
これ分割してやらないと出てきたデータを加工することもできない…
ううっ データ量が多いと何かと大変だ…