!Streamでpublic_timelineを取る
あー 今考えると日本のやつだけとかできた気がする…

とれた全Twitから 日本語のやつだけを抽出(ひらがな、カタカナを含むTwit)
288370twits
16hで18万か…解析できないかなぁ…

メモリにデータをつまないように解析を開始…。
これ分割してやらないと出てきたデータを加工することもできない…
ううっ データ量が多いと何かと大変だ…
5643382
wiki
1328224467