!Streamでpublic_timelineを取る あー 今考えると日本のやつだけとかできた気がする… とれた全Twitから 日本語のやつだけを抽出(ひらがな、カタカナを含むTwit) 288370twits 16hで18万か…解析できないかなぁ… メモリにデータをつまないように解析を開始…。 これ分割してやらないと出てきたデータを加工することもできない… ううっ データ量が多いと何かと大変だ…