2012年9月26日水曜日

ビッグデータ!?

「ビッグデータ」…近頃流行の言葉ですね。私もたまに言葉は使っています。しかし、「ビッグデータ」そのものを取り扱ったことがないです。
今回、初めて触る訳ですが、何から始めて良いのかも解らないです。
なんとなく調べてみて、この際だから、BI系のソフトウェアを使ってみることにした。
ちょっと調べてみて、Jasper Serverとかいうオープンソースソフトウェアにしました。無料ですからね。
そして、データベースベース、twitterのデータだけで30GBもあるというのですが、正直30GBが「なんぼのものか」皆目見当がつきません。そうは言っても、普段使っているMSSQL ServerやOracleの無料版では扱えないのは明白。こちらは、地理情報を格納することも考えて、PostgreSQLを使ってみます。
早速、以下の手順でインストールしてみました。

1.PostgreSQLとPostGISをインストール
  最新のPostgreSQL 9.2だと、何故かPostGISが入らなかったので、PostgreSQL9.1.6を
  インストールしました。
  Application Stack BuilderでPostGISがインストール出来なかったので、こちらは
  直接インストーラをダウンロードして、インストールしました。
2.Jasper Serverをインストール
  こちらはもちろんCommunity版を使用しました。
  Versionは4.7です。
  インストール中にPostgreSQLをインストールするか聞いてくるので、こちらは、
  インストール済みのPostgreSQLを使うように設定。
  同じく、Tomcatをインストールしてくるかを聞いてきたので、こちらはBundle版をインストール
  しました。

とりあえずは、上記作業は完了。あっさりと、Jasper Serverは動きました。
今後の予定をざっくりと考えると。。。

  1. 入手できるデータをとりあえず、PostgreSQLに入れてみる
  2. 地理情報的に分析するため、行政界情報を入れてみる
あたりでデータ整備は終了として、あとは…Jasperの使い方をマスターするしかないな…。
とりあえず、明日からやわやわとデータ整備をやってみます。

0 件のコメント:

コメントを投稿