こんにちは、SSTDの大村です。前回はGoogle BigQueryを試してみましたが、今回は自分でデータセットとテーブルを作成してみましょう。
まずはデータセットを作ってみましょう。前回もアクセスしたweb interfaceにアクセスします。プロジェクト名の隣の「▼」をクリックし、「Create new dataset」をクリックします。

データセット名を入力して「OK」を押します。

エラーが出て作れない!

Billingが有効になってないよ!とのことです。Google APIs Consoleにアクセスし、警告マークが出ているBillingメニューをクリックします。

手順に沿って情報を入力してください。クレジットカードが必要です。

Billingが有効になりましたら、再度web interfaceにアクセスします。先ほどと同様にデータセットが作成します。
次にテーブルを作成します。作成したデータセットの横の「▼」を選択し、メニューから「Create new table」をクリックします。

Table IDに「testtable」と入力し、「Next」をクリックします。

Source Formatで「CSV」を選択し、File Uploadでローカルに作成した下記のファイルを選択し、「Next」をクリックします。
Schemaに下記のように記述し、「Next」をクリックします。
id:integer,name:string,time:timestamp

Field delimiterで「Comma」を選択し、「Submit」をクリックします。

しばらく待って、ブラウザのページをリロードするとテーブルが作成されています。左側のサイドメニューからテーブルを選択するとテーブルのスキーマが表示されます。

右側にある「Details」ボタンをクリックするとテーブルの詳細が表示されます。テーブルサイズやレコード数を確認することができます。

最後に前回と同じようにクエリを実行してみます。自分で作ったテーブルにクエリを発行するなんて感無量です。
右側の「Query Table」ボタンを押すとクエリ入力領域が表示されます。はじめからある程度書いてあるので、selectとfromの間に「*」と入力し、「RUN QUERY」ボタンをクリックすると、3行の結果が表示されます。


それでは皆様もたくさんのデータをアップロードしてさまざまな分析を行ってみてください。と、言いたいところですが、ブラウザベースですと大量のデータを扱うのは大変です。そのためにbq commandというコマンドが用意されていますので、次回はその設定方法と利用方法をご紹介したいと思います。