Blog

[Google Cloud Platform] public dataset の地理空間画像から日本の画像を探してみよう


みなさんこんにちは。
アドテクスタジオの makocchi です。

先日 Google Cloud Platform(以下 GCP) の blog で「Powering geospatial analysis: public geo datasets now on Google Cloud」という記事が投稿されました。
衛星からの地理空間画像の public dataset が GCP で利用可能になったという内容なのですが、さっそく画像を取得してみました。

衛生の種類は 2 種類あって Landsat と Sentinel-2 があるのですが、今回は Sentinel-2 の衛星画像を見てみました。

 

地理空間画像データの保管場所

Sentinel-2 の画像は GCS の gs://gcp-public-data-sentinel-2/ に保存されています。
その中に緯度経度と画像のマッピング情報が index 化されて gs://gcp-public-data-sentinel-2/index.csv.gz に保存されています。

 

index.csv の中身

index.csv.gz のサイズは 49M 程度で解凍すると 422M になりました。
行数は 100 万程のようです。

 

実際の中身ですが、csv の先頭行にカラムの説明が書かれています。

 

緯度経度の情報や GCS の保存場所とかが書かれていますね。

これらのデータの中から日本(東京)の衛生画像データを探してみましょう。

東京は北緯(NOTH_LAT) 35.6 度、東経(EAST_LON) 139.7 度あたりです。

 

index.csv を BigQuery に load する

 

csv を落としてきて grep や awk で頑張って東京付近の index を探すことも可能ですが、せっかくなので BigQuery にデータを入れて検索してみましょう。

BigQuery は GCS に置かれた file から簡単に load することができます。

NORTH_LAT や WEST_LON のようなカラムは理想は float なのですが・・・string じゃないと駄目でした。(多分マイナスの値も入っていたからだと思われます)

 

それではさっそく東京のデータを探してみましょう。

 

こんな感じで探してみたのですが、一番東京に近そうなのはこのデータのようでした。

ちなみに北緯 35.225114032、東経 138.934514048 ってどこなのかっていうと芦ノ湖からちょっと西にいったところのようです。

 

さっそくデータを見てましょう。

BASE_URL に書かれている GCS の中身を見てみると

このようなデータ構造になっていて、実際の画像データは GRANULE の中に置かれているようです。

GRANULE からさらに掘り進めると、IMG_DATA というディレクトリがありその中に画像が置かれていました。

画像は .jp2 という拡張子になっていて jpeg 2000 の形式で置かれています。

 

早速見てみましょう。

sentinel2_image1
・・・暗くて何もわからない!(いやもしかしたら白黒なのか・・)

IMG_DATA のフォルダには何枚か画像が入ってますがいずれもほぼほぼ真っ黒。

 

 

このままでは終われない

 

他にも画像が無いかいろいろ探していたところ、IMG_DATA と同じ階層に QI_DATA というディレクトリがあり、その中にも .jp2 があったので見てみたところ・・

sentinel2_image2

雲!雲!雲!

というわけであまりいい画像が探せませんでした・・・
他の緯度経度でもいろいろ画像を探してみたんですけども、あまりいい画像が無かったです。悔しい。

駿河湾の画像は見つけました。

sentinel2_image3

 

 

まとめ

地理情報と衛星画像が GCP 内で処理できるようになったことで、いろいろな分析が GCP 内で完結できるようになりますね。

GCP の blog にも書かれていましたが、実際に分析をしている会社も既に何社かあるようです。

先日は気象データも BigQuery で分析できるようになりましたし、こうしたデータを public にしてくれるのはさすが Google です。

今回はあまりいい画像を探すことができませんでしたが、次回は Landsat の衛星画像でチャレンジしようと思います!

Author

アバター
makocchi