Elasticsearch は、オープンソースの全文検索エンジンです。Apache Solr と並んでよく取り上げられるようになってきました。
位置情報の検索機能も標準搭載しているとのことで、試しに使ってみました。
下の情報が大変参考になりました。(環境は Mac。事前に Java と homebrew の導入が必要です)
下のサイトが大変参考なりました。
下のようなスキーマのデータを登録して検索する想定です。
//venue_example.json
{
"name" : "Tokyo St",
"pin" : {
"location" : {
"lat" : 35.68,
"lon" : 139.76
}
}
}
Elasticsearch は基本的にはスキーマレスで動くのですが、位置情報を表す項目は、明確にスキーマを定義する必要があるようです。
データ投入の前にそれを行います。
curl -XPUT 'http://localhost:9200/myvenues/'
curl -XPUT 'http://localhost:9200/myvenues/venue/_mapping' -d '
{
"venue" : {
"properties" : {
"pin" : { "type" : "geo_point" }
}
}
}'
ここでは、venue
のプロパティ群の内の pin
項目は、位置情報(geo_point)だよ、と定義しています。
2件ほど、テストデータを投入します。
curl -XPUT 'http://localhost:9200/myvenues/venue/1' -d '{
"name" : "Tokyo St",
"tag" : ["station", "train"],
"pin" : {
"location" : {
"lat" : 35.68,
"lon" : 139.76
}
}
}'
curl -XPUT 'http://localhost:9200/myvenues/venue/2' -d '{
"name" : "Nagoya St",
"tag" : ["station", "train"],
"pin" : {
"location" : {
"lat" : 35.17,
"lon" : 136.88
}
}
}'
緯度/経度:35.6/139.8 から 20km 周囲にあるデータを検索します。
curl -XPOST 'http://localhost:9200/myvenues/venue/_search' -d '{
"query": {
"filtered" : {
"query" : {
"match_all" : {}
},
"filter" : {
"geo_distance" : {
"distance" : "20km",
"venue.pin" : {
"lat" : 35.6,
"lon" : 139.8
}
}
}
}
}
}'
Tokyo St だけがヒットしました。
{"took":0,"timed_out":false,"_shards":{"total":5,"successful":5,"failed":0},"hits":{"total":1,"max_score":1.0,"hits":[{"_index":"myvenues","_type":"venue","_id":"1","_score":1.0, "_source" : {
"name" : "Tokyo St",
"pin" : {
"location" : {
"lat" : 35.68,
"lon" : 139.76
}
}
}}]}}
左上:35.2/136.8 〜 右下:35.1/136.9 にあるデータを検索します。緯度は上(北)の方が値が大きくなるので、上下関係に注意が必要です。
curl -XPOST 'http://localhost:9200/myvenues/venue/_search' -d '{
"query": {
"filtered" : {
"query" : {
"match_all" : {}
},
"filter" : {
"geo_bounding_box" : {
"venue.pin" : {
"top_left" : {
"lat" : 35.2,
"lon" : 136.8
},
"bottom_right" : {
"lat" : 35.1,
"lon" : 136.9
}
}
}
}
}
}
}'
Nagoya St だけがヒットしました。
{"took":0,"timed_out":false,"_shards":{"total":5,"successful":5,"failed":0},"hits":{"total":1,"max_score":1.0,"hits":[{"_index":"myvenues","_type":"venue","_id":"2","_score":1.0, "_source" : {
"name" : "Nagoya St",
"pin" : {
"location" : {
"lat" : 35.17,
"lon" : 136.88
}
}
}}]}}
任意の多角形領域にあるデータを検索します。
ここでは GeoJSON 互換の記述方式で書いてます。経度が先なので注意。 今までのような lat: lon: の配列でもかけますが、 GeoJSON 便利なので。
curl -XPOST 'http://localhost:9200/myvenues/venue/_search' -d '{
"query": {
"filtered" : {
"query" : {
"match_all" : {}
},
"filter" : {
"geo_polygon" : {
"venue.pin" : {
"points" : [
[139.7, 35.7], // 経度が先!
[139.8, 35.7],
[139.8, 35.6],
[139.7, 35.6],
[139.7, 35.7]
]
}
}
}
}
}
}'
Tokyo St だけがヒットしました。
{"took":0,"timed_out":false,"_shards":{"total":5,"successful":5,"failed":0},"hits":{"total":1,"max_score":1.0,"hits":[{"_index":"myvenues","_type":"venue","_id":"1","_score":1.0, "_source" : {
"name" : "Tokyo St",
"pin" : {
"location" : {
"lat" : 35.68,
"lon" : 139.76
}
}
}}]}}
(ポリゴンの座標群が、右回りじゃないとダメかな?と思って恐る恐る左回りにしてみたら、問題なく検索できました!)
最初 geo_point
を明示的に指定しないといけないのに気づかなくてしばらくハマりましたが、それ意外はすんなりと動きました。
機能を試しただけでパフォーマンスなどは計測できていませんが、なんか使えそうな気はします。
位置情報関係の情報を探したい時は、公式サイトの GUIDE
の検索バーで 「geo」で検索すると、有用な情報が得られます。