サイト内検索 のチューニング


サイト内検索 と 商品検索 という言葉の違い

前回からの続きで、今回はなぜ サイト内検索チューニング が大変なのかという点についてです。

その前に、 サイト内検索 というキーワードそのものについてちょっと説明が必要です。

当社が手がけるようなECサイトなどの サイト内検索 は、 商品検索 と呼んだりもします。

もっというと、 サイト内検索 という大きな括りの中に 商品検索 というジャンルがあるという感じです。

サイト内検索と商品検索の違い

大きな括りの サイト内検索 は、いわゆる外部検索(インターネット検索)ではなく、サイトの中を対象とした検索全般です。

その サイト内検索 の中に 商品検索 があるわけですが、 商品検索 ではない サイト内検索 もあるわけです。

例えばニュースサイトの記事検索(ただ記事はコンテンツなので 商品検索 に少し似ています)、企業のコーポレートサイトの検索などです。

これらの検索はまさにそのまま サイト内検索 で良いわけですが、 商品検索 のほうは サイト内検索 でもあるし 商品検索 でもあるので、どちらの表現を使うかちょっと悩ましいのです。

サイト内検索 と 商品検索の特徴

それはさておき当社が手がけるのは、いわゆる 商品検索 です。

チューニング が難しいのはこちらのほうです。

サイト内検索のチューニング

商品検索 ではない サイト内検索 (ややこしい書き方ですが)というのは、 チューニング などもそれほど難しいものではありません。

違いについていくつか列挙してみます。

========================================
商品検索
========================================

・情報量が多い

・リアルタイム性が必要

ドリルダウンなど検索項目が多い

ソートが重要

・マーケティング要素が必要

========================================
○商品検索 ではない サイト内検索
========================================

・情報量はそこまで多くない

・リアルタイム性はそこまで必要ではない

・おおむねキーワードマッチのみ

・ソートは単純なことが多い

・マーケティングではなく情報検索

========================================

ざっと挙げてみるとこのような感じになります。

簡単にいうと、 商品検索 はデータが多くてインデックス作成の速さが必要で検索時の処理が複雑ということです。

商品検索 のデータ量の多さ・インデックス作成の速さ

まずデータ量ですが、これはもちろんECサイト毎にかなりの差がありますが、一例を挙げると書誌情報(本や雑誌)だと500万件くらいです。

当社の検索が導入されているサイトですと、数千万件から数億件のデータというケースも珍しくありません。

いちECサイトに数億件も商品があるものか?と思われるかもしれませんが、これは 商品検索 の場合には組み合わせが発生するので、このくらいのデータ量になることがあるのです。

数億はないにしても、当社の事例で言えばネットスーパーの場合、商品在庫というのは店舗ごとに管理する必要があります。

通常のECだと倉庫に在庫があれば変えますが、ネットスーパーでは「消費者の最寄りの店舗に在庫がないと買えない」からです。

つまり店舗ごと商品数×店舗数が商品数ということになります。

スーパーマーケットの商品数

他にも当社の事例で言えば、ゴルフ場予約検索なども組み合わせ検索の良い実例です。

ゴルフ場の数だけでは駄目で、ゴルフ場毎にある複数のプラン、また予約の日時、スタート時間、OUT・INスタートの種類とこれらを掛け合わせただけの商品(予約)があることになります。

次にインデックス作成の速さですが、 商品検索 ではない サイト内検索 の場合、そこまで即時性は必要ではないことが多いといえます。

そもそもデータ量(というかページ数)も多くはないですし、週に一度とか一日一回でも十分だと言えます。

ところが 商品検索 の場合、まず在庫数という項目があります。

デジタルコンテンツ等の場合には在庫数は不要ですが、物販や予約においては残数の管理はリアルタイムである必要があります。

また価格が変わっても即時に検索インデックスにも反映される必要があります。

インデックス更新の間サイトを止めることも出来ないため、こうしたデータ更新を常にノンストップで反映しなければなりません。

商品検索 における チューニング で一番難しいこと

そして一番難しいのが、検索時の処理の複雑さです。

先程のゴルフ場予約の事例で言えば、データ自体も掛け合わせになるので多いですが、その検索項目はさらに多岐にわたります。

都道府県、使う高速道路、キャディ有無、2サム可・不可(2人でプレー可能か)、2サム割増有無、宿泊プラン、コンペプラン、スループラン(ランチ無しプラン)、1.5ラウンドプランなどを組み合わせて検索しないと、自分の希望にマッチするプランを見つけることが出来ません。

ただ、こうした予約検索の場合には項目が多岐にわたるだけなので、複雑ではありますがまだましなほうです。

商品検索 における チューニング で、一番大変なのは、マーケティング要素の反映です。

消費者がサイトに訪問して、何らかの検索クエリで検索したときに、「一番買ってもらえるような順番で商品を並べる」という処理こそが、最重要であり最難関なのです。

こういうときは極端な反例を挙げるとわかりやすいですが、例えば消費者は検索をした際に気に入るページが出てくるまで何ページでも根気よくページングしてくれるとか、気にいる商品が出るまで根気よく検索しなおしをしてくれるとか、複雑な検索結果が出るまで何分でも待ってくれるなら、これは検索ロジックの チューニング の必要はありません。

極論どんな検索でもプライマリーキーの順に全商品出しておけば良いということになってしまいます。

現実には、消費者は根気よく待ってはくれません。

なんとなく自分の思う感じの検索条件を入れたら、瞬時に検索結果が表示され、かつまたその1ページめにはお目当ての商品があることを期待しています。

しかも、「そのお目当てというのは人ごとに違う」うえに「同じ人でも今日と明日では違う」のです。

データ量が多い上に、インデックス作成の速さも必要で、そして検索時の処理も複雑な 商品検索 のロジック チューニング ですが、ではどうやって当社はそのあたりをクリアしているのか、さらに踏み込んで次回説明してみます。

■ZETA CX シリーズ■
サイト内検索エンジン・EC商品検索 「ZETA SEARCH」
レコメンドエンジン「ZETA RECOMMEND」
レビューエンジン「ZETA VOICE」

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
【著者情報】
ZETA株式会社
代表取締役社長 山崎 徳之

【連載紹介】
[gihyo.jp]エンジニアと経営のクロスオーバー
[Biz/Zine]テクノロジービジネスの幻想とリアル
[ECZine]人工知能×ECことはじめ
[ECのミカタ]ECの役割
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

Designed by Freepik 画像1 / 画像2

 

– 前の記事 –
サイト内検索 における SEO 対策

– 次の記事 –
用語解説 検索クエリ