Eコマース担当者が知っておいた方が良いサイト内検索の仕組み
はてなブログの「鈴木です。」は更新を(おそらく)停止しました。
ブログはWordPressにて継続しているので、よければ是非訪れてください。
なお、ちょっと黒い鈴木はnoteをご覧ください。
昼間の2時から3時は睡魔といつもバトルの鈴木です。大体負けていますが。
先日、書いたエントリー
サイト内検索の分析はとても重要なのですが、そもそも自社のコマースサイトで使っているサイト内検索エンジンの仕組みを理解していないと、間違える事があります。
コマースサイトに限った話ではありませんが、サイト内検索エンジンの仕組み、動き方は担当者なら最低限把握しておかないと意味がありません。
サイト内検索のエンジンはどこまで行ってくれるのか、最低限理解していないといけないポイントを説明しておきます。
サイト内検索エンジンのデータ収集の仕組み
まず、サイト内検索エンジンにも当然データベースが必要で、検索対象となる情報のインデックスは必要です。
その時に、データベースの元となるデータの情報収集の仕組みを理解しておく必要性があります。
基本的には2種類
- クローラー型
- 情報連携型
1は、Googleも行っている方法ですね。サイト内検索なのでサイト内のみをクロールする仕組みで情報を集めてくるタイプです。これだとサイトに掲載されている内容(HTML内含)に対してのみ、検索が出来る事になります。
2は、予め何の情報を検索エンジンのデータベースに送るか決めておいて、情報をデータベースに流す仕組みです。コマースサイトの場合は、商品情報を登録するデータベースが必ずあります。その際に、そのデータベースに格納されている情報のうち、どの情報をサイト内検索エンジンのデータベースに送るか決めて、更にどのタイミングで送るのかも決めておく事になります。連携方法はAPIかもしれませんし、バッチかもしれません。方法というよりは、タイミングを担当者は知っていないと意味がありません。1日1回なのか更新があった時に行われるのか等。
かな変換
データベースに登録する際に、「かな」で登録をするのか「カナ」で登録するのか決めないといけないタイプのものもあります。
もしくは、両方ともをいれないといけない場合のものも古いものはありました。
例えば、「りんご」ではヒットするけど「リンゴ」ではヒットしないでは意味ありませんよね。このように「かな」と「カナ」の検索の違いがあるのかどうか把握しておきましょう。
小書き文字の認識
例えば、スキーウェアの「ウェア」を検索エンジンのデータベースでは「ウェア」として認識されているのか、それとも「ウエア」で認識しているのか、確認が必要です。
「ウェア」ならヒットするけど「ウエア」だとヒットしないとなると面倒です。
また、「ウェア」と「ウエア」は認識するけど、「うえあ」と「うぇあ」は認識したり、「うぇあ」のみ認識したりと、いろいろ面倒な部分があるものもあります。
濁音の整合性
よくあるのが「ブリヂストン」と「ブリジストン」。正しいのは、「ブリヂストン」ですが、「ブリジストン」で検索する人の方が多い場合もあります。
これの解決方法をどうするか?という事も決めないといけません。
辞書登録でカバーするのか(ブリジストンとブリヂストンは同じであると認識させる)、連携される項目でカバーするのか(例えば、metaキーワードを連携もしくはクロールさせるようにしておいて、metaキーワード内にブリジストンとブリヂストンの両方を入れておく)、「ジ」と「ヂ」は同じに見なすとさせるのか、方法を考えた時にいろいろとあります。
自社で使っているサイト内検索エンジンがどの仕様なのか、把握しておく事が重要です。
形態素の把握
これは普通の担当者だと少し面倒です。
「東京都に行く」という言葉があった時に、いろいろと意味が取れるというものです。
「東の京都に行く」「東京、都(みやこ)に行く」「東京都 に行く」
もっと分解出来ますが、最初の3文字だけでもシステムは認識するのが一苦労です。
あくまでも例なので、実際にはもっと複雑だったりもすれば単純な場合もあります。
どこでキーワードを分割して検索するか?という事を考えるのが厳密には異なりますが、形態素の仕組みと考えると解りやすいと思います。
形態素がいい加減だと検索にヒットしなかったり、逆にヒットしすぎたりと問題が出てきます。
辞書登録の仕組み
サイト内検索エンジンには辞書登録という機能が通常ついています。ただし、その方法がエンジンにより異なります。
例えば「赤」という言葉に辞書登録で「レッド」「ルージュ」「マゼンダ」「マジェンダ」「緋色」「朱」を登録する場合、どのように登録をしないといけないのか、把握している必要性があります。
また、先に「レッド」と「ルージュ」は登録しておいたけど後で「緋色」「朱」も登録するとした場合の方法も。
まとめ
他にもサイト内検索で気をつけないといけない部分はありますが、代表的なものはこれくらいでしょう。
また、辞書登録は行いすぎるとSEO的にはマイナスになります。濁音の整合性と同じように、metaタグで持つようにした方が、良い事があります。
最低限、特殊な単語でもmetaタグに入っていれば、上位には入らないかもしれませんが、ヒットする可能性は上がります。
きちんと、サイト内検索エンジンの調整を行い、CVRのアップを目指しましょう。
© 2015 suzukidesu, ALL RIGHTS RESERVED.
文章並びに画像等、すべての著作物の盗用&不正利用・転載を禁止します。特にまとめサイト(NAVER・RETRIP等)での使用を固く禁止します。また、無断で使用した場合は使用料を請求いたします。詳しくはこちらのエントリーをお読み下さい。