BERTとは?Googleが導入した自然言語処理技術による変化
Googleは2019年10月25日に自然言語処理技術のBERT(バート)を取り入れました。当初は英語圏に限定されていましたが、2019年12月10日には日本でもGoogle検索エンジンに導入されています。
世間を騒がせたBERTアップデートは過去最大のアップデートともいわれ、メディアでも大きく取り上げられました。
BERTアップデートにより検索結果の10%に影響が及ぶとされていました。しかし、会話型の長いクエリであっても高い精度で検索結果が返されるようになったため、結果的にはSEO対策がしやすくなったという声もあります。
BERTとは
BERT(バート)とは、Bidirectional Encoder Representations from Transformersの略でTransformerというAIを使った深層学習モデルにより、双方向でエンコードできる表現のことを意味します。
※エンコードとは、データを別の形式に変換することを意味します。
BERTは自然言語処理技術(Natural Language Processing、NLP)の一種であり、自然言語処理とは人間が使う言葉をコンピュータに理解させる技術のことです。
つまり、Googleが検索エンジンにBERTを導入したということは、人間の言葉をより深く理解し、検索結果として表現できるようになったということです。
BERTによる文章理解
BERTは自然言語処理技術のなかでも特に文脈を理解できるのが大きな特徴です。従来のGoogleエンジンでは単純に入力されたキーワードに関係するページを検索結果として返してきましたが、BERTが使われるようになってからは文章を理解したうえでユーザーが満足する結果を返すようになりました。
具体例については、Googleが非常にわかりやすい例を挙げていますのでご紹介いたします。Googleのブログ記事 Understanding searches better than ever before では次のように説明されています。
Here’s a search for “2019 brazil traveler to usa need a visa.” The word “to” and its relationship to the other words in the query are particularly important to understanding the meaning. It’s about a Brazilian traveling to the U.S., and not the other way around. Previously, our algorithms wouldn’t understand the importance of this connection, and we returned results about U.S. citizens traveling to Brazil. With BERT, Search is able to grasp this nuance and know that the very common word “to” actually matters a lot here, and we can provide a much more relevant result for this query.
概要は「2019 brazil traveler to usa need a visa.」というキーワードで検索すると本来は「a Brazilian traveling to the U.S.」の検索結果を出さなければいけないのに、BERTアップデート以前は「U.S. citizens traveling to Brazil」の結果が出ていたというのです。
元の検索クエリは「2019年のアメリカに行くブラジル人旅行者にはビザが必要」であるのに対し、アップデート以前は「ブラジルに行くアメリカ人市民」の検索結果を返していたものが、アップデートにより正しく反映されるようになったとあります。
これは検索クエリの brazil traveler to usaの文脈を理解せずに単語だけを拾った結果の誤りですが、BERTにより正しく文章を理解しているということがわかります。
BERTは自然言語処理技術のなかでも、特に文脈を理解(文法の理解)が得意であることがわかる例です。
BERTが導入された理由
BERTが導入された理由は検索クエリを正しく理解し、ユーザーの満足する検索結果を返すためです。つまり、ユーザーファーストを貫いた結果です。
しかし、BERTを導入した理由はもう1つ、音声検索への対策だとも推測されます。
日本ではまだ音声検索の普及率はそこまで高くはありませんが、世界的には音声検索の普及率は非常に高く、ComScore社によれば2020年までに検索50%が音声検索になると指摘されているほどです。
余談ですが、ComScore社によれば上記の2020年までに検索の50%が音声検索になるというデータは公開されておりません。2014年時点でBaidu検索のうち10%が音声検索であることが知られていて、このままの普及が進めば5年で検索の50%が音声検索や画像検索になると予測があったことが多少、誤って伝播したものと推測されます。
参考:
|
音声検索が普及することそのものは正しい推測であり、人の言葉を正しく理解することは正しい結果を返すためには必須といえます。
AlexaやAndroidの「OK Google」、Appleの「Hey Siri」のような音声検索システムの利用が進むほど、話し言葉での検索が広まることから文脈を正しく理解する検索エンジンが必要になったこともBERT導入の理由の1つだと考えられます。
BERT導入による検索結果の変化
Google公式ブログ Understanding searches better than ever before には上記のブラジルの例以外に4つの事例を掲載しております。
検索ワード:do estheticians stand a lot at work
Previously, our systems were taking an approach of matching keywords, matching the term “stand-alone” in the result with the word “stand” in the query. But that isn’t the right use of the word “stand” in context. Our BERT models, on the other hand, understand that “stand” is related to the concept of the physical demands of a job, and displays a more useful response.
Googleによれば、以前は「エステシャンは長時間立つのか?」という問に対して、standをstand-aloneと紐づけて孤立と誤解して検索結果を返していたが、BERTにより改善したとあります。
検索ワード:Can you get medicine for someone pharmacy
With the BERT model, we can better understand that “for someone” is an important part of this query, whereas previously we missed the meaning, with general results about filling prescriptions.
以前は一般的な処方箋の書き方を検索結果に出していたが、文章のキーになる for someone pharmacyの部分を正しく認識できるようになりました。
検索ワード:parking on a hill with no curb
In the past, a query like this would confuse our systems–we placed too much importance on the word “curb” and ignored the word “no”, not understanding how critical that word was to appropriately responding to this query. So we’d return results for parking on a hill with a curb!
以前はhill(坂道)は理解していたものの no curb(縁石のない)を理解せず、curb とだけ認識していたため、単に坂道の駐車方法を返していました。改善後は縁石のありなしを意識した結果になっています。
検索ワード:math practice books for adults
While the previous results page included a book in the “Young Adult” category, BERT can better understand that “adult” is being matched out of context, and pick out a more helpful result.
大人向けの数学の本を探しているクエリですが、以前はadultsを重要視せずに中学生向けの数学の本を結果に出していましたが、BERTにより改善しました。
BERTアップデートへのSEO対策は必要ない
Googleのコアアルゴリズムアップデートが起きるたびに、今回のアップデートにはどのように対策すればよいのかという情報が出回りますが、BERTアップデートは文章を正しく理解することができるという点での改善ですのでSEO対策による改良点はありません。
まとめ