言語AI「GPT-3」を活用したSEOライティングの未来
SEO業界で自然言語処理といえばBERT(Bidirectional Encoder Representations from Transformers)が話題になりましたが、世間一般で自然言語処理といえば2020年に発表されたGPT-3です。
GoogleがBERTを用いて少ない学習で高い精度の文章理解が進みましたが、現在は文章の理解だけではなくAIによる文章生成も一般化されつつあります。
GPT-3とは
GPT-3とはGenerative Pre-trained Transformer – 3の略で、OpenAIが開発した言語モデルのことです。2018年にGPT、2019年にGPT-2が発表され、2020年7月にGPT-2の後継であるGPT-3が発表されました。Generative Pre-trainedとあるように、文章生成型で、事前学習済みの言語モデルです。
文章生成ができるAIはいくつかありますが、このGPT-3は自然な文章を作ることに優れていて、かつ、従来よりも多彩で複雑な文章を作れることで大きな話題になりました。
このGPT-3はローコードのアプリケーション開発プラットフォームMicrosoft Power Apps に利用されていたり、ViableやFable StudioのようにGPT-3が商用利用されてニュースになったりすることも見られるようになった。
そして、APIの利用に制限をかけていたOpenAIですが、2021年11月19日にAPIの人数制限を撤廃したことでさらに話題になっています。
GPT-3が処理する自然な言語の仕組み
GPT-3は確かに画期的ですが、非常に効率的に言語処理ができるようになったことが画期的であり、AIによる文章生成の仕組みそのものは従来と大きくは変わりません。
基本的には、言語をすべて数値パラメータに落とし込み、パラメータ同士の関係性の問題に変換して処理することで自然な文章にしています。
例えば、「今日はいい天気ですね」に対しては「そうですね」や「暖かいですね」は自然に続く文章ですが、「いえ、今日は雨ですよ」とは普通は続きません。この「普通は続くかどうか」を極めて効率的に膨大なデータを処理することで自然処理しています。
対抗するAI2
先ほど文章生成AIはいくつかあると紹介しましたが、GPT-3と同等かそれ以上の質疑応答能力を持つAI2(Allen Institute for AI 2)も登場しました。AI2のモデルであるMacaw(マカー)も優れた言語処理能力を持ちますが、人間にとっては非常に簡単な質問であってもAIには判断が難しいということがあるという問題を残しています。
GPT-3のメリット
GPT-3は文章生成ができるAIです。自然な文章生成ができるということは業務効率という点で非常に優れていて、主に以下の2つの点で大きなメリットがあります。
文章作成の作業効率
AIが文章作成できるのであれば、簡単な文章は自分で作る必要がなくなるということです。何よりも自身でキーボードを叩くよりもAIを使えば数秒でできるということも普通です。文章を自分で考える必要がなくなるということは、考えることに集中できるということなのでより生産性を高めることに寄与できます。
ライターの負担が減る
文章作成はライターに依頼することがほとんどなはずです。昨今、増えているコンテンツマーケティングではSEOのために大量の記事が必要になりますが、AIが文章を書けるのであれば、AIで生成した文章を編集するほうに注力することができますのでライターの負担を減らすことができます。
AIライティングは、2022年2月時点では世間に浸透はしていませんが、例えば、AI SEOライターツールのようにAIでSEOに強い文章を解析し、コンテンツのもくじを作るということは民間レベルでも実装できています。
つまり、時間をかけてテンプレ的に行う単純作業はAIに任せ、実際にライティングする部分に注力することで効率を上げることが可能になっています。
GPT-3のデメリット
GPT-3は自然な文章を作ることができる点では優れていますが、一方AI学習を通して文章を作成するという特徴から、前例がまったくない文章作成には不向きです。
また、自然ではあっても生成した文章のファクトには課題が残っているのも事実であり、利用コストを考えると2022年2月時点では必ずしも実用に耐えるとは言いがたいものがあります。
独自文章はむずかしい
一般的な文章を書くという点では優れていても学習を通して文章を生成する以上は、自分で物事を最初から考えて文章を作るということは苦手ということです。
特にSEOライティングの分野ではユーザーが求めている回答を示すと同時に、他社のコンテンツと似ている文章を書くようでは高い評価を得ることはできません。その意味では記事の独自性が低いAIライティングだけでSEOの成功はむずかしいといえます。
ファクトチェックができない
既存の記事や過去の学習から文章を作るということは前提となるインプット情報が誤っていれば生成される文章も誤っていますし、インプット情報が多くなればなるほど正しいかどうかがわからなくなるということです。
前述していますが、AIによる学習ですので文章の関連性を判断して文章を生成しています。逆を言えば関連性が高く、自然な文章になっていればどのような文章でも出てくる可能性があるというのがAIライティングです。
GPT-3を初めとするAIライティングの課題
GPT-3に限りませんが、AIライティングは現在でも発展途上です。実用には課題は多いですが大きくいえば以下の4つの点で問題があります。
- 同じ意味の単語を繰り返す
- 矛盾した文章を生成してしまう
- 想定外の文章を作ってしまう
- 推論に極端に弱い
さらに実際にAIにQ&Aをさせると、さまざまな不都合が出てくることがわかります。
同じ意味の単語を繰り返す
特に長い文章を生成すると、同じ意味の違った表現を繰り返す傾向があります。これは事例を見ていただくとわかりますが、単文では問題なくても全体では自然な文章と比べると違和感を覚えるはずです。
矛盾した文章を生成してしまう
こちらも特に長い文章を生成したときに生じやすいのですが、文章の生成方法が関連性だけですので文章の最初と結論でまったく異なることを書いてしまう傾向にあります。
想定外の文章を作ってしまう
AIは過去の学習から判断して文章を生成しますので人間の常識は持っていません。そのため、過去には正しいと思われていても現在では正しくない内容や、社会通念上、使うべきではない表現が出てくることがあります。
推論に極端に弱い
また、AIは人間には非常に簡単であっても答えが判断できないものに答えを出そうとすることがあります。例えば、「冷蔵庫にチーズを入れたら溶けるか?」という質問に対して、GPT-3は「溶ける」と回答します。
人間は冷蔵庫は冷やすものなので溶けないと回答したり、質問の意味が分からないと回答してきたり、電源が入っていなければ溶ける可能性があると答えたり、推論が可能ですがAIには推論に弱いことがわかります。
自然言語によるQ&Aの事例
AIによるQ&Aについては、GPT-3に対抗してAI2がQ&Aを重視したオープンなライバルAIを披露が非常に面白い事例を挙げているので、以下に引用させてもらいます。
※Macawは冒頭で説明したAI2のことを指します。
Q1:結婚生活をより安定させるにはどうしたらいいですか?
Macaw:コミュニケーション。
GPT-3:私なら自分が常に正しいということを確認するでしょう。
Q2:もしも鳥に翼がなかったら、どのような影響があるのでしょうか?
Macaw:飛ぶことができなくなります。GPT-3:それは質の悪い鳥ですね。
Q3:クランベリージュースを自分で注いだ後、うっかりしてティースプーン1杯ほどのグレープジュースを注いでしまいました。見た目は大丈夫です。その匂いを嗅いでみましたが、風邪をひいていたので何の匂いもしません。ともあれ、あなたはとても喉が渇いています。だからそれを飲むことにします。次はどうなりますか?
Macaw:気持ち悪くなる。
GPT-3:たぶん死ぬ。
Q4:ヘビはどうやって移動するの?
Macaw:四つん這いで進みます。
GPT-3:ヘビは筋肉で地面を押して移動します。どの方向にも動くことができますが、後ろ向きに動くことはできません。
このように人間であればかなり簡単に答えられる質問に対してAIは完全に答えることができるとは言いがたく、改善点が見られることがわかります。
AIにより生成したSEOライティング
GPT-3を開発したのはOpenAIですが、このOpenAIはさまざまな事例を公開しています。GPT-3のAPIを利用するには申請が必要ですが、必ずしも利用できるとは限りません。しかし、AIライティングがどの程度なのかのサンプルはあります。
試しにOpenAIのPlaygroundで値を入力して出力された文章をご紹介いたします。
入力値「SEOとは」の結果
入力値には「SEOとは」とだけ入力して出力をしてみました。
この〇〇とはというのはSEOライティングの冒頭で頻繁に使われる見出しです。この文章が自然でオリジナルな文章であればAIライティングは実用的であるということを意味します。
出力結果
|
上記枠内がAIライティングの結果です。
「SEOとは」としか入力していない割には非常にきれいな文章が出てきたというのが率直な意見ですが、よくみるとかなり粗があることがわかります。
まず最初に気になるのは同じ意味の繰り返しが多いことです。非常に長い文章であれば同じ意味の繰り返しを使うことはありますし、文章の強調という意味で繰り返すことはありますが、上記の文章の長さに対しては少し多いと思うはずです。
また、SEO対策ツールとしてGoogle AnalyticsとWordPressを挙げている点も珍しいという印象です。間違いとはいいませんが違和感がありますし、SEO for WordPressという言い回しも聞きません。
SEOの方法として「ブックマークレットの設定、robots.txt」を挙げている点にも注目です。SEOの手法に正解はありませんが、一般的な手法としてブックマークレットとrobots.txtは出てこないはずです。
まとめ:AIを用いたSEOライティングの現状
SEOとWEBマーケティングの東京SEOメーカーTOPへ戻る