コピペチェックの仕組みや回避方法とは?コピペチェックツールを紹介
ユーザーが求めるのは、専門的で権威性があり信頼できる情報です。Googleの検索品質評価ガイドラインでも「ページ品質評価の最重要項目」として設定されています。
コピペチェックとは
コピペチェックとは作成した記事が、ほかの記事内容から無断で引用されていないかチェックすることです。引用や参照が正しく行われているのかもチェックが欠かせません。
- コピペチェックの重要性
- 記事の内容が著作権を侵害していないか確認
- コピペしたつもりはなくてもチェックは重要
コピペチェックの重要性
記事を作成する機会が増えると、情報を無断引用するコピペも増えてきました。コピペされている記事をそのまま掲載すると、著作権侵害で訴えられるリスクがあります。Googleにペナルティを課せられて、表示順位が落ちる可能性もあるのです。
そのため、記事が納品されて掲載する前に、記事の内容がコピー&ペーストされていないかチェックしなくてはなりません。
記事の内容が著作権を侵害していないか確認
記事の公開に関する責任は、記事を公開した会社に帰属します。文章や画像やイラスト、表などの各種データを使用するには著作権法を遵守しなくてはなりません。
ほかのサイトや書籍で掲載している内容を無断引用していないかチェックします。文章の場合、文頭や文末の一部内容を変えただけの文章もコピペ扱いとなります。文章以外にも記事内で使用している表やデータ、画像やイラストもコピペチェックが必要です。
ほかのサイトや書籍などから引用している場合、引用ルールに則っているか確認します。文章だけでなく使用している画像やイラスト、データや表などもオリジナルなのか、引用ルールに則っているか確認します。
コピペしたつもりはなくてもチェックは重要
最近は、インターネットの情報を集めて記事をライティングする機会も増えてきました。テキストをコピーしたつもりはなく、自分の言葉で文章を書いているつもりでも、無意識に表現が似てしまう場合もあります。
オリジナルの文章を書いているつもりでも、検索エンジンはコピペと認識してしまうので、コピペと認識されないためにもコピペチェックは必要です。
コピペすると晒されるリスク
コピペすると次のようなさまざまなリスクに晒されます。
- Googleからペナルティを受ける
- 検索結果で上位表示されない
- ユーザーに信用されず閲覧してもらえない
- 著作権侵害として処罰される場合もある
無断でコピペした文章や画像やデータが著作物だった場合、著作権を侵害したとして刑事罰に問われるリスクもあります。民事責任も追求される可能性があり、コピペした部分の削除が求められます。
Googleからペナルティを受ける
Googleからペナルティを受ける理由として、Googleはページ検索品質評価における最重要項目のなかで、コンテンツは無断複製されたものではないことが含まれています。Googleが考える無断複製されたコンテンツの例としては、次のものが挙げられます。
- 他のサイトのコンテンツをコピーし、独自のコンテンツや付加価値を加えることなく転載しているサイト
- 他のサイトのコンテンツをコピーし、(語句を類義語に置き換えたり自動化された手法を使用したりして)若干の修正を加えた上で転載しているサイト
- なんらかの独自の体系付けやユーザーへの利便性を提供することなく他のサイトからのコンテンツフィードをそのまま掲載しているサイト
- ユーザーに実質的な付加価値を提供することなく、他のサイトの動画、画像、その他のメディアなどのコンテンツを埋め込んだだけのサイト “
出典:無断複製されたコンテンツ(Google 検索セントラル) | Google Developers
検索結果で上位表示されない
検索結果で上位表示されないというリスクもあります。Googleは独自性のあるサイトで、専門性が高く権威性の強いサイトを評価します。ほかのサイトの情報をコピペして記事を掲載しても、ほかの情報との関連性が無ければ重複コンテンツとして認識され、上位表示されません。
無断複製とみなされペナルティを課せられるだけではなく、著作権侵害として訴訟される場合もあります。
ユーザーに信用されず閲覧してもらえない
ユーザーが情報検索して記事を閲覧するのは、課題解決や情報を集めるのが目的です。1つの記事で情報を知りえない場合は、関連している情報を探します。コピペ元の記事には、記事を元に関連した内容も記載されています。ユーザーの課題を解決する記事がGoogleに評価されるためです。
コピペした記事は情報の一部分のみ引用しているので、情報が網羅されておりません。ユーザーは知りたい情報を得られないため、信用されず閲覧数も減少していきます。
著作権侵害として処罰される場合もある
コピペした記事を掲載すると無断で引用した記事が著作物の場合、著作権侵害にあたります。著作権侵害が認められると刑事罰の対象になる可能性もあるのです。ほかには民事責任も追求されます。
コピペチェックの仕組み
コピペチェックの仕組みですが、文章に関してはチェックツールを使うのが便利です。
チェックツールに文章を読み込ませます。チェックツールは読み込んだ文章から重要な単語と、その単語が多く含まれる文節を検索します。重要な単語が多く含まれるWEBページを複数取得したのち、あらかじめ読み込んだ文書と、チェックツールが検索した文章データを比較します。
記事をテキストで貼り付けるだけで、類似度や一致度のチェックが可能です。学生の論文の剽窃(ひょうせつ)チェックができるツールもあります。画像の無断引用をチェックできるツールもありますが、Google画像検索でコピペチェックすることも可能です。
表やデータはほかのサイトから引用や参照しているのか、引用の記載が正しくされているか確認します。表やデータを画像形式で引用している場合は、Google画像検索でコピペチェックする方法があります。
コピペチェックツールといっても複数のツールがあり、どれを使用すべきか悩みます。ツールの選定は3つのポイントに分けて考えると選びやすくなります。
- 費用とチェック可能な文章量とのコスパ
- チェック可能な文字数の制限
- ツールの使用時にストレスがないか
費用とチェック可能な文章量とのコスパ
費用とチェック可能な文章量とのコスパを考えなくてはなりません。コピペチェックツールには無料のものと有料のものがあります。無料のツールは一度にチェックできる文字数の制限があります。
文字数や1日にチェックできる回数など、文章量や回数のコスパをみながら選ぶのがベストです。
チェック可能な文字数の制限
コピペチェックツールには1回にチェックできる文字数および回数が決められているものがあります。有料版に変更すると1回にチェックできる文字数が5,000字以上になるツールもあります。ただし、なかには有料版に登録しても1日に数回、もしくは1ヶ月に数回と回数に限りがあることもあります。事前に確かめなくてはなりません。
ツールの使用時にストレスがないか
コピペチェックでツールを使用するときにストレスがないかは重要なポイントです。チェックの結果が出るまでに数時間かかるようなツールだと、1日にチェックできる記事数が限られてしまい非効率です。
有料版を導入するならば、事前にトライアルでお試し利用するなど、操作性にストレスを感じないか実際に記事チェックを試す必要があります。
コピペチェックツール
ここでは、コピペできる無料ツールから有料ツールまで紹介します。
コピペチェックツール
ツール名称 | 無料 or 有料 |
こぴらん | 完全無料 |
CopyContentDetector | 無料・有料どちらも有り |
コピペリン | 有料(年間6,000円) |
剽窃チェッカー | 無料 |
コピペルナー | 有料 |
chiyo-co | 無料・有料 |
Plagiarism Checker.co | 有料 |
こぴらん
こぴらんはブックマークレット機能があり、リリース後の記事もチェック可能です。チェックスピードが速く検索結果はシンプルでわかりやすく、初心者でも安心して使えるツールです。
- 料金:無料
- 文字数制限:25字~4,000文字
- 回数制限:無制限
- 判定速度が早い。
- 完全コピペの文章をチェックできます。
Copy Content Detector
Copy Content Detectorは無料で4000字、有料版は8000字までコピペチェックできます。ブラウザ上に文章を貼り付けするだけでなく、テキストとCSVをファイル形式で読み込みできます。有料版ではWordPressのプラグインも用意されています。
調査対象テキストにチェックしたい文章を貼り付けて、規約に同意してコピペチェックをクリックします。チェックしたい文章に似ている内容や一致している文章がWEB上にないかを調べられます。
評価は3段階で「コピーの疑い」「要注意」「良好」の3つです。コピーの疑いや要注意が表示されたら、詳細表示で内容を確認します。詳細表示では次の色合いを参考に見ていきます。
- 赤色:完全一致
- 黄色:一部一致(コピーの可能性が高い)
- 青色:一部一致(コピーの可能性が低い)
Copy Content Detecterの料金表
無料プラン | 個人向けライトプラン | 個人向けレギュラープラン | |
料金形態 | 無料 | 1,000円/月(税込) | 6,000円/月(税込) |
文字制限 | 4,000字まで | 8,000字まで | 8,000字まで |
回数制限 | 1日30件 | 1日200件 | 1日500件 |
記事チェック数 | 最新10件まで | 月50記事または4万文字 | 月200記事または16万字まで |
剽窃チェッカー
剽窃チェッカーは従来、学生のレポートのコピペチェック用のツールでした。機能や見た目はこぴらんと同じく、チェックしたい文章をページに貼り付けてボタンを押すだけです。
2000文字以内であれば無料です。一致率や類似率は表示されず、検索結果のURLが表されるだけです。文章をひとつずつチェックしていくので、結果が表示されるまでとても時間がかかります。
検索エンジンの仕様変更にともない、コンマで区切らないとチェックができない仕様になってしまいました。入力可能な文字数は全角半角合わせて2,000文字以内、あるいは合計30項目以下と制限されています。
こぴぺりん
こぴぺりんは有料のコピペチェックツールで、年間6,000円で利用できます。運営会社は「サクラボ」です。
- レポート機能あり
- テキスト貼り付け機能
- 読み込み可能なファイルの種類が豊富
- テキスト貼り付け機能
- スピードが速く無制限で利用可能
コピペルナー
コピペルナーは、学生がレポートや論文の不正引用を防ぐ目的で開発されたコピペチェックツールです。
コピペルナーは、コピペ判定支援ソフトです。学生がレポートや論文などを作成する際、インターネットや知人の文章から不正な引用(コピペ)を行うことが社会問題となっていることから、金沢工業大学知的財産科学研究所長の杉光一成教授がしくみを考案し、株式会社アンクが開発しました。(特許登録済 特許第5510912号)
引用:株式会社アンク:コピペルナ―(株式会社アンク)
大学でのレポートや論文のチェックや、社内論文や出版社での原稿のチェックにも利用できます。導入しているのは全国の大学や官公庁・企業などの団体に導入されています。ライセンスは一般企業版とアカデミック(大学など)版の2種類です。
chiyo-co
以前は影武者というサービス名で親しまれておりましたが、名称変更されてchiyo-coとなりました。運営は株式会社CROCOが行っています。テキストのコピペチェックと類似チェックも行えます。Copy Content Detecterと似たような機能です。
会員登録すると10カウント分(1000文字で1カウント)まで無料で使えます。解析には時間がかかるので、終了次第メールで届く仕組みになっています。チェックにかかる時間は10分ほどです。
プラン | 料金形態 | 回数制限 |
無料プラン | 0円/月(税込) | 10カウント/月(1万文字まで) |
プラン100 | 4,400円/月(税込) | 100カウント/月(10万文字まで) |
プラン500 | 16,500円/月(税込) | 500カウント/月(50万文字まで) |
プラン2000 | 55,000円/月(税込) | 2000カウント/月(200万文字まで) |
剽窃チェッカー
剽窃チェッカーは、plagiarismchecker.coが運営しているチェックツールです。文法チェックツールやリライトツールも兼ね備えています。さらに、コンテンツを1行ずつ詳細に分析もでき、WEBサイト全体の掲載内容を重複チェックするなどの機能もあります。
剽窃チェッカー料金プラン
プラン | 検索件数 | 料金 | 検索あたりの単語数 |
基本 | 150 | 15ドル | 1,000 |
ビジネス | 150 | 20ドル | 1,500 |
企業 | 400 | 50ドル | 2,000 |
コーポレート | 120 | 120ドル | 10,000 |
コピペが発覚した場合の適切な対処とは
Copy Content Detectorをもとに納品された記事をチェックして、コピペが発覚した場合の対処方法を解説します。まずコピペであると認定する基準を定めなくてはなりません。Copy Content Detectorで文章をチェックすると、良好、要注意、コピーの疑いと3段階で結果が表示されます。一致率は50%以上で要注意と表示されます。
Googleが重複コンテンツと判断する基準は明確でありません。重複コンテンツと認識されないようにしなくてはなりません。それぞれの記事内容によって一致率や類似率の基準は異なりますが、納品される記事はCopy Content Detectorで要注意判定が出ていないことが望ましいです。
類似率・一致率とは
コピペチェックツールを使ってチェックする際、指標となるのは類似率と一致率です。類似率はWEB上に似ている文章がないかをチェックします。一致率は単純な文章(キーワードも含む)の一致率を計算します。
Copy Content Detectorでの類似度判定は、語尾を変えているだけの文章では類似度が高いと判断されます。一致率は文章単位ではなくキーワード単位で判定されます。キーワードが頻出するような記事だと一致率が高くなるのは必然です。
コピペチェックで注意することとは
文章の類似率は文章単位で類似しているかをチェックします。類似率が高いのは記事制作の際、参考にしているサイトの文章を元に書いてしまっているからなので、修正しなくてはなりません。
ただ、類似率は低くても一致率が高いと判定された際は注意しなくてはなりません。一致率の計算はキーワード単位で判定されるため、キーワードが頻出すると一致率が高いと判断される場合もあるのです。
また画像やイラストのコピペチェックも重要です。画像やイラストには著作物として著作権が発生しているものがあります。引用する際は、著作権者の引用ルールに従わなくてはなりません。
一致率の高さをもとにキーワードを削るのは注意が必要
専門分野の記事や解説系の記事で、ほかの言葉に置き換えようのないものは一致率が高くなります。一致率が高いからといって、一致率の高いキーワードを削りすぎるのは注意が必要です。
キーワードを削り語尾の言い回しを変えるだけではなく、オリジナルの文章を追加したり、箇条書きにする、表やデータを追加することで、一致率を下げることもできます。
記事制作を依頼する際は、記号の使用や語尾の言い回し、箇条書きや表を活用するなどの方法を確認し、類似率や一致率が下がるような基準を決めてください。
まとめ
制作した記事や納品された記事がコピペと定めた数値を超えた場合の対処方法はいくつかあります。
- 一致率判定されているキーワードの使用頻度を削る
- 同じような意味をもつ単語に変更する
- オリジナルの要素を追加する
一致率判定されているキーワードは無意識に使いすぎている可能性があります。使用回数を減らすと一致率が改善される可能性もあります。ただ削りすぎには注意が必要です。
記事のジャンルによってはむずかしい場合もありますが、同じような意味をもつ単語に変更するのも1つの手です。記事のなかにオリジナルの要素を追加すると類似度や一致率が下がります。
画像やイラストも著作権があるものの引用は注意しなくてはなりません。文章のコピペチェックはツールでできますが、画像やイラストのチェックができるツールの数は多くありません。Google画像検索でチェックしてコピペを回避してください。