Google翻訳、新たに110言語を追加 対応言語の合計は243言語に
Google社は、Google翻訳の対応言語を拡大し、新たに110言語を追加したことを2024年6月に発表しました。
参考(外部):110 new languages are coming to Google Translate
近年のGoogle翻訳では、AIモデルを用いた翻訳方法を導入しています。たとえば、2022年には、1,000言語に対応するAIモデルの構築を目指す旨を公にしました。今回追加された110の言語も例にもれず、大規模言語モデル(LLM)のPaLM 2を応用したことで実現したとしています。
関連記事:Google翻訳とは 使い方を徹底解説
AI技術で1,000言語の翻訳を目指す
2022年5月に、Google社は、ゼロショット機械翻訳と呼ばれるAIを応用した翻訳技術を用いて、24言語をGoogle翻訳の対象言語に追加しました。
さらに、同年11月には、1,000言語の翻訳を実現するためのAIモデルを構築して、Google翻訳で世界中の数十億人ものコミュニケーションをサポートする計画を発表しました。今後もAI技術を使って、対応できる言語を増やしていくとしています。
参考(外部):Google Translate learns 24 new languages
参考(外部):3 ways AI is scaling helpful technologies worldwide
Google翻訳にて、広東語など110言語が新たに対応
Google社は、Google翻訳に新たな110の言語を追加対応したと2024年6月27日(現地時間)に発表しました。今回の追加により、Google翻訳の対応言語は、合計で243言語に増えました。
参考(外部):110 new languages are coming to Google Translate
新たに対応した110言語を話す人口は、世界中で6億人以上に上るとのことです。これは、世界人口の約8%に相当するといいます。今回のアップデートによって、その世界人口の約8%もの人々のコミュニケーションをサポートすることになります。
PaLM 2で対応できる言語が大幅に増えた
今回新たに対応した110言語というのは、Google翻訳としては最多の追加数となります。この背景としては、Google社が開発した大規模言語モデルのPaLM 2の導入にあります。PaLM 2は、似ている言語や関連性が高い言語の翻訳技術に対応でき、新言語の追加に大きく貢献しました。
たとえば、今回新たに追加された広東語は、数千万人から1億人近くの話者を有していて、世界的に主要言語として位置付けられます。そのため、広東語をGoogle翻訳に追加してほしいという要望は多数あったようです。ただし、広東語と北京語では、テキストベースで重複するケースが多く、これまではAIモデルに学習させるうえで、難易度が高かったとのことです。しかし、大規模言語モデルのPaLM 2がこの課題を解決してくれ、Google翻訳の対応言語として追加が実現しました。
また、今回追加した110の言語のうち、4分の1の言語がアフリカ大陸で使われる自然言語となっています。アフリカでは、非常に多数の言語が使われていることで知られています。とくに、アフリカ人は、日常生活の中で、1人で複数言語を話します。こうした環境から、類似点が多い言語もあるのですが、これらをPaLM 2が解決して、大量の言語の対応を可能としました。
追加言語の一例
今回追加された言語のうち、話者数が多いものとして、次のようなものが挙げられます。
追加された言語 | 話者が生活する地域や人口 |
---|---|
広東語 | 地域:中国(広東省や珠江デルタ地区)
人口:数千万〜1億人程度 |
パンジャブ語(シャームキー語) | 地域:インドとパキスタン(パンジャーブ地方)
人口:1億〜1億数千万人程度 |
アワディー語 | 地域:インドやネパールなど
人口:2,000万人前後 |
なお、新たに追加された110のすべての言語は、下記リンク先の記事で公開されています。
参考(外部):What’s new in Google Translate: More than 100 new languages
Google翻訳の対応言語の拡大による影響
Google翻訳で新たに110言語が追加されたことで、さまざまな影響がでると推測できます。
- 世界規模でGoogle翻訳の利用者数が増加する
- 海外進出、渡航予定のある人にとって重宝する
- PaLM 2の導入で、翻訳精度が高まる可能性がある
このほか、次のとおり、Google翻訳が進化することが予測されます。
- 今後も対応言語が増加すると見られる
世界規模でGoogle翻訳の利用者数が増加する
新たな言語の話者は、世界で6億1,400万人以上存在します。そのため、新たな言語を母国とする人々がGoogle翻訳を利用することが予測されます。
たとえば、数千万から1億人程度の話者数を有する、広東語、パンジャブ語、アワディー語などでGoogle翻訳が利用されることが見込まれます。この3つの自然言語の話者を有する国家として、中国とインドが挙げられます。そして、Statista Japan社調査の2023年のインターネットユーザー数国別ランキングによると、中国とインドのインターネット人口数が世界的にも上位を占めていることがわかっています。
引用:各国のインターネットユーザー数2023年 | Statista
海外進出、渡航予定のある人にとって重宝する
これから、Google翻訳の対象言語に追加された言語を母国語とする地域に海外進出や渡航の予定がある日本人にとって、有意義なアップデートとなりました。
とくに、日本にとって馴染みの深く、都市としても発展している香港やマカオなどで広東語が話されています。こうした地域には、観光とビジネスの両面において、日本人が接するシーンが見受けられますので、Google翻訳でコミュニケーションをとる機会が発生すると推測されます。
PaLM 2の導入で、翻訳精度が高まる可能性がある
今回の新たな言語対応を実現した背景として、大規模言語モデル(LLM)のPaLM 2の存在が大きく寄与しています。そして、Google翻訳にPaLM 2を導入したことで、翻訳自体の精度が高まると期待されています。
Google社で人工知能の開発を手がけるGoogle AIが発表したPaLM 2の技術レポート(PaLM 2 Technical Report)によると、PaLM 2がGoogle翻訳を上回る精度で翻訳できるという研究結果が残っています。
これまでは、Google翻訳を利用したときに、適切な翻訳テキストが生成されないケースが見受けられました。しかし、PaLM 2を導入したことで、Google翻訳における翻訳の精度そのものが向上する可能性があります。
今後も対応言語が増加すると見られる
今回の110言語の追加によって、Google翻訳では、総合で243言語をカバーすることになりました。しかし、Google社は、1,000言語の翻訳をカバーするAIモデルの構築を目指すと発表しています。こうした考えから、今後も同ツールの対象言語が増加していくことが予測されます。
さらに、AI技術は、近年でもっとも注目を集めるジャンルの1つに位置付けられます。たとえば、世界な大企業のGoogle、OpenAI、Microsoft、Apple、Metaなどが競うようにAI開発に取り組んでいます。こうしたAI技術の発展は、Google翻訳の対応言語の増加を後押しする材料になりそうです。
Google翻訳の対応言語のよくある質問
Google翻訳の対応言語に関する、よくある質問をまとめています。
Q:Google翻訳は、なぜ対応言語を大幅に増やせたのですか?
Answer)Google翻訳に大規模言語モデルのPaLM 2が導入されたことから、似ている言語や関連性を持つ言語の学習と識別を実現しました。そのため、これまでは難しいとされていた類似性を持つ自然言語を大量に追加することができました。
Q:Google翻訳の対応言語は、どの程度ありますか?
Answer)2024年7月現在では、Google翻訳において対応しているのは合計243言語です。
Q:Google翻訳に追加される言語は、どのような基準で決定しますか?
Answer)原則的には、ユーザーのリクエストが多い言語、話者が多い重要な言語、技術的に導入可能な言語がピックアップされます。ただし、話者が少ない言語、方言、絶滅危機に瀕している言語も文化の保護の観点などから、Google翻訳の追加対象となります。
Q:Google翻訳に対応しているすべての言語を確認する方法はありますか?
Answer)Google翻訳で言語を切り替える際に、すべての対象言語が表示されます。
2022年に、Google社は、Google翻訳の対象言語は133言語である旨を発表しています。この数に今回の110言語を加えると、合計で243言語になります。さらに、この243という数は、Google翻訳で確認できる言語総数と一致しています。
参考(外部):Google翻訳
Q:いまだにGoogle翻訳がサポートしきれていない言語の種類や地域はありますか?
Answer)話者が少ない言語や発展途上国の言語には対応できていないものが多々あります。
たとえば、2024年6月に、多数のアフリカ言語をGoogle翻訳の対象に追加しましたが、少数民族の言語などに対応できていません。また、そもそも、Statista調査の2024年1月時点のアフリカのインターネット利用者の国別シェアが示すように、アフリカ大陸では、インターネットの普及率が低い国家も多数存在します。こうしたデジタルインフラの面も課題として残っています。
Q:Google翻訳を利用するためには、どのようなツールがありますか?
Answer)Google翻訳を利用できるツールは、WEBサイト版、モバイル向けのアプリケーション、ブラウザ一体型(または拡張機能)などの種類にわかれます。詳しくは、別記事で解説しているので参考にしてください。
関連記事:Google翻訳とは 使い方を徹底解説
まとめ