人間みたいに英語を翻訳してくれるAI翻訳の仕組みを解説

スポンサーリンク
自動翻訳・AI関連

最近、Google翻訳の性能が一気にあがりました。自動翻訳でも、人が訳してくれたような品質の翻訳が仕上がるようになりました。そのため、実用の場でも使われるようになっています。

なぜ、最近の自動翻訳の精度がこれほどアップしたのかというと、「ディープラーニング」というこれまでとは違う開発方法を使っているからなんです。この方法を使うことで、人が学習するのと同じように、機械も学習していくことができます。

ただ今現在のところ、自動翻訳にも欠点はあります。まだ人がチェックしないと、とんでもない誤訳をすることもあります。

ですがこのまま進化が進んでいけば、翻訳コンニャクのように、外国語をすべてカンペキに翻訳してくれることになるかもしれません。そうなると、英語の学習は不要になる、といった可能性も考えられます。英語を学習する意義ってあるのかどうか、英語学習者にとっては気になりますよね。

今回はこのAI自動翻訳が今までとどう違うか、その仕組みと、今後の英語について、見ていきます。

スポンサーリンク

ディープラーニングの仕組み

実は、昔から自動翻訳技術はありました。なのに、なぜいま自動翻訳・通訳が話題になっているんでしょう。

以前は、自動翻訳技術は機械翻訳、という呼ばれるのが一般的でした。ですが、それほど一般の人にまで広まっていませんでした。というのも、ぱっと実践に使えるほどの品質ではなかったからです。

とくに日本語の場合は、「ああ・・・これ、やっぱり機械が翻訳したよねー」というのがすぐ分かる、ちょっとがっかりな品質でした。

そこに変化が起こったのは、2016年11月。Googleが新しいエンジンをリリースしてからです。

これまでの流れをどう変えたのか、見ていきます。

それまでの機械翻訳~ルールベースと統計ベース

以前の機械翻訳は、ルールベースか統計ベース、または両方を組み入れた方法が用いられていました。

ルールベースは、元の文章を解析して、文法の規則に従って、翻訳文を作ります。

慣れると使いやすい面もありますが、文法ルールを追加していく手間がかかります。またルールどおりに訳すので、日本語としてはおかしな翻訳文ができたりします。

統計ベースは名前そのまま。

過去のデータベースを蓄積していき、そのなかから、統計的に一番使われてきたものを取り出し、翻訳文を作ります。良い翻訳を作るには、多くのデータが必要です。

それぞれ一長一短あるものの、以前はこういった方法が主流でした。

翻訳した結果、「やっぱり人が翻訳しないとおかしな文章になるんだよね」と言われることが多くありました。

ディープラーニングが可能にしたニューラル翻訳

それが変わったのが、ここ最近。AI翻訳の時代になってきてからです。

ディープラーニングによって、ニューラル翻訳が可能になったためです。

ディープラーニングとは、人間が物を学習するのと同じように、機械が物を学習することができる仕組みです。

たとえば、ネコを何度も何度も機械に見せると、機械は学習して自力で「猫」が分かるようになります。すると、たとえそれが、それまで見たことがないような角度の猫の写真でも、「これが猫だ」と判断ができるようになります。

これって、人間の子供だったら、ごく当たり前にできることですよね。

ですが、こういった「自分で学習して、文脈や情景から自分で判断する」ということは、以前は「機械には絶対無理!」といわれていたことでした。それが可能になったんです。

この猫の実験は、Google X lab というGoogle内の次世代技術の開発を担うプロジェクトチームで行われ、その驚きの実験結果は、2012年にニュースになりました。

参照元:OFFBEAT “Google X Lab proves that the Internet is really powered by cats

ディープラーニングが可能になったことで、機械は、教材を与えてあげれば、自分で学習して、進化していくことができるようになったのです。

学習する教材は、インターネット上にあふれています。Googleの技術を使えば、世界中のウェブサイトから情報を取ってくることが出来ます。

これだけの情報があふれているのは、人類史上、かつてなかったことです。

ちなみに今、もっともすごい教材として注目されているのは、動画。動画には、人の表情や背景など、文字情報以上に多くの情報がつまっています。そしてこの動画の宝庫といえるのがYoutube。

機械は、このものすごい量の情報を短期間で吸収し、賢くなっていくことが可能な世の中になったのです。

ニューラル翻訳の性能

このディープラーニングの手法を翻訳技術に取り入れることで、人間のような自然な翻訳が可能になりました。

このディープラーニングの技術を用いた翻訳エンジンを「ニューラル翻訳」と言ったり「AI自動翻訳」と言ったりします。

実際にどんな翻訳が可能になるのか、見てみます。先ほどご紹介したサイトの最初の文章を、オンライン上のGoogle翻訳エンジンで訳してみますね。

【翻訳を行ったサイト:https://translate.google.co.jp】

翻訳は、不自然ですね。この翻訳を公の資料にする場合には、手直しが必要です。ただ、意味はなんとなくわかりますね。

「とにかくぱっと 意味だけしりたい!」という場合には、これで通じます。たとえば自分用に資料を読みたいときや、メールを翻訳したいときなど。こういった用途では、すでに機械翻訳は使われています。

ちなみに、現在、Googleだけではなく、世界の機関や会社がニューラル翻訳エンジンの開発をすすめており、性能はどんどん進化しています。

ニューラル翻訳の欠点

性能がかなりよくなったニューラル翻訳ですが、もちろん、まだカンペキとはいえません。現在のところ、次のような弱点があります。

■前項で見た通り、まだ手直しをしないと正式な文書として通用しません。この手直しの部分が文書によってはかなり時間がかかる、ということもありえます。

■翻訳されるとき、ごそっと原文から抜け落ちてしまう部分があることが確認されています。困ったことに、機械の訳した翻訳結果が自然であるほど、人間にはミスが見つけにくい、ということが研究により実証されています。

■会社で使う場合には、やっぱりオンライン上にデータをのせてしまうことにはセキュリティ上の不安や抵抗があります。だれでも無料で気軽に使えるクラウド翻訳サービスの弱点でもあります。

こういった弱点があるため、まだ利用には注意が必要です。また、現在のところ、これまでのルールベースや統計ベースのほうが上手に訳せることもあります。

ですが将来的には、こういった弱点は修正されていく可能性が高いです。

今後英語は必要なくなるの?

こんなふうに自動翻訳の性能があがっていくと、「近い将来、さらに自動翻訳の性能がよくなったら、英語を話す必要はなくなるのか?」という疑問がわきます。

それは、そうかもしれないし、そうでもないかもしれません。

つまり、「何のために英語を話すのか」によります。

旅行先で話すだけ、とか、社内会議で使う資料をざっと訳すだけ、といった場合には、機械で十分になっていきます。なので「海外旅行で話したい」ぐらいの人は、今後、外国語を学習するのは、英語学習に時間を使うのはもったいないかもしれません。

ですが、ビジネスで大事なパートナーの信頼を得たいとき、感情をゆさぶるプレゼンをしたいとき、好きな人に愛を伝えたいとき。

こういったときは、やっぱり、自分の言葉で伝えることの効果は大きいです。

「愛してる」って、自動翻訳に言われても、ぜんぜん、愛が伝わらないですよね。こういう本気のコミュニケーションレベルでは、今後も英語や外国語は必要だと思います。

政府としてもそういった状況を予想しているのか、日本では英語教育にさらに熱がはいっています。「英語を話せる人」を本気で増やしていくため、小学校で英語の授業を取り入れたことに続き、大学入試試験の英語にも変革がはじまっています。今後、若い世代は当然のように英語を話せるようになるかもしれません。

まとめ:翻訳こんにゃく時代の到来について

以前から機械による翻訳は可能でした。ルールベース・統計ベースという方法がとられていました。

ですがディープラーニングという技術により、ニューラル翻訳が可能になりました。機械が自分で楽手して性能をあげてくれるようになったのです。

このため自動翻訳の性能は一気にあがりました。

ただ、ニューラル翻訳にも、弱点はあります。たとえば、手直しをしないと使えないが、手直しに時間がかかりすぎることがある。また、ごっそりと翻訳されない部分があることがある。また、Googleの場合にはクラウド上で翻訳されるため機密性が高い文書は翻訳しにくい、といった部分です。

いまの段階では、いくら文脈が分かるようになったとはいっても、やっぱり人にはかないません。人間には全部の文脈に加えて、背景や、いろいろなことを考慮にいれて翻訳するスーパースキルがあります。

ですが、いちから人が翻訳するよりも機械が訳した結果をなおすほうが早い、という流れが進みつつあります。

近い将来、自動翻訳でコミュニケーションをとることが当たり前の時代になるでしょう。

ですが感情をうごかすレベルの意思疎通、本気でコミュニケーションをとりたいときには、やっぱり自分の言葉です。そういったレベルで外国語を習得できれば、あなたにとって大きな武器になります。AI翻訳

コメント