こんにちは、渡邉です。

第20回の配信では、機械翻訳の研究者であり開発にも携わられている中澤 敏明さんにお越しいただきました。

最初に、情報学の分野のひとつである自然言語処理について説明してくださいました。自然言語処理というのは、人間が話す言語をコンピュータで処理するということです。自然言語処理における最大の難しさは、ことばの曖昧性だそうです。

例えば、「外国人参政権」を機械で処理すると、「外国/人参/政権」と読み取る可能性があります。人間が言語を理解する際には当たり前のように文脈を考慮していますが、機械に処理させる際には、その当たり前も客観的に定義していかなければなりません。

ひとつの言語でも曖昧性をはらむのに、機械翻訳となると二言語を扱うことになるので、非常に難しい研究分野であるというお話でした。

さらに、山田先生との対談では機械翻訳(の研究者)は何を目指しているのか、という踏み込んだ質問にも答えていただきました。研究者としては、原文と訳文の対が正解であることを前提におき、その参照訳(テストセット)をいかに再現するかということを目標においているということでした。

この「機械翻訳が目指すところ」という議題の中で、開発者や研究者と翻訳者の、アイデンティティやことばに対する思いの違いについて面白いお話をうかがうことができました。

他には以下のようなことについても情報やお考えを共有していただきました。

  • 機械翻訳の基礎的な仕組み
  • 機械翻訳に使われているコーパスの出どころ
  • 研究に使用するコーパスの種類(それに対する研究者としてのジレンマ)
  • ポストエディット/ポストエディターについて

盛りだくさんですね。機械翻訳研究の第一線でご活躍されている中澤さんならではのお話をたくさんうかがうことができ、すごく勉強になりました。

ご興味おありの方はぜひ、アーカイブをご視聴ください。

また、来週も中澤さんにお越しいただくので、聞いてみたいことなどある方はぜひ、来週リアルタイムでご参加ください☺

今週はQ&A セッションだったので、来週はみなさんとディスカッションをする時間を設けられたらと思っています☺

\みなさまのご参加をお待ちしております!/