みなさんこんにちはこんばんは、翻訳カフェです。

今回は運営の平岡が自身の博士研究のテーマであるプリエディットについてお話します。

プリエディットは原文にある機械翻訳が苦手な言語表現を編集することで機械翻訳のアウトプットの質を向上させる作業のことを指します。

プリエディットを対象とした研究はこれまで数多くなされており、省略された主語を補完する、句読点を追加する、長文を分割する、などの様々な手法が提案されてきました。

しかし、機械翻訳の進化により、その苦手が克服されつつあります。

例えば、主語が省略されていても文脈から補完して翻訳してくれる場合があります。以下はGoogle翻訳による訳文です。原文の2文目では主語の「開発チーム」が省略されており、1年前のGoogle翻訳は誤って「you」を主語として補完しているのに対して、現在のGoogle翻訳は「they」と補完するようになりました。

原文開発チームから要請がありました。新しいシステムを導入したようです。
Google翻訳(2022年12月)It was requested by the development team. It looks like you have installed a new system.
Google翻訳(2023年12月)There was a request from the development team. Looks like they‘ve introduced a new system.

また、省略されている主語は何かをChatGPTに尋ねると正しい回答が返ってきます。

これらの事例を見ると、主語を補完することはもはや不要に思えます。はたまた、プリエディット自体が不要になってしまったと言えるかもしれません。不要でないとしても、これから求められるプリエディットは違うものかもしれません。

これからのプリエディットはどのようなものであるべきか、プリエディット研究において追究すべき問いとは何か。

これまでと現状を整理しながら、皆さんと議論したいと思います。

キーワード:プリエディット、機械翻訳、大規模言語モデル、制限言語


スピーカープロフィール:大阪府出身。立教大学異文化コミュニケーション研究科 博士後期課程在籍。修士(関西大学外国語教育学研究科通訳翻訳学領域)。研究の傍ら、コーディネータ業と翻訳に従事。