2025年12月15日の翻訳カフェでは、「大規模言語モデル(LLM)は多様な翻訳仕様に追従できるか?」をテーマに、国立情報学研究所(NII)で研究を行う翻訳カフェの会員様でもある萱野さんをゲストに迎えました。
アフタートークでは、単なる技術論にとどまらず、翻訳学の知見をいかに最新のAI研究に融合させるか、そしてAIが先行する翻訳業界が示す「社会の未来」について、非常に深い議論が交わされました。
1. 翻訳学とNLPの融合:従来の評価指標を超えて
今回のセッションの核となったのは、自然言語処理(NLP)分野で長年使われてきた評価指標に対する、翻訳学の視点からのアプローチです。
- NLP評価指標への違和感: 研究者の萱野さんは、NLP分野で標準的な「BLEUスコア」や「METEOR」などの指標が、翻訳の「目的」や「仕様」を十分に反映していないことに違和感を持ち、研究をスタートさせました
- スコポス理論の適用: 翻訳研究における「目的(スコポス)から評価する」という概念をLLMの翻訳に適用し、AIが「意味(Meaning)」と「形式(Style)」をどのように扱っているかを分析しています
- 実務への響き: この研究は、上場企業のIR資料(統合報告書)を題材にしており、AI翻訳と人間翻訳を「仕様の有無」で比較しています。この実務に即した視点が、多くの翻訳実務者に強く響く内容となりました
2. 翻訳業界は「AI社会の3年先」を行っている
運営メンバーの間では、翻訳業界がAIによって激変した歴史を振り返り、現在の状況が他の産業にとっても「先行事例」であるという認識が示されました。
- トランスフォーマーの起源: AIの基盤技術であるトランスフォーマーが翻訳分野から生まれたことを再確認し、翻訳業界はすでに5〜7年前に「AIによる破壊的変化」を経験済みであると指摘しました
- AIリテラシーの成熟: 混乱期を抜けつつある翻訳業界では、今や「AIをどう使いこなすか」という議論が社会全体よりも数年早く、かつ深く行われています
- 価値観の逆転現象: IR翻訳の例では、クライアント(企業)の顔色を伺いすぎる人間よりも、純粋にオーディエンス(読者)を向いて翻訳仕様を守るLLMの方が、読者から高く評価されるという、人間社会のしがらみを浮き彫りにする興味深い結果も語られました
3. 評価の倫理と「誰のための翻訳か」
議論の終盤では、AIが社会の意思決定に関わる中での「評価の公平性」という重いテーマにまで及びました。
- LLM as a Judgeの危うさ: 評価者(ジャッジ)としてのLLMが、特定のバイアスや政治的意図に染まったとき、何が「正しい翻訳」とされるのか。5年後、10年後のAI社会が直面する倫理的課題が議論されました
- 文系知の投入: 技術一辺倒になりがちなAI研究の現場に、翻訳学のような「文系の知」を投入し、人間中心の評価軸を構築することの重要性が強調されました
- 人間への帰着: 翻訳の出発点も最終的な目的地も「人間」であるというスタンスを維持し続けることこそが、AI時代における翻訳の価値を守る唯一の道であるという確信が共有されました
今回のトークは、翻訳の技術だけでなく、その先にある「言葉の重み」と「社会における役割」を再考させる、極めてアカデミックかつスリリングな時間となりました。
本編では、萱野さんの詳しい研究のお話や生成AIと翻訳に関する議論などより詳細な内容をご覧いただけます。ぜひアーカイブにてご確認ください。
本アフタートークの全編は、こちらからご覧いただけます。