複数の参照訳を考慮したニューラル機械翻訳モデルの学習手法 (main author)

Abstract

文の翻訳では訳者や文脈などの条件により異なる訳文が期待され,機械翻訳タスクのベンチマークに用いられる対訳コーパス内にも一つの原文に複数の参照訳が対応している例が多く存在する.一方で既存の機械翻訳モデルの学習手法ではこうしたコーパス内の構造は明示的には用いられない.そこで本研究では,コーパス内の原文が複数の参照訳を持っているという情報を,機械翻訳モデルの学習に明示的に用いる手法を提案する.評価実験において,提案手法を用いて学習したモデルは旧来の最尤誤差損失のみを用いたモデルに劣る結果となったが,提案手法が文レベル最適輸送損失を用いて学習するモデルの性能向上には寄与することが示された.

Publication
In 言語処理学会第29回年次大会
MIYAZAKI Keisuke
MIYAZAKI Keisuke
Corporate researcher

Corporate researcher in Fujitsu Limited. Interested in NLP.