• Jared Coleman氏と彼の指導教官であるBhaskar Krishnamachariは、言語(人間とコンピューターの両方)への共通の愛で結ばれている。
  • コールマン氏は、オンラインでOwens Valley Paiuteという言語のクラスを取り始め、この言語の機械学習モデルのトレーニング用に英語に翻訳されたPaiuteの文が公に利用可能でないことを指摘。
  • 新しい論文「LLM-Assisted Rule-Based Machine Translation for Low/No-Resource Languages」では、Coleman氏とKrishnamachari氏がLLM-RBMT(ルールベース機械翻訳)と呼ばれる機械翻訳手法を提案。
  • 彼らのアプローチは、ルールベースの翻訳ツールと高度な自然言語ベースのLLMを組み合わせており、LLMはルールベースシステムが正確な翻訳を生成するのをサポート。
  • この翻訳ツールは、複雑な文を簡略化し、未知の単語に対して英単語をプレースホルダーとして使用。この方法は、既知の単語と未知の単語を混ぜて話すことで、言語学習者が自然に話す方法と一致。

この研究は、極めて危機に瀕した言語を活性化する際にLLMが有望なツールであることを示しており、今後の研究方向に多くの可能性がある。

コールマン氏は、彼の研究を大きなパズルの一部と位置付け、部族のメンバーや過去の人々に感謝を表明。

元記事: https://techxplore.com/news/2024-06-student-ai-tool-revitalize-endangered.html