• 人工知能の使用が世界中で爆発的に増加しているが、技術の言語モデルは主に英語で訓練されており、他の言語話者が取り残されている。
  • スタンフォード大学の研究者たちは、人気のあるA.I.チャットボットに言語テストを行った。
  • 彼らは、ベトナム語でチャットボットに伝統的な詩を書くように依頼し、フォーマットに従う「song thất lục bát」として知られる形式の詩を書くように依頼した。しかし、チャットボットが詩を書いたものの、フォーマットに従っていなかった。
  • チームは異なるプロンプトを試し、母親の弟のベトナム語の適切な単語を尋ねると、父親の弟と兄弟の単語を返答した。
  • これらの欠陥は、研究者がクエリした人工知能会社AnthropicのチャットボットであるClaude 3.5に特有のものではないが、これらは人工知能が標準的なアメリカ英語以外の言語を誤解する方法の一部を示している。
  • 西側での人工知能の使用が急増している一方で、世界の残りの部分は英語で訓練された技術のほとんどのために会話から取り残されている。
  • 人工知能の専門家たちは、言語のギャップが技術の不平等を悪化させ、多くの地域や文化を取り残す可能性があると懸念している。
  • スタンフォード大学のStanford Artificial Intelligence LaboratoryのPh.D.候補であるSang Truongは、彼のチームが他の言語モデルと比較してベトナム語の言語モデルを構築してテストしたチームの一員として、「良い技術へのアクセスの遅れは、わずか数年でも経済の遅れにつながる可能性がある」と述べている。
  • 彼らのチームが実施したテストでは、ベトナム語を扱う際にA.I.ツール全般が事実や言葉遣いを誤ることがわかり、それは業界基準では「低リソース」言語であるためだと考えられる。これは、A.I.モデルが学習するための十分なデータセットやオンラインコンテンツが利用できないことを意味する。

私の考え:
この記事は、人工知能の言語モデルが主に英語で訓練されており、他の言語に取り残されているという問題を示しています。ベトナム語などの「低リソース」言語では、人工知能が事実や言葉遣いを誤ることがあることが明らかになっています。このような言語の不平等は、技術の進展において重要な問題であり、解決策が必要だと感じます。

元記事: https://www.nytimes.com/2024/07/26/technology/ai-language-gap.html