東京、5月10日(時事通信) – 東京工業大学、富士通株式会社などの研究チームは金曜日、日本のスーパーコンピューター「富岳」を利用して、生成型人工知能の基盤として役立つ大規模な言語モデルを開発したと発表した。
富岳LLMモデルは、全トレーニングデータの60%を占める日本語データで徹底的にトレーニングされており、国内のニーズに合わせた生成AIの研究につながることが期待されています。
東北大学、名古屋大学、理化学研究所、サイバーエージェント、コトバテクノロジーズの研究者も加わった研究者らは、富士通と理化学研究所が共同開発したスーパーコンピューターを活用したプロジェクトを2023年5月に開始した。
俳句の巨匠・松尾芭蕉の詩に関する質問に流暢に答えることで、富岳LLMの高い日本語能力が実証されたという。
継続的な学習を採用する日本語対応の他のモデルの多くとは異なり、富岳-LLMは有害なデータを含まないチーム独自のデータを使用してゼロからトレーニングされるため、学習プロセス全体が理解でき、透明性と安全性の点で優れていると彼らは述べた。
[著作権:時事通信社]

元記事: https://www.nippon.com/en/news/yjj2024051001084/japan-team-develops-ai-foundation-with-fugaku-supercomputer.html