木. 6月 25th, 2026

ハーバード大学、法学修士課程の研修に使える 100 万冊の書籍のデータセットを公開 | IBL ニュース

ByManagetech

12月 20, 2024

要約：

ハーバード大学は、今月、100万冊のパブリックドメインの本の高品質データセットを発表しました。
このデータセットには、Google Booksプロジェクトの一環としてスキャンされた本が含まれており、シェイクスピア、チャールズ・ディケンズ、ダンテなどの名作が含まれています。
このデータセットは、ハーバード大学の新しく設立されたInstitutional Data Initiativeによって、マイクロソフトとOpenAIからの資金提供で作成されました。
誰でもこのデータセットを使用してLLMや他のAIツールを訓練することができます。

感想：

これらの新しいパブリックドメインデータセットの登場は、AIモデルを構築する際に著作権物を盗用する必要がないことを示しています。AI企業が著作権のある作品をスクレイピングしてモデルを訓練するための「必要性の弁明」をさらに無効にしています。

元記事: https://iblnews.org/harvard-releases-a-dataset-of-one-million-books-that-can-be-used-to-train-llms/

By Managetech

Related Post

Immerso と Everdome が提携し、AI を活用した体験を通じてメタバースのイノベーションを推進 – Intelligent CIO APAC

2月 6, 2025 Managetech

Google が Gemini 2.0 Pro、Flash-Lite を発表、推論モデル Flash Thinking を YouTube、マップ、検索に接続 | VentureBeat

2月 6, 2025 Managetech

AIニュース: DeepSeekの躍進はAIの巨人に役立つだろうとウォール街のアナリストが語る – The Economic Times

2月 6, 2025 Managetech

You missed

AI software development

ホライゾンの俳優アシュリー・バーチは、ソニーのAIアロイのビデオを見て「ゲームパフォーマンスという芸術形式に不安を感じた」と語る – IGN

3月 18, 2025 Managetech

AI software development

JFrogとNVIDIAが提携し、安全なAI導入を強化

3月 18, 2025 Managetech

AI software development

Mistral AI が、わずかなパラメータで GPT-4o Mini を上回る新しいオープンソースモデルをリリース | VentureBeat

3月 18, 2025 Managetech

AI とヒューマノイドが 2025 年のロボットのトップトレンドに | ASSEMBLY

3月 18, 2025 Managetech