生成型 AI ツールは、ジャーナリストにとって毒杯とみなされることが多々あります。大規模言語モデル (LLM) からの応答は偏っていたり信頼性が低かったりすることが多く、画像ジェネレーターは重大な倫理的および著作権上の問題を抱えています。加えて、人間の指や手をレンダリングする際に信頼性が低いことで有名です。一方、AI チャットボットは非常に奇妙で、最近の調査によると、現金インセンティブや「物理的な」脅迫を提供するリクエストプロンプトによって、これらのロボットがより良い結果を出すように説得できるそうです。
しかし、データ ジャーナリズムの専門家は、無料または手頃な価格の AI ツールを賢く慎重に使用することで、調査プロジェクトの前段階に劇的な効果をもたらし、データの効率、主題のブリーフィング、コードのトレーニング、コスト削減、公開文書の要求を促進できると述べています。特に、データ コードとスプレッドシートの数式を生成する信頼性の高い AI ツールにより、データ レポーターはジャーナリズムに多くの時間を費やすことができ、技術的なトラブルシューティングやコーディング作業に費やす時間を減らすことができると専門家は述べています。
2024 NICARデータジャーナリズムカンファレンスのAIツールに関するいくつかのセッションで、データの専門家たちは「なぜジャーナリストはAIを使うべきなのか」というより広範な疑問に取り組みました。
サミットの週に、ブルームバーグは NICAR の参加者 2 名による調査結果を発表しました。この調査では、LLM の問題の一部が明らかにされており、ChatGPT が、典型的には少数派グループに関連付けられる応募者名が記載された同一の職務経歴書に低いランクを割り当てていたことが示されています。
ザ・マークアップの調査データ記者、ジョン・キーガン氏は、記者や編集者は、AIの効率性を活用し、精度、偏見、倫理に関する多くの落とし穴を避けるために、いくつかの基本的なステップを含め、AIへのアプローチを体系的に行う必要があると述べた。
「これらのツールはジャーナリズムの代用ではありませんが、プロジェクトをより速く、より野心的にすることができます」とキーガン氏は説明する。「しかし、これらのモデルの中には、衝撃的な倫理的欠陥があるものもあります。これらは非常に奇妙なツールです。ある瞬間は素晴らしいのですが、次の瞬間には、衝撃的な愚かなことを思いついたり、単にでっち上げたりするのです。」
データ ジャーナリズムを強化する AI 駆動型ツール、ヒント、コツに関する別のセッションでは、4 人の専門家がジャーナリストにとってのこのテクノロジーの長所と短所について議論し、自信を持って推奨できるツールのリストを共有しました。
講演者には、テキサス・トリビューンのビジュアルジャーナリズム編集長ダーラ・キャメロン氏、ミネアポリス・スター・トリビューンのデータジャーナリスト、ジェフ・ハーガーテン氏、MITテクノロジーレビューのジャーナリズムフェロー、ジューン・キム氏、ジャーナリストツールボックスAIの創設者でデータジャーナリズム講師のマイク・ライリー氏が含まれていた。
ジャーナリストのツールボックス.AI。画像: NICAR スライドショー提供
「データ ジャーナリストとして直面する非常に大きな課題のいくつかを AI が拡大し解決するのに役立つかもしれないことに興奮しています」とキャメロン氏は語ります。「しかし、テクノロジー企業からは『この AI ツールを使うべきです。ジャーナリズムの向上に役立ちます』という声がよく聞こえてきます。私たちジャーナリストは、ジャーナリズムのニーズを最もよく主張できる存在です。ベンダーが私たちのニーズを教えてくれるのを全面的に信頼するのではなく、まずは私たちのニーズを定義しましょう。」
NICAR の講演者の間では、ジャーナリストが一般的に避けるべき AI の使用例について合意が得られました。
レイリー氏は、偏った結果のリスクを減らす方法の1つは、AIチャットボットへのプロンプトに多様性と信頼できる情報源を要求することだと述べた。「画像生成器に刑務所の囚人の画像を生成するよう依頼すると、有色人種が出てくる傾向がある。法学修士にラブストーリーを書くよう依頼すると、異性愛者のラブストーリーを書くだろう」と同氏は警告した。「プロンプトには具体的に多様性と正確さを要求しなければならない。すべてを過剰に説明しなければならない」
しかし、講演者は、LLM チャットボットやニッチな AI ツールが、特にコードや散在するデータ ソースの取得に関して、調査にどのように役立ったかについても多数の例を挙げました。
「データジャーナリズムに携わって10年になりますが、そのうちの60%はトラブルシューティングやコーディングソリューション、データ分析ソリューションの検討に費やされたと言ってもいいでしょう。こうしたツールを使えば数秒で解決できるものもあります」とハーガーテン氏は言う。「テクノロジーよりもジャーナリズムの技術にもっと集中できます」
パネリストが推奨した AI ツールの一部を紹介します。
ジャーナリストによってジャーナリストのために作成された Rolli ツールは、AI テクノロジーを使用して、プロジェクト データを安全に保ちながら、重要なレポートの課題を解決します。
国際ジャーナリストセンターのLEAPイノベーションラボと共同で開発された新しいRolli Information Tracerは、ソーシャルメディア上の偽情報キャンペーンを追跡するアルゴリズムを使用している。同サイトでは、その連携の検出方法について次のように説明している。「オンラインキャンペーンの背後にある不正な行動を特定するために、一連の技術的シグナルを開発しています。研究機関や人道支援機関と協力して、世界中の偽情報の物語を監視しています。」
「Rolli には本当に興奮しています」と Reilley 氏は言う。「Information Tracer はあらゆる種類の偽情報の拡散者を追跡します。これは今、大きな選挙の年なので本当に重要です。また、分析をアカウント レベルまで細分化する技術も追加され、ボットかどうか、発信元はどこの国かがわかるようになります。とても素晴らしいです。」
彼はこう付け加えた。「『プレスパス』の無料プランに1年間登録してください。コードを求められたら、『JOURNOAI』と入力してください。」
ライリー氏は、関連ツールの「Rolliapp」が便利な専門家検索データベースを提供し、締め切りまでに記者と専門家の情報源を結びつけるのに役立つと述べた。
Rolliapp AI ツール。画像: NICAR スライドショー提供
「このツールは、Excel の数式を書くのに役立ちます」と Hargarten 氏は説明します。「これまで使った中で最も複雑な数式をいくつか出力します。自分で書こうとすると、何時間もかかってしまいます。シンプルで、あまり指示を必要としないところが気に入っています。Airtable と Google Sheets の設定もあります」。さらに、「このツールは、徹底的な企業調査を遅らせることになる、非常に面倒なトラブルシューティングの多くを回避します」と付け加えました。
「これは私の人生を最も変えた AI ツールです」と Hargarten 氏は続けます。「必要なコードを何でも吐き出すように指示できます。私はこれを使って Python スクレイパーを作成しました。スクレイピングしたい URL と HTML 構造ページのサンプルを入力するだけで、ほとんど編集することなく、ほぼ完璧なスクレイパーをすぐに作成できます。複雑な Mapbox の問題のトラブルシューティングもできます。」
同氏はさらにこう付け加えた。「GitHub 全体の支援を受けており、これまでのところ私が与えたどんなことでも困惑したことはありません。」
キーガン氏も同意しました。「GitHub Copilot は、ジャーナリストが今日から実際に使い始めることができる優れたツールの 1 つです。これは便利なドロップイン ツールです。小さなウィンドウを呼び出し、コマンドを入力すると、コードが表示されます。」
講演者らは、このツールの使用は記者がコーディングスキルを学ぶのにも役立つと述べた。GitHub Copilot の試用版は無料で、その後は月額 10 ドルの費用がかかる。
GitHub CoPilot AI ツール。画像: NICAR スライドショーより提供
「データを学ぶ学生に LLM を使用するときは、必ず 3 つの LLM を使用させて、そのタスクにどれが最適かを比較します」と Reilley 氏は説明します。
「ChatGPT の操作には一種の芸術があり、これは間違いなく非常に幅広いツールです。得意なこともあれば、そうでないこともあります」とハーガーテン氏は言います。「しかし、言語ベースであれば、究極的にはほぼ何でもできます。私は、正しい法律などを引用して、正しい形式で完璧な公的文書の要求を生成するためにこれを使用しています。時には、私の名前を署名して連絡先を入力することさえあります。もちろん、それも恐ろしいことです。」
この新しいチャット インターフェースは、NICAR 2024 で、複雑なテーマや馴染みのないテーマに関する優れたブリーフィング ツールとして、経験豊富な調査ジャーナリスト数名に感銘を与えました。検証済みのデータの直接的なソースではありませんが、複雑な調査の質問に対して簡潔でほぼ信頼できる回答を提供し、権威あるソースの厳選リストや役立つフォローアップの質問の提案も提供します。初期のユーザーによると、他の AI ツールとは対照的に、このインターフェースは、ツールが誘導したい場所ではなく、ユーザーが行きたい場所へ誘導する傾向があります。
「『パープレキシティ』は、引用や関連する次の質問によって複雑な質問を理解する能力を養います」と、CUNY のクレイグ・ニューマーク ジャーナリズム大学院の教育学ディレクター、ジェレミー・カプラン氏は言う。「美しく表現されており、非常に具体的な例を示しており、すぐに理解を深めるのに非常に役立つツールです。」
カプラン氏はこう付け加えた。「私が本当に気に入っているのは、一連の質問が用意されていることです。どの段階でも検証する能力を維持しながら、徐々に主題に対する理解が深まっていきます。」
商用 LLM チャットボットに関する大きな懸念の 1 つは、これらのクラウドベースのサービスにおけるソース データのセキュリティに関する不確実性であり、もう 1 つは個人による制御が欠如していることです。
まさに技術的な驚異として、Mozilla Innovation Project は、LLM を 1 台のコンピューターまたは USB スティックに完全にオフラインで直接管理して保存できるオープン ソース ソリューションを開発しました。
ツール専門家のサイモン・ウィリソン氏はブログのレビューで、Llamafile は本質的に「ChatGPT のローカルコピー」のようなものだと述べています。
「これは単一のバイナリ ファイルで、ダウンロードすれば、ほぼすべてのコンピューターで永久に使用できます」と彼は書いています。「ネットワーク接続は必要ありません。このファイルを USB スティックに保存し、将来の終末に備えて引き出しにしまっておけば、言語モデルがなくなることはありません。」
キーガン氏は次のように語っています。「このツールは他の人の成果に基づいて構築されていますが、チャット インターフェイスを備えた自己完結型 LLM である単一の実行可能ファイルをコンピューター上に配置できます。インターネット接続はまったく必要ありません。」
キーガン氏は、当初は 4 ギガバイトのサムドライブに LLM 規模の計算能力が備わっているとは信じられなかったと告白したが、これは「ベクトル化」などの複雑なプロセスによって可能になり、うまく機能していると述べた。「これを使用すると、外部の情報に対してより安心できます。」
Commons Project の新しいツールは、米国に限定されているものの、ほとんどの国のデータ ジャーナリストが AI チャット インターフェイスを使用して独自のデータ ツールを構築し、大規模な政府 Web サイトを解析する方法を示しています。この場合、ジャーナリストは、政府の規制について国民が述べた内容の膨大な米国アーカイブを掘り下げる AI ツールを構築しました。これは、コロンビア大学ジャーナリズム大学院とスタンフォード大学工学部の共同作業で構築されました。
「これは GPT を利用したツールで、regulations.gov に投稿された連邦規制に関するパブリック コメントをジャーナリストが分析するのに役立ちます」とキム氏は説明します。「担当記者であれば、新しい規制について人々が何を言っているかを知りたいはずです。データはありますが、20 万件のコメントを精査するのは困難です。このツールは、「EPA の新しい排出規制について最も多くのコメントを寄せている組織はどれか」といった質問に答えるのに役立ちます。」
このツールのメンテナンスを担当するキム氏は、これまでツール開発者としての個人的な経験はなかったという。同氏は、システム構築の過程で、LLM ヘルパーの威力と驚くべき限界、そして商用 AI ツールの開発者と直接コミュニケーションを取る必要性が明らかになったと語った。
コモンズ プロジェクトの AI ツール。画像: NICAR スライドショー提供
「開発者に『これはどうやって作ったのか? 問題点は何か?』と聞いてみてください」と彼女はアドバイスする。「自分たちでツールを作る前は、こうした大規模な AI ツールにどのような欠陥があるのか、具体的に理解していませんでした。」
キャメロン氏はこう付け加える。「最終的には、ジャーナリストにとってこれらのものが信頼できるものになるため、そして素材が著作権で保護されていないと安心できるようにするためには、ジャーナリストである私たちが独自の AI 空間を作成する必要があるでしょう。」
ローワン・フィルプは GIJN の上級記者です。以前は南アフリカのサンデー・タイムズ紙の主任記者でした。外国特派員として、世界 24 か国以上でニュース、政治、汚職、紛争などを報道してきました。

この作品はクリエイティブ・コモンズ表示-改変禁止4.0国際ライセンスの下でライセンスされています。

Creative Commons ライセンスに基づいて、当社の記事をオンラインまたは印刷物で無料で再公開できます。

この作品はクリエイティブ・コモンズ表示-改変禁止4.0国際ライセンスの下でライセンスされています。

専門家は、AI 駆動型音声ディープフェイクが 2024 年の民主主義と公正な選挙に大きな脅威をもたらす可能性があることに同意しています。
この円卓会議では、データ ストーリーを作成するために最前線に登場しているツールと今後の予測について議論し、カンファレンスのデータ トラックを締めくくります。次のアイデアをぜひお持ちください。 ———————– Global Investigative Journalism Network は、ジャーナリズム組織の国際協会です […]
アマゾンにおける組織的な土地収奪と違法採掘を暴露した調査活動を行っている2人の記者が、その情報を共有します。
無料または低コストで利用できる、公開されている AI 検出器によって提供される結果を評価および理解する方法に関する洞察を提供します。

元記事: https://gijn.org/stories/new-ai-large-language-model-tools-journalists/