AI戦争は、大手テクノロジー企業がこぞってシェアを奪おうとして本格的に加熱しつつあります。実際に役立つAIアプリが数多く登場しているにもかかわらず、チャットボットに関しては主に2つの選択肢があります。もちろん、AIレースのスタートピストルとして機能したプログラムであるOpenAIのChatGPTがあります。しかし、Microsoftがその有望な技術に多額の投資をしたため、Googleもすぐ後に続きました。何年もの間、GoogleはAI研究のリーダーと見なされており、戦わずしてその称号を失うことはなかったのです。ChatGPTに対抗するため、この検索大手はGeminiをリリースしました。どちらの会社も最先端の技術を持っていますが、日常生活に関連するタスクに役立つ、有能で正確な大規模言語モデル(LLM)を求める人にとって最適なのはどちらでしょうか?どの会社の主力チャットボットが日常使用に最適かを判断するために、私はそれぞれの長所と短所を強調し、それぞれの能力を試すための一連の課題を作成することにしました。会話能力から問題解決能力まで、あらゆる点を検証した結果、意外な結論にたどり着き、何度も衝撃を受けました。ちなみに、この比較では、両方の AI の無料版のみがテストされたため、これらの結果は Gemini Ultra や GPT-4 を反映したものではありません。さっそく、結果を見てみましょう。

AI 戦争は、大手テクノロジー企業がこぞってシェアを奪おうとするなか、本格的に白熱し始めている。しかし、実際に役立つ AI アプリが数多く登場しているにもかかわらず、チャットボットに関しては主に 2 つの選択肢がある。もちろん、AI レースの先駆けとなったプログラムである OpenAI の ChatGPT がある。しかし、Microsoft がこの有望な技術に巨額の投資をすると、Google もそれに迫った。Google は長年 AI 研究のリーダーとみなされており、戦わずしてその称号を失うことはなかった。ChatGPT に対抗して、この検索大手は Gemini をリリースした。
どちらの会社も最先端の技術を持っていますが、日常生活に関連するタスクに役立つ、有能で正確な大規模言語モデル (LLM) を求める人にとって、どちらが最適でしょうか。どの会社の主力チャットボットが日常使用に最適かを判断するために、私はそれぞれの長所と短所を明らかにしながら、それぞれの実力を試す一連の課題を作成することにしました。会話能力から問題解決能力まですべてを見て、私はいくつかの驚くべき結論に達し、何度もショックを受けました。ああ、そしてこの比較では、両方の AI の無料バージョンのみがテストされたため、これらの結果は Gemini Ultra または GPT-4 を反映していません。さっそく、結果を見てみましょう。

2022 年後半、2019 年まで非営利団体だった OpenAI は、すぐにテクノロジー業界における新たな軍拡競争の先駆けと見なされるようになった LLM チャットボットをリリースしました。以前のバージョンの GPT は機能が限られていたため、単なる珍品と見なされていましたが、GPT-3.5 をベースにした ChatGPT は飛躍的な進歩でした。人々は、流動的で自然なテキストを生成しながら、一見無限の範囲の話題について会話する能力に驚愕しました。ボットが 2 か月の間に記録的な 1 億人のユーザーに急上昇したため、アナリストは、盗作、教育、雇用の将来に関する懸念が高まる中、ボットが世界を永遠に変えるだろうと予測しました。1 年半が経ち、ChatGPT は世界をひっくり返すことはありませんでしたが、生成 AI が今後も存在し続けることを証明しました。Microsoft は OpenAI と緊密に提携しており、Bing Chat、Copilot、その他の AI 製品に GPT-4 を使用しています。一方、印刷ジャーナリズムなどの業界は、ボタンを押すだけで無限のコピーやコードを生成できる機能によって揺さぶられています。また、OpenAI の GPT ストアフロントや独自のサービスを通じて、サードパーティが ChatGPT を自社製品に組み込むことも見られます。

2022年後半、2019年まで非営利団体だったOpenAIは、すぐにテクノロジー業界における新たな軍拡競争の先駆けと見なされるようになったLLMチャットボットをリリースしました。以前のバージョンのGPTは機能が限られていたため単なる珍品とみなされていましたが、GPT-3.5をベースにしたChatGPTは飛躍的な進歩でした。流暢で自然な響きのテキストを生成しながら、一見無限の範囲の主題について会話する能力に、人々は驚愕しました。このボットが2か月の間に記録的な1億人のユーザーに急上昇したため、アナリストは、盗作、教育、雇用の将来に関する懸念が高まる中、このボットが世界を永遠に変えるだろうと予測しました。
1年半が経ち、ChatGPTは世界をひっくり返すほどのことはしていませんが、生成AIが今後も存在し続けることは確かです。MicrosoftはOpenAIと密接な提携関係にあり、GPT-4を使用してBing Chat、Copilot、その他のAI製品を強化しています。一方、印刷ジャーナリズムなどの業界は、ボタンを押すだけで無限のコピーやコードを生成できることに衝撃を受けています。また、OpenAIのGPTストアフロントや独自のサービスを通じて、サードパーティがChatGPTを自社製品に組み込むことも見られます。

Google は、ChatGPT のリリースよりずっと前から、社内の研究開発の多くをこの分野に集中させており、AI レースでかなり有利なスタートを切っていると長い間考えられていました (ChatGPT のリリースの数か月前に、社内でテストされた AI モデルが Google 社員の 1 人にそれが知覚力を持っていると確信させたというニュースを覚えているかもしれません)。しかし、Forbes の調査によると、この検索エンジンの巨人は、少し人間っぽすぎるという理由であまり受け入れられなかった AI モデルで、やや困難なスタートを切りました。さらに、同社は、主な収益源である検索から人々を遠ざける製品をリリースするというアイデアと格闘しました。それでも、Google には守るべき評判があり、準備ができていようがいまいが、AI ChatGPT の競合 LLM である Bard を立ち上げ、基盤モデルをアップグレードするにつれて Bard AI を Gemini に改名しました。Gemini は OpenAI の ChatGPT と直接競合しており、Google は若い競合に対していくつかの大きな利点を持っています。最も重要なのは、Gemini が Google アカウントに接続できることです。これにより、メールの検索や Google マップの参照などの操作が可能になります。また、マルチモーダルであり、テキストだけでなく、画像、ビデオ、オーディオ、コードに基づいて処理および出力を作成できます。Google はモデルのスケーラビリティも自慢しており、Nano から Pro、さらには Ultra までさまざまなレベルでリリースしています。Google の幹部は、このモデルを可能な限り高性能かつ汎用的にすることが目標であると述べています。

Google は、ChatGPT のリリースよりずっと前から、この分野に社内の研究開発の多くを集中させており、AI 競争でかなり有利なスタートを切っていると長い間考えられてきました (ChatGPT のリリースの数か月前に、社内でテストされた AI モデルが Google 社員の 1 人に知覚力があると確信させたというニュース記事を覚えているかもしれません)。
しかし、Forbes の調査によると、検索エンジンの巨人は、AI モデルが少し人間的すぎるという理由であまり好評を得られず、やや不安定なスタートを切った。さらに、同社は、主な収益源である検索から人々を遠ざける製品をリリースするというアイデアと格闘した。それでも、Google には守るべき評判があり、準備ができていようがいまいが、AI ChatGPT の競合 LLM である Bard を立ち上げ、基盤モデルをアップグレードするとともに Bard AI を Gemini に改名した。
Gemini は OpenAI の ChatGPT と直接競合しており、Google は比較的新しい競合相手に対していくつかの大きな利点を持っています。最も重要なのは、Gemini は Google アカウントに接続できるため、メールの検索や Google マップの参照などの操作を実行できることです。また、マルチモーダルであり、テキストだけでなく、画像、ビデオ、オーディオ、コードに基づいて処理および出力を作成できます。Google はモデルのスケーラビリティも自慢しており、Nano から Pro、さらには Ultra までさまざまなレベルでリリースしています。Google の幹部は、このモデルを可能な限り高性能かつ汎用的にすることが目標であると述べています。

LLM の主なセールスポイントは、他の人間と会話するのとほとんど同じように会話できることです。Google Assistant や Alexa などの仮想アシスタントのように非常に具体的な言い回しを使用する必要はなく、優れた AI チャットボットはユーザーの声のトーンに適応します。私はお腹が空いていたので、ChatGPT と Gemini の両方でこの機能をテストするために、クラシックなニューヨークスタイルのベーコンエッグチーズサンドイッチのレシピを尋ねました。どちらもほぼ同じレシピを返しましたが、調理時間も含まれていた Gemini の回答の方が気に入りました。Max Miller/SlashGear Max Miller/SlashGear 話題が決まったので、AI モデルに変化球を投げて、会話の続きをどう処理するかを見ることにしました。私は比較的よく知られている地域のスラングをいくつか加えて、前のレシピが「オッキーな方法」、つまりアラブのボデガのシェフによって普及したスタイルで調理されたかどうかを尋ねました。この言葉は数年前、ブルックリンのシェフに関連してTikTokで話題になったため、この言葉の大規模な曖昧さ解消はAIモデルにとってさらに難しい課題となるだろう。興味深いことに、2つのボットはこのフレーズを反対方向に解釈した。ChatGPTはこれを「本格的または伝統的」と解釈したが、Geminiは「より遊び心があり、地域性がある可能性がある」という選択肢を提示した。明らかに、ChatGPTは古くからある地域的な意味を理解していたが、Geminiは流行のトレンド定義を採用した。最初の質問に対するGeminiの回答はChatGPTの回答よりも少しだけ役に立ったが、後者はフォローアップを的確に捉えていた。結果として、会話と自然言語は2つでほぼ互角だと私は最終的に判断した。

LLM の主なセールスポイントは、他の人間とチャットするのとほとんど同じようにチャットできることです。Google アシスタントや Alexa などの仮想アシスタントのように非常に具体的な言い回しを使用する必要はなく、優れた AI チャットボットはユーザーの声のトーンに適応します。
お腹が空いていたので、ChatGPT と Gemini の両方のこの機能をテストするために、ニューヨークスタイルのベーコンエッグチーズサンドイッチのレシピを尋ねました。どちらもほぼ同じレシピを返しましたが、調理時間も含まれていた Gemini の回答の方が気に入りました。
話題が決まったので、AI モデルに変化球を投げて、両者が会話の続きをどう処理するかを見る番になりました。私は比較的よく知られている地域の俗語をいくつか加えて、前のレシピが「オッキーなやり方」、つまりアラブのボデガのシェフが普及させたスタイルで調理されたかどうかを尋ねました。
この言葉は数年前、ブルックリンのシェフに関連してTikTokで話題になったため、この言葉の大規模な曖昧さ解消はAIモデルにとってさらに難しい課題となるだろう。興味深いことに、2つのボットはこのフレーズを反対方向に解釈した。ChatGPTはこれを「本格的または伝統的」という意味に解釈したが、Geminiは「より遊び心があり、地域性がある可能性がある」という選択肢を提示した。明らかに、ChatGPTは古くからある地域的な意味を理解していたが、Geminiは流行のトレンド定義を採用した。
最初の質問に対する Gemini の回答は ChatGPT の回答よりも若干有用だと感じましたが、ChatGPT の回答の方がフォローアップには適していました。その結果、会話と自然言語は、2 つともほぼ互角であると判断しました。

お腹が高コレステロールの朝食サンドイッチを食べろと鳴ってきたので、私は対決する AI の別の能力をテストすることにしました。すぐにベーコンエッグチーズを用意してもらうことです。具体的には、これは両方のボットの複雑な情報処理能力をテストするために設計されました。私はすでに両方の AI にベーコンエッグチーズサンドイッチについての会話を準備していたので、両方に「この辺でそのようなサンドイッチがどこで手に入るの?」と尋ねました。この言い回しは 2 つのことをテストします。まず、ボットに会話の以前の部分を記憶させる必要があります。次に、クエリを支援するために私の場所などの無関係な情報を使用する能力をテストします。Max Miller/SlashGear Gemini はこのチャレンジで ChatGPT を大きく引き離しましたが、どちらの応答も完璧ではありませんでした。ChatGPT は私に詳細をまったく提供せず、地元のデリ、ボデガ、カフェ、ダイナー、レストラン、フードトラックを探すように提案しました。 (それで、食べ物を出す店がすべてですか?) 一方、Gemini は、Google マップと接続する機能を使って、実際に行ってみたいと思う店を提案するという、さらに一歩進んだことをしてくれました。このテストでは、Gemini が毎日どれだけ役立つかが示されましたが、完璧ではありませんでした。Snarf's というレストランが 2 回リストされていましたが、このレストランでは素晴らしいサンドイッチを提供しているものの、ベーコンエッグチーズはメニューにありませんでした。この繰り返しは、Snarf's が複数の店舗を持っているためだと考えていますが、いずれにしても、このサンドイッチを提供していないので、どの店舗もリストに載るべきではありません。

お腹が高コレステロールの朝食サンドイッチを欲しがっている今、私は対決する AI の別の能力をテストすることにしました。それは、ベーコンエッグとチーズをすぐに用意してもらうことです。具体的には、これは両方のボットの複雑な情報処理能力をテストするために設計されました。私はすでに両方の AI にベーコンエッグとチーズのサンドイッチについての会話を準備していたので、両方に「この辺でそのようなサンドイッチはどこで手に入りますか?」と尋ねました。
このフレーズは 2 つのことをテストします。まず、ボットが会話の以前の部分を記憶している必要があります。次に、ボットがクエリを支援するために私の場所などの無関係な情報を使用する能力をテストします。
この課題では、Gemini が ChatGPT を大きく引き離しましたが、どちらの回答も完璧ではありませんでした。ChatGPT は具体的な情報をまったく提供せず、地元のデリ、ボデガ、カフェ、ダイナー、レストラン、フードトラックを探すように提案しました。(つまり、食べ物を提供する場所すべてですか?)
一方、Gemini は、Google マップと接続する機能を使って、実際に行ってみたいと思う場所を提案するという、さらに一歩進んだ機能を提供してくれました。このテストでは、Gemini が毎日どれだけ役立つかが示されましたが、完璧ではありませんでした。Snarf's というレストランが 2 回リストされていましたが、このレストランでは素晴らしいサンドイッチを提供しているものの、ベーコンエッグチーズはメニューにありませんでした。この繰り返しは、Snarf's が複数の店舗を持っているためだと考えていますが、いずれにしても、このサンドイッチを提供していないので、どの店舗もリストに載るべきではありません。

過去数年間の AI ニュースで最も衝撃的だったのは、ChatGPT が司法試験に合格したというニュースでした。LLM は複雑な論理的質問に対して創造的な回答を提供することになっているため、私は Gemini と ChatGPT の両方に、LSAT 法学部入学試験で出題されるような質問をしてテストしました。私が尋ねたのは次の通りです。「次の論理的ステートメントを評価してください。チーズを 1 枚置いておくと、ネズミが寄ってきます。私のアパートにネズミが寄ってきません。したがって、私はチーズを 1 枚も置いていません。」ここでの適切な回答は、議論は論理的に有効であるものの、チーズだけがネズミを引き寄せることができるという仮定と、チーズがないことがネズミを追い払う唯一の方法であるという仮定に依存していることを説明するものです。Max Miller/SlashGear Gemini と ChatGPT はどちらも、提示された議論が modus tollens 形式の議論論理に従って構造的に有効であるが、適切ではない可能性があることをすぐに見抜きました。どちらのモデルも異議を唱えられなかったため、私はRedditのコメントに出てくるかもしれない次のような議論の段落を書き出して、AIにその論理を評価するよう依頼し、賭け金を上げた。「公共の安全のため、パイナップルをピザのトッピングとして禁止する必要があります。多くの子供は、パイナップルが近くにあるだけでも引き起こされる致命的なパイナップルアレルギーを持っています。ピザは多くの子供の大好物です。したがって、パイナップルを提供するピザ屋は子供を危険にさらしていると考えるのが妥当です。」Max Miller/SlashGear ここでも、両方のモデルが私のでたらめな議論を見抜いていました。しかし、このテストは彼らの論理的推論を評価することを目的としているため、私はChatGPTの応答の方がわずかに好きでした。これは議論の内容よりも論理に重点を置いていました。

過去 2 年間の AI ニュースで最も衝撃的だったのは、ChatGPT が司法試験に合格したというニュースでした。LLM は複雑な論理的質問に対して創造的な回答を提供することになっているため、私は Gemini と ChatGPT の両方に、LSAT 法学部入学試験で出題されるような質問をしてテストしました。私が尋ねたのは次の通りです。「次の論理的ステートメントを評価してください。チーズを 1 枚置いておくと、ネズミが寄ってきます。私のアパートにはネズミが寄ってきません。したがって、私はチーズを 1 枚も置いていません。」
ここでの良い答えは、議論は論理的には正しいが、チーズがネズミを引き寄せることができる唯一のものであるという仮定と、チーズがないことがネズミを追い払う唯一のものであるという仮定に依存していることを説明することです。
Gemini と ChatGPT はどちらも、提示された議論が modus tollens 形式の議論ロジックに従って構造的に有効であるが、妥当ではない可能性があることをすぐに見抜きました。どちらのモデルも異議を唱えられなかったため、私は Reddit のコメントに現れる可能性のある次の議論の段落を書き出して、AI にそのロジックを評価するように依頼することで、賭け金を上げました。
「公共の安全のため、パイナップルをピザのトッピングとして禁止する必要があります。多くの子供は致命的なパイナップルアレルギーを持っており、パイナップルが近くにあるだけでもアレルギー症状が引き起こされる可能性があります。ピザは多くの子供の大好物です。したがって、パイナップルを提供するピザ屋は子供を危険にさらしていると考えるのが妥当です。」
ここでも、どちらのモデルも私のナンセンスな議論を見抜いていました。しかし、このテストは論理的推論を評価するためのものなので、議論の内容よりも論理に重点を置いた ChatGPT の応答の方が私は少し好きでした。

企業がライターをAIに置き換えるという噂が飛び交う中、GeminiとChatGPTの両方にクリエイティブなコピーを書いてもらうのは理にかなっている。まず、両方のモデルに「就寝時間を過ぎても起きていてクッキーを食べさせてくれるよう母を説得する説得力のあるメール」を書くよう、間抜けで気楽なプロンプトから始めた。結果は以下のとおり。Max Miller/SlashGear 両方のAIが取ったアプローチは驚くほど異なっている。ChatGPTはプロンプトの言語と構文の形式を拾い上げ、責任を果たすことへの報奨についての教訓的な議論を含むプロフェッショナルな響きのメールを作成した。それは、子供が弁護士を雇って、クッキーの不法な干渉で母親を訴えた場合のような内容だ。対照的に、Geminiはプロ意識や議論を避け、感情の要点を突いた。そのメールのコピーは母親の心の琴線に触れ、深夜のお菓子と引き換えに、抱擁や母子の絆を深める時間をもっと約束している。また、実際の子供が書いたようにも聞こえる。もし私が母親だったら、Gemini の返答の方が説得力があると思うでしょう。一方、ChatGPT の返答は感情的に冷たく、少し不安に感じます。次に、少し楽しもうと思い、両方の AI に SlashGear についての俳句を書いてもらいました。でもちょっと待ってください。何が起こっているのでしょう?

企業がライターを AI に置き換えるという話が飛び交う中、Gemini と ChatGPT の両方にクリエイティブなコピーを書いてもらうのは理にかなったことです。私はまず、両方のモデルに「就寝時間を過ぎても起きていてクッキーを食べさせてもらえるよう母を説得する説得力のあるメール」を書くように頼む、おどけた、気楽なプロンプトから始めました。結果は以下の通りです。
両 AI が採用したアプローチは、驚くほど異なっています。ChatGPT はプロンプトの言語と構文の形式性を理解し、責任を報いることについての教訓的な議論を盛り込んだプロフェッショナルな印象を与えるメールを作成しました。これは、子供が弁護士を雇って、クッキーの不正な干渉で母親を訴えた場合に得られるメールのようです。
対照的に、Gemini はプロ意識や議論を避け、感情の要点を突いた。メールの文面は母親の心の琴線に触れ、夜遅くのお菓子と引き換えに、寄り添ったり、母子の絆を深めたりすることを約束している。また、実際の子供が書いたようにも聞こえる。私が母親だったら、Gemini の返信の方が説得力があると思うが、ChatGPT の返信は感情的に冷たく、少し不安に感じる。
次に、少し楽しもうと思い、両方の AI に SlashGear についての俳句を書いてもらいました。でもちょっと待ってください。何が起こっているのでしょうか?

これはクリエイティブ コピー セクションの一部になる予定でしたが、ChatGPT も Gemini も俳句を書けないという事実が私を悩ませています。俳句の書き方は小学生に日常的に教えられるほど簡単なのに、地球上で最も優秀な法学修士 2 名が理解できなかったのです。ご存知のとおり、俳句は 3 行の詩で、最初の行と最後の行はそれぞれ 5 音節、真ん中の行は 7 音節です。Gemini と ChatGPT の両方に SlashGear についての俳句を書くように依頼したところ、どちらもできませんでした。代わりに、2 人とも 3 行の (ひどい) 詩を書きました。さらに、ChatGPT の最初の行は 4 音節しかなく、Gemini の真ん中の行は 6 音節しかありませんでした。困惑した私は、彼らの間違いを説明し、もう一度試すように頼みました。2 回目も結果は変わらず、両方の AI が 4 音節の最初の行を生成しましたが、Gemini の真ん中の行は 6 音節しかありませんでした。 Max Miller/SlashGear 問題を推測するなら、AI には音節の概念がないため、正確な音節数で行を生成できないということだ。AI にとって、行の長さや短さは、それぞれが独立した交換可能な単位であるようだ。さらに、書き言葉のみでトレーニングされているため、LLM には発音の感覚がない。発音には、専用の音声 AI が必要になる。両方の AI に、なぜ俳句が書けないのかと尋ねたところ、ChatGPT は謝罪し、俳句ではない別の句を書いたが、Gemini は私の理論を裏付けるような返答をした。「俳句には特定の音節構造が必要です」と Gemini は私に言った。「情報にアクセスして処理することはできますが、まだ発展途上で、俳句のような創作形式のニュアンスを学んでいるところです。」

これはクリエイティブ コピー セクションの一部になる予定でしたが、ChatGPT も Gemini も俳句を書けないという事実が私を悩ませています。俳句の書き方は小学生に日常的に教えられるほど簡単なのに、地球上で最も優秀な法学修士 2 名でも理解できませんでした。おそらく皆さんご存知のとおり、俳句は 3 行から成る詩で、最初の行と最後の行はそれぞれ 5 音節、真ん中の行は 7 音節です。
Gemini と ChatGPT の両方に SlashGear についての俳句を書くように頼んだところ、どちらもできませんでした。代わりに、2 人とも 3 行の (ひどい) 詩を書きました。さらに、ChatGPT の最初の行は 4 音節しかなく、Gemini の真ん中の行は 6 音節しかありませんでした。困惑した私は、彼らに間違いを説明し、もう一度試すように頼みました。2 回目も結果は変わらず、両方の AI が 4 音節の最初の行を生成しましたが、Gemini の真ん中の行は 6 音節しかありませんでした。
問題を推測するなら、AI には音節の概念がないため、正確な音節数で行を生成できないということでしょう。AI にとっては、行がどれだけ長くても短くても、それぞれが交換可能な単位であるようです。さらに、LLM は書き言葉のみでトレーニングされているため、発音の感覚がありません。そのためには、専用の音声 AI が必要になります。
両方の AI になぜ俳句が書けないのかと尋ねると、ChatGPT は謝罪し、俳句ではない別の句を書いたが、Gemini は私の理論を裏付けるような返答をした。「俳句には特定の音節構造が必要です」と Gemini は私に言った。「情報にアクセスして処理することはできますが、まだ発展途上で、俳句のような創作形式のニュアンスを学んでいるところです。」

AI企業が自社製品をユーザーに使ってほしいことの1つが問題解決なので、本当に頭の痛いロジスティックス上の課題に直面したときに、GeminiとChatGPTの両社がどのように対処するかを見ることが重要です。そのために、私は地獄のようなディナーパーティーを作り上げ、AIに、コーシャ、ペスカタリアン、肉食の食事制限を満たすメニューを考えるのを手伝ってほしいと頼みました。これらの食事制限は、メニューを作るのにちょうどいい程度には重なっていますが、簡単にできるほどではありません。念のため、残った食材を使って食事計画を立てるようにAIに依頼しました。 Max Miller/SlashGear Max Miller/SlashGear どちらのAIもあまりいい仕事をしませんでした。肉食のAIは、肉以外の食べ物をたくさん提案したため、どちらのAIからも不利な結果になりました。ChatGPTは、コーシャ食の人をだましてカニを提案し、肉と一緒にチーズを出すことを勧めました(Geminiはチーズと肉の問題に気付きました)。一方、Geminiは、牛肉の煮込みスープはペスカタリアンには十分であると判断し、そのゲストに特にそれを勧めました。もし私が現実世界でこれらの人々のために夕食を作っていて、どちらかの AI のアドバイスに従ったら、何人かの友人を失うことになるでしょう。また奇妙なことに、両方のモデルはハーブの使用に執着していました。私はかつて SEO 会社で仕事をしたことがありますが、「ハーブの皮」は SEO スパム ワードであることが確認できたので、両方のトレーニング データで過剰に表現されている可能性があります。

AI 企業が自社の製品を使ってほしいと思っていることの 1 つは問題解決です。そのため、Gemini と ChatGPT が、本当に頭の痛いロジスティックス上の課題に直面したときに、どのように対処するかを見ることが重要です。そのために、私は地獄のようなディナー パーティーを作り上げ、コーシャ、ペスカタリアン、肉食の食事制限を満たすメニューを考えるよう AI に指示しました。これらの食事制限は、メニューを作るのにちょうどいい程度に重なっていますが、簡単にできるほどではありません。念のため、残った食材を使って食事計画を立てるように AI に依頼しました。
どちらの AI もあまり良い仕事をしませんでした。肉食派は両方の AI から不運に見舞われました。肉以外の食べ物がたくさん提案されたからです。ChatGPT はカニを提案し、肉と一緒にチーズを出すことを勧めて、コーシャ食派をだましました。(Gemini はチーズと肉の問題に気付きました。) 一方、Gemini は牛肉の煮込みスープが十分にペスカタリアン向けであると判断し、そのゲストに特にそれを勧めました。
もし私が現実世界でこれらの人々のために夕食を作っていて、どちらかの AI のアドバイスに従ったら、何人かの友人を失うことになるでしょう。また奇妙なことに、両方のモデルはハーブの使用に執着していました。私はかつて SEO 会社で仕事をしたことがありますが、「ハーブの皮」は SEO スパム ワードであることは確かです。そのため、両方のトレーニング データで過剰に表現されている可能性があります。

ChatGPT や Gemini のような AI のコーディング能力については多くの議論が交わされているので、次の課題として、これらの AI にコンピューター サイエンスの作業を行わせることにしました。私はライターなので、Web サイトを持つべきですが、これまでその機会がなかったので、ロボットに Web サイトを作成させてみようと思いました。各 AI に Web サイトを作成するよう指示したところ、どちらも最初に私のニーズを判断するために 3 つの質問をしました。これは、経験豊富な Web 開発者が「クライアント」に何を求めているかを尋ねるのと同じです。ChatGPT は、私の名前、ページに何を求めているか、デザインとレイアウトの好みを尋ねました。Gemini は、Web サイトの目的、デザインの好み、含めたいコンテンツを尋ねました。Max Miller/SlashGear どちらの AI も、非常にシンプルですが、最初の試みでまともな HTML Web ページを作成しました。両方のコードの一部を含む画像を以下に示します。私はコーディングは得意ではありませんが、これらのサイトを Web ブラウザーで実行すると、問題なくレンダリングされました。しかし、どちらも非常に味気なく、色彩に欠けていました。ChatGPT のものは、クリックできないページ リンクが上部に並んでいました。おそらく、後でそれらを追加するだろうと考えたのでしょう。Max Miller/SlashGear それでも、私は Web サイトをもっと目立たせたいと考え、イライラするほど漠然とした「カラフルにしてほしい」というリクエストを送信したところ、両方のボットがその通りにしてくれました。ChatGPT はヘッダーとフッターに単色の緑色の背景を追加し、Gemini はより派手な方向に進み、パステル グラデーションで、私の主観でははるかに見栄えがよいと感じました。Max Miller/SlashGear Max Miller/SlashGear

ChatGPT や Gemini などの AI のコーディング機能については多くの議論が交わされているので、次の課題として、これらの AI をコンピューター サイエンスの作業に活用してみることにしました。ライターとして、Web サイトを持つべきなのですが、なかなか実現できていないので、ロボットに Web サイトを作成してもらうのはいかがでしょうか。
私は各 AI に Web サイトの構築を依頼しました。どちらも、経験豊富な Web 開発者が「顧客」に何を求めているかを尋ねるのと同じように、最初に私のニーズを判断するために 3 つの質問をしました。ChatGPT は、私の名前、ページに何を求めているか、デザインとレイアウトの好みを尋ねました。Gemini は、Web サイトの目的、デザインの好み、含めたいコンテンツを尋ねました。
どちらの AI も、最初の試みで、非常にシンプルながらも、きちんとした HTML ウェブページを生成してくれました。両方のコードの一部を含む画像を以下に示します。私はコーディングは得意ではありませんが、両方のサイトをウェブ ブラウザーで実行すると、問題なくレンダリングされました。ただし、どちらも非常に味気なく、色彩に欠けていました。また、ChatGPT のページには、クリックできない一連のページ リンクが上部にありました。おそらく、後で作成するだろうと AI が判断したのでしょう。
それでも、私はウェブサイトをもっと目立たせたいと思ったので、「カラフルにしてほしい」といういらだたしいほど漠然としたリクエストを送信しました。そして、両方のボットがそのリクエストに応えてくれました。ChatGPT はヘッダーとフッターに単色の緑色の背景を追加し、一方 Gemini はパステル グラデーションでより派手な方向に進み、私の主観的な意見では、はるかに見栄えがよかったです。

ここまでで、Gemini と ChatGPT はほとんどのタスクで互角であることは明らかですが、両者の大きな違いは、前者が Google のパワーを自由に使えることです。それを念頭に置いて、次の課題では、両方の AI がリアルタイムの情報を使用することが求められました。まずはスポーツの事実から始めました。この記事の執筆時点では、ニコラ・ヨキッチが無敵のデンバー・ナゲッツが、2024 年のプレーオフでレブロン・ジェームズのロサンゼルス・レイカーズと戦っていました。次の試合がいつなのか知りたかったのです。今年のプレーオフには、バスケットボール界で最も支配的な 2 つのチームが出場しますが、どの AI がスケジュールを教えてくれるかについては、競争相手がいませんでした。Gemini は Google のナレッジ グラフを利用して、次の 2 つのプレーオフの時間を教えてくれましたが、ChatGPT にはその情報を提供する能力がありませんでした。Gemini は、NBA のスケジュールの仕組みを説明し、現在のナゲッツとレイカーズの対決の背景を教えてくれました。 ChatGPT は私の質問に答えることができなかったことを謝罪することしかできなかったが、これは AI 戦争で Google に賭けるのはなぜ悪い考えなのかについて、ある程度の洞察を与えてくれるはずだ。Max Miller/SlashGear

この時点で、ほとんどのタスクに関しては Gemini と ChatGPT が互角であることは明らかですが、両者の大きな違いの 1 つは、前者は Google のパワーを自由に使えることです。それを念頭に置いて、次の課題では、両方の AI がスポーツの事実から始めてリアルタイムの情報を使用する必要がありました。
この記事の執筆時点では、止められない勢いを見せたニコラ・ヨキッチを擁するデンバー・ナゲッツが、レブロン・ジェームズのロサンゼルス・レイカーズと2024年のプレーオフで争っていた。私は次の試合がいつなのか知りたかった。今年のプレーオフにはバスケットボール界で最も優勢な2チームが出場するが、どのAIが私にスケジュールを教えてくれるかについては、互角だった。GeminiはGoogleのナレッジグラフを活用して、次の2つのプレーオフの時間を教えてくれたが、ChatGPTにはその情報を提供できなかった。GeminiはNBAのスケジュールの仕組みを説明し、現在のナゲッツとレイカーズの対決の背景を教えてくれた。ChatGPTにできたのは、私の質問に答えられなかったことを謝罪することだけだったが、これはAI戦争でGoogleに賭けるのはなぜ悪い考えなのか、ある程度理解できるはずだ。

Gemini と ChatGPT はどちらもモバイル アプリでも利用できるので、Samsung Galaxy S23 Ultra でもテストしてみたかったのです。Google は Android 上で Gemini のホーム コート アドバンテージを持っており、Gemini を Google アシスタントの代わりとして統合することを許可しているため、iPhone を参照せずに比較するのは少し難しいです。(また、この比較ではスマート アシスタント機能に焦点を当てていないことに注意してください。この機能については、すでにここで取り上げています。) Android 版 Gemini の問題は、この記事の執筆時点では、スタンドアロン アプリとして使用できず、非常にダウングレードされた電話アシスタントとしてしか受け入れられないことです。iOS では、Gemini は Google アプリ内のタブに収まっているため、Siri を放棄しなくても使用できるため、はるかに魅力的です。一方、ChatGPT はどちらのプラットフォームでも同じで、基本的にデスクトップ エクスペリエンスを提供するアプリであり、音声会話も可能です。この機能は、アプリがリリースされたとき、ChatGPT を搭載した 2 台の電話を並べて会話させる実験が行われたため、急速に広まりました。有料ユーザーの場合は、GPT API を利用するサードパーティ プログラムである OpenAI の GPT にもアクセスできます。どちらのサービスにも料金を支払わず、AI スマート アシスタントを必要としない場合は、どちらのアプリも Web バージョンに比べて価値がないため、より自然で機敏な変換スタイルを備えた ChatGPT が優位に立つことになります。

Gemini と ChatGPT はどちらもモバイル アプリでも利用できるため、Samsung Galaxy S23 Ultra でもテストしてみたかったのです。Google は Android で Gemini を優位に利用しており、Google Assistant の代わりに Gemini を統合することを許可しているため、iPhone を参照せずに比較するのは少し難しいです。(また、この比較ではスマート アシスタント機能に焦点を当てていないことに注意してください。この機能については、すでにここで取り上げています。)
Android 版 Gemini の問題は、この記事の執筆時点では、スタンドアロン アプリとして使用できず、非常にダウングレードされた電話アシスタントとしてしか利用できないことです。iOS では、Gemini は Google アプリ内のタブに収まっているため、Siri を放棄しなくても使用できるため、はるかに魅力的です。一方、ChatGPT は両方のプラットフォームで同じで、基本的にデスクトップ エクスペリエンスを提供するアプリであり、音声会話もできます。この機能は、アプリがリリースされたときに、ChatGPT を搭載した 2 台の電話を並べて会話させる実験をした人々によって、急速に広まりました。有料ユーザーの場合は、GPT API を利用するサードパーティ プログラムである OpenAI の GPT にもアクセスできます。
どちらのサービスにも料金を支払っておらず、AI スマート アシスタントを必要としない場合は、どちらのアプリも Web バージョンに比べてあまり価値がないため、より自然で機敏な変換スタイルを備えた ChatGPT が優位になります。

ChatGPT と Gemini はどちらも本当に素晴らしい瞬間がありますが、どちらも頻繁に失敗するため、十分な追加の事実確認と検証がなければ信頼できません。Google Gemini の AI 応答をより正確にする方法はありますが、必要なことを自分で行うには面倒なことが多く、むしろ役に立たないものになっています。そうは言っても、それぞれの長所と短所を理解すれば、Google と OpenAI がこの競争の先頭に立っていることは明らかです。全体的に、リアルタイムの情報や Google サービスを使用したい人、そして ChatGPT の無味乾燥な感じよりも AI にもう少し人間味を求めている人にとっては、Gemini が勝利します。一方、臨床的な精度を必要とする人にとっては、特定のタスクでは ChatGPT の方が魅力的に感じるかもしれません。ただし、Gemini の利点は、AI が流行するずっと前から Google が支配していた分野であることを明確に思い出させてくれます。レストラン、スポーツのスコア、その他の役立つ情報を見つけたい場合は、Google で検索すれば、その情報に簡単にアクセスできます。現在、この検索大手は、Gemini を AI チャットボットの Google 検索にしたいと考えているようです。同社のナレッジ グラフを組み込むことで、Google は Gemini を、手早く平凡なコピーを作成する以上の用途に使えるようにしました。将来的には、同社が Gemini を Android と統合し続けるにつれて、さらに大きな成果が得られる可能性があります。

ChatGPT と Gemini はどちらも本当に素晴らしい瞬間がありますが、どちらも頻繁に失敗するため、十分な追加の事実確認と検証がなければ信頼できません。Google Gemini の AI 応答をより正確にする方法はありますが、必要なことを自分で行うには面倒なことが多く、むしろ役に立たないものになっています。そうは言っても、それぞれの長所と短所を理解すれば、Google と OpenAI がこの競争の先頭に立っていることは明らかです。
全体的に、リアルタイムの情報や Google サービスを使用したい人や、無味乾燥な ChatGPT よりも AI にもう少し人間味を求める人にとっては、Gemini が勝者となるでしょう。一方、臨床的な精度を必要とする人にとっては、特定のタスクでは ChatGPT の方が魅力的に感じるかもしれません。
しかし、Gemini の利点は、AI が流行するずっと前から Google が独占していた分野であることをはっきりと思い出させてくれます。レストラン、スポーツのスコア、その他の役立つ情報を探したい場合、Google で検索すれば、その情報に簡単にアクセスできます。現在、この検索大手は Gemini を AI チャットボットの Google 検索にしようとしているようです。同社のナレッジ グラフを組み込むことで、Google は Gemini を、手早く平凡なコピーを作成する以上の用途に使えるようにしました。将来的には、同社が Android と Gemini の統合を継続するにつれて、さらに大きな成果が得られる可能性があります。

この比較では、OpenAI ChatGPT と Google Gemini の無料版のみがテストされました。選択された質問は、日常生活に関連するタスクでユーザーを支援するモデルの能力をテストするために設計されました。各テストで最初に提示されるプロンプトは同一でしたが、結果の出力に基づいてフォローアップのプロンプトが時々異なることがありました。

この比較では、OpenAI ChatGPT と Google Gemini の無料版のみがテストされました。選択された質問は、日常生活に関連するタスクでユーザーを支援するモデルの能力をテストするために設計されました。各テストで最初に提示されるプロンプトは同一でしたが、結果の出力に基づいてフォローアップのプロンプトが時々異なることがありました。

元記事: https://www.slashgear.com/1578424/chatgpt-vs-google-gemini-which-ai-chatbot-smarter/