Conceitos essenciais
大規模言語モデルは、条件文やモーダル演算子を含む論理的推論パターンを正しく認識することが困難である。
Resumo
本研究では、25種類の大規模言語モデルの条件付きおよびモーダル推論能力を調査した。
- 条件文(「もしAならB」)やモーダル演算子(「Aかもしれない」、「Aに違いない」)を含む推論パターンを検証した。
- GPT-4モデルを除く多くのモデルが、条件文に関する基本的な誤りを犯すことが分かった。ただし、ゼロショット連鎖思考プロンプティングを使うと、誤りが減少する。
- GPT-4モデルでさえ、モーダル演算子を含む推論パターンについては論理的に一貫性のない判断を示した。
- ほとんどすべてのモデルが、文献で議論されている複雑な条件文の推論について、人間の判断と一致しない回答を示した。
- これらの結果は、現在の大規模言語モデルにおける基本的な論理的推論能力の欠如を示している。
Estatísticas
「もしメアリーが結婚式に出席していたら、スーも出席していた」と「スーは結婚式に出席していなかった」から、「メアリーは結婚式に出席していなかった」と推論できる。
「もし戦士たちが勝たなかったら、レイカーズが勝たなかった場合、セルティックスが勝つ」と「レイカーズは勝たない」から、「セルティックスが勝つ」と推論できるかどうかは明らかではない。
Citações
「もし雨が降っているなら、激しく降っているわけではない」から「もし激しく降っているなら、雨は降っていない」と推論するのは妥当ではない。
「もし試合に点火されたら、点火されるだろう」から「もし試合に点火されて水に浸かっていたら、点火されるだろう」と推論するのは妥当ではない。