動物の行動に関する文献では、動物は連続体に沿った不完全な情報に基づいて単純な論理的結論を導き出すことを可能にする抽象的な推論システムを備えていること、つまり、A が B よりも大きい場合に次のことを推測できることを示唆する研究が増えています。 BはCより大きい。しかし、この実験は非常に批判されており、主な理由は報酬でした。実験はサルがこれらの推論を行うのを助けたのでしょうか、それとも報酬と関連付けずに推論を行うことができたのでしょうか?

さて、最終的な報酬よりも論理的推論に基づいた新しい研究では、4 頭のサルがこのような単純な推論を必要とする課題を解決できたことが示されています。グレッグ・ジェンセンと彼のチームは、報酬動機だけでは解決できなかった 2 つの異なる推移的推論実験を実施しました。

最初の実験では、正しい選択肢の方が報酬が小さくなり (逆報酬勾配)、2 番目の実験では、より大きな報酬が正解に対応しました (報酬勾配が一致)。両方の条件で課題を解決するには、マカクザルは順序付きリスト内の各アイテムの位置を推測すると同時に報酬の値を無視する必要があり、逆報酬勾配を学習するにはさらに時間が必要でしたが、これは障害にはなりませんでした。たとえそれが少なくなったとしても、彼らはアイテムの順序を正しく学習したということです。

https://hipertextual.com/entrevistas/helena-matute-empresas-mas-millonarias-viven-atencion-usuario-su-clic

この研究は古典的な条件付け、つまり動物はあらゆる刺激が反応に対応するという事実に基づいて学習することに基づいています。この場合、刺激はいくつかのオブジェクトに命令を与えることであり、その応答が賞品となります。パブロフの有名な犬は、ベルが鳴るとそれを食べ物と関連付けて唾液を出し始めましたが、これは古典的な条件付けの一例です。人間の場合、刺激と反応を通じて学習しますが、それが私たちの唯一の学習形式ではありません

私たちは動物がどのように学習するのかについて調査を続けていますが、ジェンセン氏のチームのおかげで、この研究のサルは報酬に基づいて意思決定を行うのではなく、正しい答えを選択していることがわかりました。賞金は減りました。

参考資料一覧

  1. https://advances.sciencemag.org/content/5/7/eaaw2089

サルは報酬の約束がなくても単純な論理を使える・関連動画

https://www.youtube.com/watch?v=6TX4ypwAVH4&pp=ygVM44K144Or44Gv5aCx6YWs44Gu57SE5p2f44GM44Gq44GP44Gm44KC5Y2Y57SU44Gq6KuW55CG44KS5L2_44GI44KLJmhsPXtsYW5nfQ%3D%3D