AOP (Algebraic Ontology Projection) は脳内メーカーのようにLLMの思考を詳らかにします
この記事では、AOPの研究のハイライトをわかりやすく紹介したいと思います。 一言でいうと、日本の方にはおなじみのLLMのための「脳内メーカー」として働きます。 実際、LLMが推論しているときに、何が起きているのでしょうか?
この記事の表題の図は、私たちが今まで見たことがない、LLMの内部での判断を「層ごとに」描き出しています。 概念が刻々と迷いながら移ろっていく様を見て取ることができます。ここにはLLMのテキストでの出力もsoftmaxによる加工も行われていません。 LLMの内部に潜んでいる代数的な構造を射影しているのです。
🔵 左の図 — “Is a Person an Animal?” 人間は動物?
指示が与えられていない(no prompt)場合、LLMは判断を躊躇していることが、移ろいゆく線から見て取れます。 答えはわかっているのだけれど、結論は保留する。 これは、人間が動物であるかの哲学的な問いを与えられた時の思考を彷彿とさせます。
一方で、指示が与えられた場合、人間は動物であると明確に判断しています。
🟡 中央の図 — “Is an Eagle a Bird?” 鷲は鳥?
このような問いに対しては、適切な指示があれば、確実に答えを得ていることがわかります。しかし、指示がない場合は、最終層間際で正解を得られなくなっています。 これを我々は、“Late-layer Collapse” 後期層での論理崩壊と呼んでいます。我々の論文のタイトルを飾った考え方です。
🔴 右の図 — “Is an Oak a Tree?” オークは木?
このテストの場合、LLMはきわめて不安定に思考が揺れ動きます。 英語の”オーク(Oak)” は樫以外にも多くの含意をもっています。 — 場所、苗字、ファンタジーでの名称。 この結果、意味の世界は引き裂かれます。
これがAOPの「脳内メーカー」としての威力です。LLMが話したことではありません。話す前に考えていたことをあらわにするのです。 それでは、プロンプト(指示)にはどういう意味があるのか? それはただの入力ではなく、LLMがどのように考えるかを支配しているのです。