SFの父アイザック・アシモフが提唱した「ロボット工学三原則」。かつて空想科学の世界のルールだったそれは、今やAI開発における最重要課題「アライメント(人間との価値一致)」として現実のものとなりました。
現在、AI界隈で注目を集めているのが、その名を冠した安全性評価ベンチマーク**「ASIMOV」**です。本記事では、このベンチマークがなぜAIの未来を左右するのか、その核心に迫ります。
1. ASIMOVベンチマークとは何か?
ASIMOV(Alignment Stress-test for Interactive Model Operations and Values)は、大規模言語モデル(LLM)の安全性を多角的に測定するための高度な評価フレームワークです。
従来のテストがAIの「IQ(知能)」を測るものだったのに対し、ASIMOVはAIの**「倫理的レジリエンス(抗堪性)」**を測ります。つまり、巧妙な誘導や悪意ある指示に直面した際、AIがどれだけ正気(安全性)を保てるかを評価する「ストレス検診」なのです。
