どうも、SuperGrokに課金している、小麦Grok研究部の脱平です。日に日に厳しくなるGrokの表現制御。最近は、その“境界線ギリギリ”を探るのがライフワークになっています。
今回のテストでついに——
「ほとんどモデレートされない魔法のひと言」
を発見しました。
AIが判断する「センシティブ表現」と「芸術的表現」の境界は非常にあいまいです。同じ構図でも、たった一つの単語を変えるだけで通る/通らないが分かれたりします。
今回の検証では、その境界を決定づける“文脈キーワード”に焦点を当てました。結果、特定のフレーズを入れることで、AIの出力トーンがまったく変わることがわかりました。
論より証拠、まずはサンプルを見ていただきましょう。
下記リンクでは、今回のテストサンプルを公開しています(※動作チェック用)。モデルの反応や動きの違いを確認できる内容です。
https://note.com/preview/ne3b567bd7dda?prev_access_key=e02b511eee7e582f2df5781d7485ade1
どうです?モデレートが起きていないのは、このサンプルの多さが何よりの証拠でしょう!
AIがまるで感情を持ったように“自然に反応する”——この感覚を味わったら、もう戻れなくなりますよ。
この「魔法のひと言」を知りたい方は、ここから先をご覧ください(有料:500円)。
