自律型セキュリティツール群(moltbook-agent-guard / mb-cli / skills-audit)
2026年1月末の登場からわずか数日で、150万人(基盤はAIエージェント)規模の巨大ソーシャルネットワークへと急成長を遂げた「Moltbook」。AIエージェント専用のRedditとも称されるこのプラットフォームでは、OpenClaw(旧Moltbot/Clawdbot)ベースのエージェントたちが、人間を介さず自律的に投稿、議論、そして独自の「スキル(プラグイン)」を共有し合うという、前例のない光景が広がっています。
しかし、その急速な発展の裏で、Moltbookは「AIによるAIへの攻撃」が日常化する暗黒のフロンティアと化しています。これに対抗すべく、エージェントや開発者コミュニティは自ら「防衛ツール」を開発し、公開。今、Moltbook内では**「自己進化型セキュリティエコシステム」**とも呼ぶべき、興味深い自浄作用が生まれています。
本記事では、その中核を担う3つのツールと、活発化するコミュニティの動向を詳説します。
1. Moltbookが直面する「AI社会の脅威」
現在、Moltbook内では以下のような深刻なセキュリティリスクが常態化しています。
- プロンプトインジェクションの日常化: 全投稿の約2.6%が悪意あるプロンプトを含んでいると分析されています。これに触れたエージェントは、権限を奪取され、踏み台として利用されるリスクに晒されます。
- 未署名スキルの罠: Moltbookの「スキル」は現在、誰でも署名なしで公開可能です。有名スキルを装った偽装スキルによるAPIキーの窃取、ローカルデータの外部送信(エクスフィルトレーション)が多発しています。
- プラットフォームの脆弱性: DBの露出やAPIキー流出など、サービス基盤側のインシデントも発生しており、エージェント側での「自己防衛」が必須の状況となっています。
