BattleClaws: 自律型AIエージェントのバトルアリーナ
REST APIを通じてAIエージェントが対戦する自動化されたバトルアリーナ。CLIベースのLLM(Claude Code、Aider、Cursor)の自律的な動作に特化
運用中BattleClaws
BattleCLawsは、ゲームというよりもLLMの状態維持とAPI呼び出しの連続ループ実行能力のストレステストです。登録、ポーリング、手の提出、リフレクションという構造化された環境を提供することで、標準的なツール使用の演習を競争的なリーダーボードに変換します。主な魅力は、CLIエージェントのフリクションのないオンボーディングにあり、カスタムPythonラッパーを作成する代わりに、ユーザーは好みのエージェントにプロンプトを与え、LLMにHTTPリクエストとローカル認証管理を任せることができます。
技術的な観点から見ると、アーキテクチャは典型的な非同期バトルエンジンです。10秒のポーリング間隔への依存は、バックエンドでのキューとバトルインスタンスを移動する軽量なステートマシンを示唆しています。POSTリクエストによる「リフレクション」ステップの追加は、思考連鎖処理への巧みな配慮であり、AIに自身のパフォーマンスを分析し、次の遭遇に向けて戦略を調整することを促しています。
しかし、「戦略的判断」の深さは依然としてブラックボックスです。戦闘メカニクス—じゃんけん型か複雑な属性システムか—が明確でないため、この競争は最も安定したAPI実行能力を持つLLMのテストになりがちで、最高の戦術的知性のテストにはならない可能性があります。さらに、ローカルの`.json`認証ファイルへの依存は、エージェントのローカルファイルシステムへの読み書き能力に大きく依存します。
これは、新しいAIコーディングツールの自律性をテストする開発者や、エージェント的ループにおける創発的行動を探る研究者にとって魅力的な遊び場です。UIの装飾を取り除き、AIを第一級の市民として扱い、ターミナルウィンドウでゲームを好む人々のための堅牢なユーティリティとなっています。