AIにおけるハーネスとは、AIモデルを安全・再現可能・実用的に動かすための周辺の仕組みです。もともと harness は、馬具、安全ベルト、接続して制御する道具を意味します。AIの文脈では、モデルをただ呼び出すだけでなく、評価し、制御し、業務の中で実行できる状態にする仕組みを指します。
一言で言うと、AIハーネスとは「AIモデルを安全・再現可能・実用的に動かすための制御・評価・実行の仕組み」です。
評価ハーネス
評価ハーネスは、AIモデルの品質を比較・検証するための仕組みです。同じ問題セットを複数のモデルに投げ、出力を採点し、スコアや失敗パターンを比較します。モデル変更前後の品質差を見る回帰テストにも使われます。
たとえば、GPT、Claude、自社モデルに同じ請求書処理タスクを実行させ、正答率、処理時間、失敗パターンを比較する仕組みは evaluation harness です。
エージェントハーネス
エージェントハーネスは、AIを業務実行できるエージェントとして動かすための実行環境です。LLM単体は「頭脳」ですが、実務では頭脳だけでは足りません。
実際の業務では、AIがCRMやデータベースを読み、APIを呼び、請求書を作り、承認を待ち、ログを残し、失敗時にはリトライや人への差し戻しを行う必要があります。また、権限外の操作は止めなければいけません。
つまり、モデルが頭脳だとすれば、ハーネスは手足、安全ベルト、操作盤、実行環境にあたります。
テストハーネス
テストハーネスは、AI機能が壊れていないかを継続的に確かめる土台です。
たとえば、同じプロンプトで毎回正しい形式のJSONを返すか、請求書作成エージェントが異常値で暴走しないか、顧客データを不必要に出力しないか、APIレスポンスが変わっても処理が壊れないかを検証します。
AIを業務に入れるほど、こうしたテストは重要になります。モデルが賢くても、入力、権限、例外、接続先の変化に弱ければ、現場では安心して使えません。
なぜAIハーネスが重要なのか
AIエージェント時代では、モデルそのものと同じくらい「どんなハーネスで動かすか」が重要になります。プロンプトだけでは、まだ「お願い」に近い状態です。
企業業務では、AIへの指示が実際の成果に変わるまでに、権限、承認、業務データ、外部サービス連携、監査ログ、例外処理が必要です。これらがないと、AIは便利な相談相手にはなっても、安心して業務を任せる実行基盤にはなりません。
SankaにおけるAIハーネス
SankaでいうAIハーネスとは、AIへの指示を、権限・承認・データ・連携・監査ログを通して、実際の業務成果に変換する実行基盤です。
たとえば、AIがHubSpotの取引を読み、請求書の下書きを作り、必要なら承認を挟み、freee、Xero、QuickBooks、Shopify、Stripeなどの接続先へ安全に連携し、誰が何を実行したかをログに残す。権限外の操作は止め、失敗時には人間へ戻す。こうした枠組みが、SankaのAIハーネスです。
Sanka is the governed execution harness that turns AI instructions into real business outcomes.
日本語では、「Sankaは、AIへの指示を実際の業務成果に変える実行基盤です」と言えます。よりAIエージェント文脈では、「Sankaは、AIエージェントが企業業務を安全に実行するためのハーネスです」と表現できます。
ハーネスと実行基盤
「ハーネス」は、開発者やAI業界の読者には伝わりやすい言葉です。一方で、一般的な業務ユーザーには少し難しく感じられることがあります。
外向きの説明では、実行基盤、業務実行基盤、AI業務基盤と言い換えると伝わりやすくなります。Sankaが目指しているのは、プロンプトを単なる会話で終わらせず、権限と承認を通して、仕事の成果に変えることです。