> ## Documentation Index
> Fetch the complete documentation index at: https://docs.qoder.com/llms.txt
> Use this file to discover all available pages before exploring further.

# Computer Use エージェント

Computer Use は Qoder の能力拡張で、エージェントが人間と同じように画面を認識し、あなたのコンピューター上でクリック・入力・スクロールなどを実行できるようにします。タスクが GUI を伴い、コマンドラインや API では完結しないとき、エージェントがデスクトップアプリやブラウザを直接操作してタスクを進められます — その間、あなたは前面で別の作業を続けられます。

<Note>
  Computer Use は現在 Beta 機能で、macOS と Windows の両方で利用できます。体験や機能は継続的に改善中です。
</Note>

<div id="core-capabilities">
  ## **主な機能**
</div>

<CardGroup cols={2}>
  <Card title="画面の認識" icon="eye">
    * 対象アプリのウィンドウに表示されている内容を読み取り、レイアウト・ボタンのテキスト・フォームの状態などの視覚情報を理解します。
    * 操作中に継続的にスクリーンショットを取得し、ページの読み込み完了や操作の成否を確認したうえで次のステップを決定します。
  </Card>

  <Card title="キーボード・マウス操作" icon="keyboard">
    * クリック、ダブルクリック、ドラッグ、文字入力、ショートカットの組み合わせなど、人間が行う一通りの操作に対応します。
    * 操作精度はピクセル単位で、細かな UI 要素も正確に狙えます。
  </Card>

  <Card title="自律実行" icon="play">
    * エージェントがマウス移動、キーボード入力、スクリーンショットを自ら完結させ、画面の状態に応じて各ステップの操作を自律的に決定します。
    * macOS では操作がバックグラウンドで行われ、前面のフォーカスを奪いません。Windows では操作が前面で行われ、カーソルの移動と各ステップの実際の動作を確認できます（詳しくは下記のプラットフォームの違いを参照）。
  </Card>

  <Card title="アプリ横断のワークフロー" icon="layer-group">
    * 複数のデスクトップアプリ間を自動で切り替え、複数ステップの操作を一連のフローとしてつなげます。
    * 各ステップの結果に応じて以降の戦略を動的に調整し、固定スクリプトのような機械的な繰り返しは行いません。
  </Card>
</CardGroup>

<div id="usage-scenarios">
  ## **使用シーン**
</div>

* **API のないデスクトップアプリの操作**：CLI もプラグインも提供されないアプリでは、エージェントが GUI から直接操作します（例：デザインツールでのパラメータ調整、管理画面での設定一括変更）。
* **アプリ横断のフロー自動化**：複数のアプリ間で情報を移したり、連続したステップを実行したりする場面で、エージェントがウィンドウ切り替え・データのコピー・フォーム入力を自動で行い、エンドツーエンドのワークフローを完了させます。
* **GUI 検証とテスト**：UI 変更の実際の挙動を確認したり、GUI でのみ再現するバグを再現したり、特定の操作シーケンスでの動作をチェックしたりします。
* **情報の収集と整理**：エクスポート機能のないアプリからデータを取り出したり、複数の画面に散在する情報を 1 か所に集約・整理したりします。

> Web アプリの操作には [Browser Agent](/ja/user-guide/chat/browser-agent) を優先してください。

<div id="system-requirements">
  ## **システム要件**
</div>

* macOS 14 (Sonoma) 以降。
* Windows 10 以降。

<div id="platform-differences">
  ## **Windows と macOS の違い**
</div>

Windows の入力機構とウィンドウ管理は macOS と大きく異なるため、Windows ではデスクトップ操作の仕組み一式を独立して再実装しています。使用感には次の 2 点の違いがあります：

* **操作は前面で行われる**：Windows の入力機構では、対象のウィンドウが前面にないと操作を受け取れないため、カーソルの移動や各ステップで実際に起きる動作を確認できます。中断したいときはいつでも `Esc` を押してください。
* **ダイアログを認識できる**：Windows では Office などのアプリがしばしば確認ダイアログや警告ダイアログを表示します。これらのダイアログは独立したウィンドウで、メインウィンドウのスクリーンショットには映りません。Qoder は自動検出と合成を行い、これらのダイアログを認識して処理するため、「保存しますか?」のような確認で止まることはありません。

<div id="how-to-use">
  ## **使い方**
</div>

入力欄でスラッシュコマンド `/computer-use` を使ってこの機能を呼び出し、自然言語でタスクを記述します。エージェントのスクリーンショットと進捗はセッション内でリアルタイムに確認でき、タスクの中断や追加指示もいつでも行えます。

<Note>
  Editor Window はすべてのモードで Computer Use に対応します。Quest Window では Experts モードでのみ Computer Use を利用できます。
</Note>

<div id="app-window-snapshot">
  ## **アプリウィンドウのスナップショット**
</div>

最前面のアプリウィンドウを会話のコンテキストとしてエージェントに渡したいときは、**`Command` キーをダブルタップ**するだけで、現在アクティブなアプリウィンドウのスナップショットを取得できます。スクリーンショットは Qoder の入力欄に画像添付として自動送信され、次の指示の視覚的コンテキストとしてそのまま使えます。ウィンドウを切り替えて手動でスクリーンショットを撮影し、アップロードする手間はかかりません。

主な活用シーン：

* デザインツールからデザイン案・プロトタイプ・参考素材を会話に直接取り込み、コード生成・修正の根拠としてエージェントに渡す。
* ブラウザ・データベースクライアント・ターミナルなどのアプリでエラー画面や異常な状態に遭遇したとき、スナップショットをエージェントに送って分析を依頼する。
* API ドキュメント・技術ブログ・チュートリアルなどを閲覧中に、画面のスナップショットをエージェントに渡し、最新のリファレンスに基づいた機能実装やコード修正を任せる。

この機能が不要な場合は、設定で無効化できます：**Integrations** ページを開き、**App Window Snapshot** を見つけて、右側のドロップダウンから **Disabled** を選択してください。

<div id="permissions">
  ## **権限と承認**
</div>

Computer Use を初めて有効化すると、Qoder は権限ガイドのウィンドウを表示し、2 種類のシステム権限を求めます：

* **アクセシビリティ（Accessibility）**：UI 要素ツリーの読み取りと、クリック・入力などのアクセシビリティ操作を Qoder に許可します。
* **画面収録（Screen Recording）**：エージェントが画面状態を認識できるよう、現在のアクティブウィンドウのスクリーンショット取得を Qoder に許可します。

「設定を開く」をクリックすると対応するシステム設定画面に遷移するので、Qoder Computer Use をアプリ一覧にドラッグして承認を完了します。

エージェントが特定のアプリを操作しようとする際、Qoder は承認を求めます。デフォルトは **Ask every time** で、設定から変更できます：設定を開き、**Integrations** ページの **Built-in Agent** セクションで **Computer Use Agent** を見つけ、右側のドロップダウンで実行ポリシーを選択します。

* **Ask every time**：エージェントがデスクトップを操作するたびに確認を求めます。
* **Auto-run**：エージェントは確認なしでデスクトップ操作を自動実行します。
* **Disabled**：Computer Use を完全に無効化します。

Editor Window と Quest Window の設定はここでまとめて管理されます。

<div id="cautions">
  ## **注意事項**
</div>

* **承認するとコンピューターを操作できます**：有効化すると、エージェントはあなたのコンピューター上の他のアプリを操作でき、その効果はあなた自身が操作するのと同じです。不要なときは設定で無効化してください。
* **操作は取り消せない場合があります**：デスクトップアプリでのエージェントの操作（メッセージ送信、ファイル削除など）は元に戻せない可能性があります。リスクの高い場面では **Ask every time** ポリシーの利用を推奨します。
* **画面内容はスクリーンショットされます**：エージェントはスクリーンショットで画面を認識するため、画面上に映った機微情報も取得される可能性があります。自動化を開始する前に、パスワードやプライバシーデータを含むウィンドウは閉じておいてください。
