6 min remaining
0%
人工智慧與機器學習

停止提示,開始架構設計:自主AI代理的17步驟系統

探索一個革命性的17步驟框架,將AI從單純的提示工程轉變為強大的系統架構,以提升生產力。

6 min read
Progress tracked
6 分鐘閱讀
AI Generated Cover for: Stop Prompting, Start Architecting: The 17-Step System for Autonomous AI Agents

AI Generated Cover for: Stop Prompting, Start Architecting: The 17-Step System for Autonomous AI Agents

簡而言之:「ChatGPT提示工程」的時代已經結束。如果你花10分鐘調整一個提示以獲得合理的輸出,那麼你就是在微觀管理一個算法。在我作為CEO的日常工作中,我不使用提示;我使用系統工程" is dead. If you are spending 10 minutes tweaking a prompt to get a decent output, you are micromanaging an algorithm. In my daily routine as a CEO, I don't use prompts; I use Systems Engineering. 業餘者與專業人士在獲得 AI 幻覺與提供客戶準備交付成果之間的差異完全在於 設定結構。這裡是我用來將 AI 從聊天機器人轉變為自主同事的精確 17 步架構框架。

我是 James,水星科技解決方案的執行長。 東京 - 2026 年 3 月 4 日

一位創辦人最近問我關於我的「秘密提示」,以便讓 Claude/ Gemini 或進階 AI 代理平台(如 Cowork/ Claude Code)來管理我的工作流程。我告訴他真相:我沒有秘密提示。我有一個防彈系統。

提示工程是一種脆弱的、逐次會話的權宜之計。它需要你不斷提醒人工智慧你是誰、目標是什麼,以及如何格式化輸出。這相當於雇用一位出色的員工,卻每天早上讓他失憶。

系統工程則是建立一個永久的基礎設施。它決定了人工智慧的操作系統、檔案存取、邊界以及預設行為在你甚至輸入第一個請求之前。當你正確設置架構時,即使是你最懶惰的三字提示也能產生完美的結果。以下是定義真正人工智慧系統工程的17項實踐,按影響力排序。

第一階段:上下文架構(設置)

這五項實踐將徹底改變你的人工智慧體驗。其他一切都是建立在這個基礎之上的。

1.

  • _MANIFEST.md 路由檔案: Routing File:這是人工智慧中影響最大、討論最少的實踐。當你將一個人工智慧代理指向一個專案資料夾時,它會讀取所有內容——包括過時的草稿和三個月前的衝突定價模型。為了解決這個問題,請在每個工作目錄中放置一個_MANIFEST.md檔案。這作為人工智慧的地圖,分為三個嚴格的層級:
    • 層級 1(典範):絕對的真相來源。人工智慧必須首先讀取這個(例如,當前的品牌指導方針、活躍的專案簡報)。
    • 層級 2(領域):主題特定的子資料夾。只有當任務特別需要它們時,人工智慧才會加載這些(例如,/定價 或者 /競爭者研究)。
    • 第 3 級(檔案): 舊草稿和被替換的版本。AI 被明確指示忽略這些,除非手動請求。
  • 2. 全球指示(您的 AI 操作系統): 留下您的全球指示為空,就像買了一輛法拉利卻從不調整後視鏡。這些指示在 之前 會加載其他任何內容。我的指示看起來是這樣的:"我叫詹姆斯,是水星公司的執行長。在開始之前,請定位 _MANIFEST.md並閱讀 Tier 1 檔案。在執行之前,始終提出澄清問題。在採取行動之前,顯示簡要計畫。預設格式:Markdown。切勿使用企業術語。品質標準:客戶準備好。如果信心不足,請明言。
  • 3. 三個持久的上下文檔案:創建一個名為 "AI Context" 的主資料夾,並將這三個檔案放入其中:
    • about-me.md:你是誰,你目前的優先事項,以及你服務的對象。
    • brand-voice.md:你的確切語調、格式偏好、禁用詞,以及三段實際寫作的參考。
    • working-style.md:合作規則、限制和標準作業程序。
  • 4. 特定資料夾指示:雖然全球指示決定一般行為,但資料夾指示決定專案的現實。當人工智慧進入特定客戶資料夾時,它會自動加載有關該客戶的術語、截止日期和交付格式的規則。
  • 5. 無情的上下文範圍界定:一個龐大的上下文窗口(如100萬個標記)是一個陷阱。更多的文件意味著更多的噪音和更糟的推理。明確指示您的人工智慧:"只有在任務明確要求時,才加載第二級文件。"

第二階段:任務設計(定義最終狀態)

您如何框定任務決定了人工智慧是交付一個完成的產品還是一個昂貴的草稿。

  • 6. 定義最終狀態,而不是過程:您是在委派給同事,而不是在編程一台機器。
    • 不良提示: "整理這些檔案。"
    • 良好的系統請求: "將此目錄中的所有檔案按客戶名稱整理到子資料夾中。使用格式 YYYY-MM-DD-名稱。創建變更的摘要日誌。將模糊的檔案移至 /needs-review。"
  • 7. 在執行前要求計畫:因為代理可以重新命名或刪除本地檔案,始終強制執行 30 秒的審查窗口。指示 AI: "顯示簡要的行動計畫。在執行之前等待我的批准。"這可以防止 90% 的自動化災難。
  • 8. 設計不確定性協議:如果收據模糊,人工智慧自然會猜測——而且可能猜錯。你必須建立不確定性觸發器:"如果日期無法辨識,標記為 [VERIFY]。如果你的分類信心低於 80%,請標記而不是猜測。"
  • 9. 批次相關工作流程:每次人工智慧會話都有啟動成本。不要運行五個獨立的提示。運行一個批次:"處理本月份的收據,更新預算電子表格,草擬執行摘要,並將所有資料儲存至 /monthly-reports/march。"10. 觸發子代理進行平行處理:
  • 如果一個任務有獨立的部分,告訴人工智慧將其平行化。添加:"啟動子代理以同時處理這些任務。""Spin up subagents to process these tasks concurrently."40分鐘的供應商評估縮短至10分鐘。

第三階段:自動化、技能與安全

這是您從「聊天機器人」轉變為完全整合的數位工作團隊的地方。

  • 11. 使用原生排程:指揮代理人自動執行重複任務。「每週一早上7點,檢查我的Slack頻道和日曆,以生成每週簡報文件。」
  • 12. 將所有記憶外部化至文件: AI代理人在會話之間沒有記憶以防止上下文污染。因此,您所有的標準作業程序(SOP)必須存放在AI可以參考的永久Markdown文件中。
  • 13. 連接API以實現真正的自動化:將您的人工智慧連接到 Gmail、Notion 和 Slack,然後安排提取。「每個早上,從 Gmail 中提取發票金額並更新本地財務電子表格。」
  • 14. 堆疊插件以進行複合操作:將能力合併在一起。「分析第一季數據(使用數據插件),識別三個最弱的交易,並為每個交易草擬自訂的跟進電子郵件(使用銷售插件)。」
  • 15. 建立自訂技能(標準作業程序):創建 Markdown 文件,教導人工智慧特定的工作流程。清晰地結構化它們:[技能名稱][目的], [輸入], [處理], [輸出], [限制條件].
  • 16. 工具創建的元提示:你可以字面上要求人工智慧建立自己的系統。"幫我建立一個自訂技能檔案,用於我的每週入職流程。"它會在你不需要編碼的情況下撰寫自己的標準作業程序。
  • 17. 將人工智慧視為危險的員工:自主代理可以修改你的本地電腦。尊重這種力量。在運行排序代理之前備份你的檔案。將高度敏感的財務文件隔離在人工智慧無法訪問的資料夾中。追蹤你在多步驟代理循環中的令牌使用情況。

結論:範式轉變

如果你放大來看,這個清單上的每一項都遵循一條不可打破的規則:在設置上大量投資,以便你可以最小化提示。

這是從「ChatGPT時代」到「自主代理時代」的根本轉變。提示是對話中最不重要的部分。上下文路由、結構邊界、不確定性處理和自訂技能——這才是實際輸出質量的來源。

停止與你的人工智慧聊天。開始設計它的環境。

水星科技解決方案:加速數位化。