Agent Builder 開發工具箱
Agent Builder - AI Agent 開發工具箱
開箱即用的 AI 能力組件:RAG 知識檢索、Agentic 工作流、MCP 工具整合、AgentOps 監控。讓 AI 應用開發更簡單快速。
Core 核心 AI 能力
強大的 AI 核心功能,涵蓋智慧檢索、文本生成、語音處理到程式碼執行。從 RAG 檢索到多模態互動,提供完整的 AI 能力支援。
Integrations 整合介面
多元整合方式,讓 AI Agent 無縫串接您的應用與服務。從 API 到各種通訊頻道,提供完整的整合解決方案。
AgentOps 營運監控
全方位監控與分析工具,掌握 Agent 運行狀況與效能指標。從即時監控到深度分析,持續優化 Agent 表現。
Enterprise 企業功能
企業級安全、權限管理與合規功能,滿足組織治理需求。從存取控制到稽核追蹤,確保企業資料安全與合規。
高度客製化能力
開放 API 與 SDK,支援自訂工具、Prompt 與工作流,滿足各種進階開發需求。
完整的技術文件
詳盡的 API 文件、程式碼範例、最佳實踐指南,協助開發者快速上手與整合。
- Agent Builder 是 MaiAgent 平台的核心建置區。在這裡,你可以組合不同模組,打造出能回答問題、查詢資料、執行任務的 AI Agent。
- 《 十個模組速覽》
1. Agent(AI 助理):對話的核心,理解意圖、產生回覆。
2. 知識庫:提供 Agent 可查閱的企業專屬知識。
3. 資料庫:透過 Text2SQL 讓 Agent 用自然語言查詢結構化資料。
4. 代理排程:讓 Agent 按時間自動執行任務。
5. 工具:讓 Agent 呼叫外部服務執行動作。
6. Code Interpreter:在沙盒中執行 Python,處理檔案與運算。
7. Browser Tool:操控瀏覽器瀏覽網頁、互動元素,並擷取截圖判讀。
8. 語音助理:讓 Agent 用「聽」與「說」服務客戶(Realtime / STT + LLM + TTS)。
9. 技能:定義 Agent 的多步驟推理與判斷流程。
10. 爬蟲:從網頁自動抓取內容,匯入知識庫。
- Agent 是你在 MaiAgent 上建立的 AI 對話角色。每一個 Agent 都是一個獨立的對話機器人,有自己的身份、個性、知識和能力。
- Agent 的理解和回覆能力來自背後的大型語言模型(LLM)。你可以把 LLM 想成 Agent 的「腦力」——不同的模型在理解力、回覆品質、速度和成本上各有差異。建立 Agent 時,你可以選擇適合場景的模型。MaiAgent 支援多種模型,包括 Claude、GPT 等,不需要自己管理模型,平台會幫你處理。
- MaiAgent 提供兩種回覆模式:
- Chat 模式:適合一般問答,直接用知識庫內容回覆。
- Agent 模式:適合需要多步驟推理的場景,Agent 會自行判斷要查什麼資料、用什麼工具。 - Agent 具備記憶能力:
- 對話記憶:在同一輪對話中記得前面聊過的內容。
- 長期記憶:跨對話記住重要資訊,不用每次重新介紹。
- 知識庫是 Agent 的企業知識百科。把公司文件、FAQ、網頁內容放進知識庫,Agent 就能根據這些資料回答使用者的問題。
- 知識庫可以放的資料類型:文件上傳、FAQ、爬蟲匯入。
- 資料庫讓 Agent 能用自然語言查詢結構化數據。
- 應用場景:數據查詢、統計分析、即時狀態。
- 支援資料庫類型:
- MaiAgent 內建資料庫:平台自帶的資料庫,可直接上傳 CSV 或手動建表。
- 外部資料庫:連線到你的 PostgreSQL、MySQL、SQL Server、Oracle。 - Agent 只會執行唯讀查詢(SELECT),不會修改或刪除你的資料。也可以限制 Agent 能存取的表格和欄位。
- 就像幫 Agent 設了一個鬧鐘——時間到了,它就自動開工。按照設定的時間自動執行任務。你給它一段提示詞,設定排程時間,Agent 就會定時執行並把結果送到指定的地方。
- 應用情境:定期報告、監控檢查、資料處理、單次特定動作。
-
工具讓 Agent 能「動手做事」——呼叫外部服務來執行動作或取得即時資訊。
- 工具類型:
- API 工具:直接呼叫 REST API。你設定 URL、HTTP 方法、參數,Agent 就能在對話中使用。
- MCP 工具:透過 MCP(Model Context Protocol)連接外部服務。MCP 是一個標準化的協議,讓 Agent 能更方便地串接各種服務。
- 內建工具:MaiAgent 預設提供的工具,例如 AI 圖像生成。不需額外設定即可使用。
- Code Interpreter 讓 Agent 能在安全沙盒環境中執行 Python 程式碼,用程式的方式完成任務。啟用 Code Interpreter 後,Agent 不再只能用文字回答,它還能:自己寫程式做計算、處理你上傳的檔案、產出 Word/PowerPoint/Excel 等檔案,並把結果回傳下載。
- 應用情境:
- 資料分析與計算:CSV/Excel 試算、統計、樞紐、清洗。
- 圖表繪製:把資料畫成折線、長條、圓餅等圖表。
- 文件生成:產出 Word、PowerPoint、Excel、PDF 給你下載。
- 檔案處理:解析 PDF、轉換格式、批次處理上傳檔案。 - 沙盒環境:
- 執行環境是安全沙盒,與正式系統隔離,不會影響其他資料。
- 支援標準 Python 與常見資料/文件處理套件。
- Agent 產生的檔案會出現在聊天介面的 Output 面板,可直接下載。
-
Browser Tool 讓 Agent 能操控瀏覽器:自己導航到網頁、點擊按鈕、填寫表單、捲動畫面,並透過螢幕截圖「看見」當下頁面,再決定下一步要做什麼。MaiAgent 的 Browser Tool 是內建在 Agent 上的版本,啟用後對話中就能直接使用,不需要額外串接外部服務。
- 應用情境:
- 導航與探索:開啟指定 URL、跟著連結逐頁瀏覽。
- 與頁面元素互動:點擊、雙擊、輸入文字、按鍵、捲動。
- 視覺理解:每次操作後擷取截圖,Agent 看畫面決定下一步。
- 多步任務:登入 → 搜尋 → 篩選 → 取得資料這類連續流程。 - 適合的場景:
- 沒有公開 API 的內部系統,但有 Web UI 可以操作。
- 從第三方網站抓取需要登入或互動的資訊。
- 自動化跨頁面、跨步驟的網頁流程(搜尋、篩選、下載)。
- 任何「人在瀏覽器上會做的事」,但你想交給 Agent 自動完成。
-
語音助理讓 AI 助理能透過語音互動:使用者用講的,AI 也用講的回。底層整合即時語音模型、STT(語音轉文字)、TTS(文字轉語音)與中斷控制,可用於電話客服、IVR、語音助理等情境。
-
三種互動模式。不同模式適合不同需求,取決於延遲、聲線自訂彈性、工具支援度。
- 即時對話(Realtime)
- 即時對話 + TTS
- STT + LLM + TTS - 應用場景:
- 電話客服:取代傳統 IVR,AI 直接接電話、聽問題、給答案。
- 語音查詢系統:客戶打電話查訂單、查餘額、查保單。
- 語音 FAQ:常見問題用講的直接問。
- 行車 / 雙手忙場景:使用者沒辦法打字,但需要 AI 協助。
- 無障礙需求:對打字困難的使用者更友善。
- 技能是 Agent 的多步驟推理流程。用自然語言定義一套 SOP,Agent 在對話中遇到相關情境時,就會按照這套流程一步步處理。如果工具是 Agent 的「單一能力」,技能就是「把多個能力串成一套完整的處理流程」。
- 技能內可以引用 Agent 已掛載的工具和知識庫,讓流程中需要查資料或執行動作時自動完成。
- 適合用技能場景:
- 有固定 SOP 的流程:報價、客訴處理、問題診斷。
- 多輪收集資訊:預約流程(要問日期、時間、人數)。
- 條件判斷:根據不同情況走不同處理路徑。
- 確保不遺漏步驟:表單填寫引導、審核流程。
-
爬蟲能自動從網頁抓取內容,並匯入到知識庫中。你只要給它一個網址,它就能爬取該頁面(或整個網站)的文字內容,轉換成 Agent 能查閱的知識。
- 應用情境:
- 官網內容:把公司官網的產品介紹、服務說明自動匯入。
- 公開資訊:抓取法規、公告、技術文件等公開網頁。
- 持續更新:網站內容會變動,定期重新爬取保持知識庫最新。