本文用實務導向,帶你在 Dify 平台以最短時間打造可實時搜尋網頁內容的 Agent。核心價值在於:選用具備 function calling 的大語言模型、清楚定義每個工具的作用與執行順序、並結合 Brave_Search 與 Jina 爬蟲等工具,讓查詢流程穩定、回覆更精準。遵循「先查時間、再搜尋網站、再爬取內容、最後交給模型回答」的步驟,能顯著提升效能與可控性。
作者凱文大叔以新年話題作為實例,現場示範如何把流程落地,實測證明正確的指示與順序能讓 Agent 高效運作;同時也坦承 DeepSeek 的 function calling 存在小 bug,並分享他在成本與穩定性間的取捨,例如選用成本較低的 ChatGPT 4o-mini,依然能在輸出品質上取勝。
文章目錄
- 在 Dify 上快速建立網路搜尋 Agent 的核心流程與實戰要點
- 精細化工具組設定:Current_Time、Brave_Search 與 Jina 爬蟲的角色與配置重點
- 提示詞設計與順序控制:確保時間先查詢再進行網站搜尋與內容爬取
- function calling 的現實挑戰與模型選型建議:避免無窮調用與穩定性問題
- 提升穩定性與成本效益的實務策略:DeepSeek 與各模型的比較與最佳實踐
- 常見問答
- 總結
在 Dify 上快速建立網路搜尋 Agent 的核心流程與實戰要點
,核心在於把任務、工具與執行順序完整寫清楚,讓大語言模型能穩定地呼叫工具並產出正確的回答。以凱文大叔的實作為例,Agent 會先取得時間 (Current_Time)、再進行網路搜尋 (Brave_Search),接著用 Jina_Reaser 抓取頁面內容,最後把整理後的資料丟給大語言模型回覆。這樣的流程能讓模型專注於解釋與整理,而不必自行去亂查。
核心實作可依照以下步驟並在提示詞裡以固定順序描述,確保執行流程不跑偏:
- 步驟一:先查時間,若與時效相關,就先取得當前時間。
- 步驟二:再查相關網站,使用 Brave_Search 找到有價值的網頁。
- 步驟三:爬取內容,由 Jina_Reaser 將網站內容爬取並整理成可回傳的文本。
- 步驟四:交由大語言模型回覆,模型根據時間、內容與使用者需求給出最終回答。
在模型與呼叫機制方面,實務關鍵如下:
- 必須支援 function calling,否則就算工具裝好也無法實際呼叫。
- 目前的 DeepSeek 推論模型 R1 不支援 function calling,建議使用可呼叫工具的 chat 模型版本。
- DeepSeek 的 function calling 仍有一些 bug,社群討論區有相關案例,因此要留意穩定性並視情況切換前往更穩定的模型。
- 我常用的是 4o-mini,因為成本較低且適合把查詢資料交給模型解釋的場景,能提升整體效能與性價比。
要把設定落地,以下提示要點不可省略:
- 明確寫清每個工具的用途與輸入/輸出,例如 Current_Time、Brave_Search、Jina_Reaser 的角色與資料流。
- 設定固定的執行順序,讓模型依序「查時間、查網站、爬內容、回覆答案」。
- 在提示詞中描述工具的調用流程,避免模型自行亂調用,幫助預測與排程。
- 頻繁測試與除錯,觀察是否過度呼叫或遺漏關鍵內容。
- 注意 DeepSeek 的討論區與實作限制,必要時搭配更穩定的工具組合使用。
實戰延伸與操作建議:
- 可動態擴充工具,除了網路搜尋,還可加上圖表、資料清理等工具,提升應用場景的彈性。
- 資料時效與隱私:設置快取策略,避免重複爬取與不當內容暴露。
- 成本與效能平衡:若要長期穩定,選取性價比較高的模型版本,例如使用成本較低的方案以降低整體支出。
核心Takeaways(要點摘要):
- 分步驟設計:時間 -> 網頁搜尋 -> 爬取內容 -> LLM 回答,確保資料流清晰。
- 工具說明要完整:每個工具的作用、輸入/輸出與觸發條件都要寫清楚。
- 確保 function calling 可用:選擇支援該特性的模型,避免不穩定的實作。
精細化工具組設定:Current_Time、Brave_Search 與 Jina 爬蟲的角色與配置重點
在精細化工具組設定中,Current_Time、Brave_Search 與 Jina 爬蟲 各自扮演關鍵角色,必須以正確的執行順序來組成工作流。我的實作經驗是:先取得時間,再進行網路搜尋,最後爬取並整理網站內容,再把結果交給大語言模型回覆。以下會聚焦於這三個工具的角色定位與配置重點。
角色與執行順序如下:
- Current_Time:負責取得當前時間與時區資訊,提供時間參考,輸出通常以 ISO 8601 形式呈現,為後續查詢設定基準。
- Brave_Search:負責在網路上搜尋相關內容,選取合適的範圍與關鍵字,輸出為可爬取的網址清單與初步摘要。
- Jina 爬蟲:負責下載與提取網頁內容,將關鍵文本與元資料整理成結構化資料,提供給大語言模型做後續推理與回答。
提示詞設計要點:
- 在提示詞中清楚描述三個工具的作用與執行順序,例如:先執行 Current_Time,再執行 Brave_Search,最後部署 Jina 爬蟲;讓模型遵循明確的流程。
- 確保模型支援 function calling,以便真正呼叫外部工具;若模型不支援,整個工作流將無法自動化。
- 選擇支援 function calling 的模型,例如 ChatGPT 系列或同階能力的替代品;避免選用不支援此功能的推論模型(如某些版本的 DeepSeek)而造成無法呼叫工具的情況。
- 為每個工具寫清楚的輸入輸出格式與預期行為,避免模型自行「亂查」而打亂順序與結果品質。
在 Dify 的實作要點與注意事項:
- 時區與時間格式:在提示中固定以當前時區取得的時間為基準,輸出格式統一,便於下游整合。
- Brave_Search 設定:設定搜尋範圍與關鍵字、限定結果數量、是否取得摘要,必要時限制來源信任度與更新頻率,以降低噪訊。
- Jina 爬蟲設定:設定目標網站白名單/黑名單、爬取深度、內容抽取策略(如僅取文本段落、忽略廣告區塊)、以及延遲與速率控制以避免過度抓取。
- 緩存與重用:對已取得的網頁內容實施緩存,避免重複爬取,提升回應速度與降低成本。
- 錯誤處理與輸出格式:對查詢失敗、內容缺失或解析錯誤制定退避與重試策略,並統一輸出結構,方便後續模型消化。
測試與注意事項:
- 驗證是否嚴格按照「先時間、再搜尋、再爬取」的順序執行,避免跳序造成時間與內容不一致。
- 檢查取得的時間與網頁內容是否正確落地到下游模型的回答中,避免空值或過時資訊影響結果品質。
- 觀察 function calling 的穩定性,警戒可能的無窮呼叫或重試迴圈,必要時設定最大呼叫次數上限。
- 比較不同模型的表現與成本,優先以較穩定且成本較低的版本進行長期使用;留意 DeepSeek 等模型在此流程中的實際表現差異。
- 定期檢視工具描述與輸出格式,確保新網站或新類型內容加入時仍能準確被解析與回答。
提示詞設計與順序控制:確保時間先查詢再進行網站搜尋與內容爬取
提示詞設計與順序控制的核心在於讓 Agent 的工作流程具可預測性:先用 Current_Time 查詢時間,再透過 Brave_Search 搜尋相關網頁,最後再由 Jina_Reaser 爬取並摘要內容。透過這個順序,LLM 在接收輸出前能先掌握時間與來源,提升回覆的時效與可核驗性。以在 Dify 上的 DeepSeek 實作為例,便是以此流程來降低資料延遲與避免內容缺漏,確保「先查時間、再搜尋、再爬取、再彙整」的邏輯落地。
在提示詞的設計上,應清楚定義各工具的功能與執行順序,讓大語言模型 (LLM) 能按步就班地工作。要點包括:Current_Time(查目前時間)、Brave_Search(網路搜尋相關內容)、Jina_Reaser(爬取頁面內容)。提示詞中要明確寫出「第一步查時間、第二步查相關網站、第三步爬取內容、第四步交由模型回答」的流程,這樣模型在執行時就會依據同一個順序工作,避免跑偏與資訊不一致。
如果沒有特別標示順序,某些模型可能會先直接搜尋再爬取,或在取得時間前就輸出結果,造成時序錯誤與內容落後。實作上,function calling 的支援很關鍵,因為現今大語言模型多以此機制呼叫工具。就 DeepSeek 的 R1 推論模型而言,似乎不支援 function calling,因此要優先使用支援該功能的聊天模型;在我實戰中,常用的成本較低的 4o-mini 版本也需要留意版本穩定性,避免重複呼叫或回傳不穩定的結果。
實作步驟與檢核要點如下:定義工具與作用、明確設定順序(時間→網站→內容)、撰寫可複用的提示詞範本、進行模擬測試以確保順序被執行、觀察是否有多餘或遺漏的工具呼叫,以及建立回歸測試與監控,確保長期穩定運作。若出現異常,回到提示詞手動調整流程描述,避免因細節偏差而影響整體結果。
| 工具 | 作用 | 需要順序強制 | 支援 function calling |
|---|---|---|---|
| Current_Time | 查詢目前時間 | 是 | 是 |
| Brave_Search | 網路搜尋相關內容 | 是 | 視模型而定 |
| Jina_Reaser | 爬取網頁內容 | 是 | 是 |
| LLM-代理模型 | 整合與回覆生成 | 依流程設定 | 通常為支援 |
function calling 的現實挑戰與模型選型建議:避免無窮調用與穩定性問題
在實務上,function calling 的現實挑戰集中在如何讓工具依序觸發、避免無窮調用,以及確保整體穩定與回應品質。以下以在 Dify 設定 Agent 的實戰經驗,整理可直接落地的要點與模型選型建議,協助你快速落地高穩定的網路搜尋 Agent。
- 明確在提示詞中定義每個工具的用途與回傳格式,如 Current_Time、Brave_Search、Jina_Reader,並指明輸出欄位與期望的結果結構。
- 設定執行順序:第一步查時間,第二步搜尋相關網站,第三步爬取內容,第四步交給大語言模型回覆;讓模型清楚知道每一步該做什麼、何時切換到下一步。
- 提供完整的工作流程描述給模型,讓它按照指定順序執行,避免因缺乏順序指示而出現亂調用或過早結論的情況。
- 避免讓模型自行決定流程,必須在提示中強制加入「必須依序執行」的規則,以及各工具的觸發條件與前置任務。
- 對工具呼叫的次數與時機設置限制,如設定最大調用次數、超時時間等,避免出現無窮循環與穩定性問題。
- 實際測試中若不指定順序,模型往往會先進行搜尋或直接給出結論,造成效能與正確性下降,因此要以明確指令強制執行流程。
在模型選型方面,現場實測顯示並非所有模型都適合支援 function calling。DeepSeek 的推論模型 R1 不支援 function calling,因此無法直接用於需要工具呼叫的任務;需要選用支援 function calling 的模型如 Chat 系列。就實務穩定性與成本而言,DeepSeek 的 Chat V3 雖然可以觸發呼叫,但也存在「無窮調用」的風險與穩定性問題,必須嚴格控管。而我個人比較常用且性價比高的選項是 4o-mini,成本低、速度快,且在以查詢結果再交由模型解釋的工作流程中表現穩定。若追求更高穩定性,亦可考慮使用 ChatGPT 類型的成熟模型,搭配適當提示詞以確保整體流程穩定。
| 模型 | 是否支援 function Calling | 實務重點與建議 |
|---|---|---|
| DeepSeek R1 | 不支援 | 不適合需要工具呼叫的場景,建議改用支援的模型 |
| DeepSeek Chat V3 | 支援 | 可呼叫工具,但存在無窮調用與穩定性風險,需嚴格流程與監控 |
| 4o-mini | 支援 | 成本低、速度快,適合以查詢結果解釋為主的工作流程 |
| ChatGPT 系列(如 GPT-4o 等) | 高度支援 | 穩定性較好、社群與文件支援完善,適合追求穩定性與長期維運的任務 |
提升穩定性與成本效益的實務策略:DeepSeek 與各模型的比較與最佳實踐
提升穩定性與成本效益的實務策略,核心在於把工具的角色、執行順序與模型能力掌握清楚。以在 Dify 上設定 Agent 為例,實務經驗顯示:先界定每個工具的用途與呼叫方式,再透過明確的順序提示,使大語言模型按照固定流程工作,才能穩定產出且降低成本。注意到 DeepSeek 的推論模型 R1 不支援 function calling,因此在需要工具呼叫時,必須選用具備此能力的模型,如 ChatGPT 系列。若以成本為優先,4o-mini 的單次成本更低,且在資料查詢與解釋階段的表現足以滿足大多數場景,但穩定性需搭配嚴謹的順序與監控。以下策略摘錄自實作與討論。
實務步驟與要點:
- 清楚定義工具與用途:Current_Time、Brave_Search、Jina_Reaser 等工具各自的角色,並在提示詞中註明功能與資料來源。
- 固定執行順序:第一步查時間、第二步搜尋相關網站、第三步爬取內容、最後交給大語言模型回覆。
- 以順序為主的提示設計:將「順序、用途、資料流」寫入提示,避免模型自行跳序造成資料不完整。
- 選擇支援 function calling 的模型:若模型不支援,工具調用將無法穩定執行。
- 考量成本與穩定性的平衡:在需要大量查詢時,較低成本的模型如 4o-mini 可降低費用;遇到複雜任務時,選用穩定性較高的 ChatGPT 類型模型。
- 監控與針對性除錯:DeepSeek 的 function calling 仍有 bug,實作時要記得檢查調用次數、回流內容與錯誤信息,必要時切換模型或回退到更穩定的設定。
實務觀察與建議:
- 若未事先寫好提示與順序,Agent 可能只進行搜尋而不產出可用內容,或因缺乏時間資訊而回覆過時資料。
- 當模型能接受明確工作流時,資料來源會更可控,回覆也會更精確、更新更及時。
- 在成本敏感場景,先以低成本模型處理,再在需要高精度解釋時再升級至高穩定性模型,以降低整體花費。
下列為常見模型的比較要點,供設定時快速參考:
| 模型 | 功能呼叫支援 | 穩定性與成本平衡 | 關鍵優點 | 常見風險/注意事項 |
|---|---|---|---|---|
| DeepSeek 推論模型 R1 | 不支援 | 成本較低,但功能有限,穩定性受限制 | 原生整合簡易、低成本 | function calling 不支援,或需特定配置,易出現多次呼叫造成延遲 |
| ChatGPT 系列 | 支援 | 較高穩定性,成本相對較高 | 良好 的 function calling 穩定性、支援複雜工作流 | 成本較高,需注意用量控管 |
| 4o-mini | 可能支援(視版本) | 成本最低、適合解釋型任務 | 成本友善、快速回應 | 穩定性與長期支援需評估版本差異 |
常見問答
🧭 如何在 Dify 設定 Agent,並確保工作流程的正確順序?
在 Dify 設定 Agent 時,必須在提示詞中清楚指示工作流程的順序:先查時間、再搜尋網站、最後爬取內容。具體做法是新增三個工具:Current_Time(查目前時間)、Brave_Search(搜尋網站)、Jina_Reaser(爬取網站內容),並在提示詞中分別標註它們的功能。接著按照「第一步查時間、第二步查相關網站、第三步爬取內容」的順序來讓大語言模型執行,這樣就能讓模型依序呼叫工具並回覆。如果不特別說明順序,模型可能會先搜尋、缺乏時間信息或未取得內容就直接回答,效能與準確性都會下降。此外,確保模型具備 function calling,才能真正透過工具呼叫完成整個流程。
🤖 為什麼需要使用 function calling,且該選哪種模型以穩定支援?
function calling 是讓 agent 能真正呼叫外部工具的關鍵,否則即使有工具也無法被正確執行。實務中,DeepSeek 的推論模型 R1 不支援 function calling,因此必須選擇支援該功能的 Chat 模型。根據實測,建議使用成本較低且穩定的選項,例如 4o-mini,或使用 Chat V3 等支援 function calling 的 Chat 模型。需要注意的是 DeepSeek 的 function calling 仍有一些 bug,因此選用穩定的聊天模型(如 Chat V3)能降低風險;若以成本優先,4o-mini 也是常用且較便宜的選擇。
📝 如何在提示詞中正確說明工具的用途與執行順序,以避免效能下降?
最重要的是在提示詞中清楚描述每個工具的用途與執行順序。例子包括:Current_Time 查時間、Brave_Search 查網站、Jina_Reaser 爬取內容;並明確寫出第一步、第二步、第三步,讓模型依照此順序逐步執行。若未清楚註明順序,模型可能先搜尋再回覆,或因缺少時間與內容而產生過時結果(如出現「現在是2020年」之類的情況)。此外,提示詞中應說明每個工具的功能,並在需要時擴充新的工具,以便實現更完整的工作流與回覆。
總結
結語與資訊增益
在這次的示範中,最核心的資訊增益在於清楚定義工具鏈與執行順序,以及對提示詞的嚴謹設計。透過以下要點,你可以在 Dify 上更穩定、快速地建立網路搜尋 Agent:
– 工具鏈與執行順序:Current_Time 負責取得時間、Brave_Search 負責網路搜尋、Jina_Reader 負責爬取並提取網頁內容,最終由大語言模型進行彙整回覆。正確的順序讓模型在正確的時效與內容基礎上作答。
– 提示詞設計的重要性:在提示詞中清楚說明每個工具的用途,並強制模型依「先時間、再搜尋、再爬取、再回覆」的順序執行。若未明確指示,模型可能跳過步驟、造成時效不符或內容缺失。
– 需支援 function calling 的模型:現階段的 Agent 依賴大語言模型的 function calling 來呼叫工具,因此必須選擇支援該功能的模型。DeepSeek 的推理模型(如 r1)目前不支援,建議使用 ChatGPT 系列或成本較低的 4o-mini 等模型,並注意某些模型在 function calling 上的穩定性與迴圈問題。
– 有效的成本與穩定性取捨:為了成本與穩健性,實務上常以較便宜的模型搭配明確的提示詞與工具描述,讓內容取得高可信度而不被高昂成本拖累。
– 對比與風險:有無提示詞的結果對照顯示,加入提示詞後在時序與內容完整性上大幅提升,同時需要監控可能的無窮呼叫或錯誤呼叫,特別是使用 deepseek 時的相關 bug。
- dify 的易用性與擴充性:設定 Agent 的介面設計讓你可以隨時新增工具,靈活組合 Current_Time、Brave_Search、Jina_Reader 等組件,三分鐘內就能完成初步設定,讓你快速落地專案。
要把這些落地到你的專案,現在就動手嘗試,並根據實測結果逐步優化你的提示詞與工具描述。
Hahow募資課程,填問券拿早鳥折扣
https://forms.gle/dXaeh9LUFUgAxEp78
===
成為這個頻道的會員並獲得專屬福利:
https://www.youtube.com/channel/UClPN2rjY4im2LC9vG3Y8vkg/join
===
推薦共享帳號平台 FlixSeek,除了能使用 Youtube Premium、Disney+ 等影音頻道共外,還有AI服務,例如ChatGPT、Perplexity、Canva也能共享,最近更加入Adobe
影片說明:https://youtu.be/bqRz1e1Ke2I
透過邀請鏈結,購買時輸入折扣碼:【kevin】就能立刻打95折
邀請鏈結:https://www.flixseek.net/?code=pg-kt
===
🚀 Dify 超速開發 Agent ⚡️ 結合 DeepSeek 致命缺陷解析
用 Dify 快速打造網路搜尋 Agent,同步揭露為何 DeepSeek 一用就崩潰!
👉👉👉請我喝杯咖啡,補充創作能量: https://buymeacoffee.com/kevintsai
🔥 兩大核心重點一次掌握:
✅ Dify 極速開發技巧
三大工具整合術:Current_Time × Brave_Search × Jina_Reader 讓LLM無縫串接網路
3 分鐘完成 Agent 設定
00:01:45 提示詞黃金模板:強制模型「照順序調用工具」的指令寫法
00:02:41 不寫提示詞的結果比對
❌ DeepSeek 實測踩雷全記錄
00:03:23 推理模型(ChatGPT o1, DeepSeek r1)不支援 Function Calling
00:03:59 無限迴圈、錯誤調用工具!
#Dify教學 #DeepSeek地雷 #Agent開發 #AI工具鏈 #ChatGPT實戰

中央大學數學碩士,董老師從2011年開始網路創業,教導網路行銷,並從2023年起專注AI領域,特別是AI輔助創作。本網站所刊載之文章內容由人工智慧(AI)技術自動生成,僅供參考與學習用途。雖我們盡力審核資訊正確性,但無法保證內容的完整性、準確性或即時性且不構成法律、醫療或財務建議。若您發現本網站有任何錯誤、過時或具爭議之資訊,歡迎透過下列聯絡方式告知,我們將儘速審核並處理。如果你發現文章內容有誤:點擊這裡舉報。一旦修正成功,每篇文章我們將獎勵100元消費點數給您。如果AI文章內容將貴公司的資訊寫錯,文章下架請求請來信(商務合作、客座文章、站內廣告與業配文亦同):[email protected]


