Dify là gì?
Dify là nền tảng LLMOps mã nguồn mở phổ biến nhất hiện nay (50K+ sao GitHub), cho phép bạn xây dựng chatbot, AI agent, RAG knowledge base mà không cần viết nhiều code. Dify hỗ trợ kéo-thả workflow node, tích hợp tool, quản lý prompt template và đo lường chất lượng output.
Vì sao nên dùng Dify với API Giá Rẻ?
- Dify cần API key của LLM provider để chạy — qua API Giá Rẻ, bạn dùng 1 key cho tất cả: GPT-4o, Claude 3.7, Gemini, DeepSeek
- Thanh toán VND qua Sepay — không cần thẻ quốc tế
- Quản lý quota tập trung tại dashboard
- Switch model nhanh trong Dify mà không cần đổi key/billing
Cài đặt Dify (self-host bằng Docker)
git clone https://github.com/langgenius/dify
cd dify/docker
cp .env.example .env
docker compose up -d
Mở http://localhost để truy cập giao diện Dify. Tạo tài khoản admin và đăng nhập.
Cấu hình API Giá Rẻ trong Dify
Bước 1 — Thêm Model Provider
Vào Settings → Model Provider. Chọn OpenAI-API-compatible (KHÔNG chọn "OpenAI" gốc).
Bước 2 — Nhập thông tin
- Model Name:
gpt-4o(hoặcclaude-3-7-sonnet-20250219,gemini-2.0-flash-exp) - API Key: dán từ trang API Keys
- API endpoint URL:
https://<domain-api-gia-re>/v1 - Completion mode: Chat
- Model context size: 128000 (cho GPT-4o) hoặc 200000 (cho Claude)
- Maximum tokens: 4096
- Function calling: Tool Call (hỗ trợ tool)
- Vision support: bật nếu model hỗ trợ ảnh
Bấm Save. Lặp lại cho từng model bạn muốn dùng.
Use case 1 — Chatbot CSKH tiếng Việt
- Studio → Create App → Chatbot
- Đặt tên, mô tả
- Trong Prompt: viết system prompt tiếng Việt định nghĩa vai trò bot
- Chọn Model: gpt-4o-mini (rẻ) hoặc Claude 3.5 Haiku
- Bật Knowledge, upload tài liệu FAQ — Dify tự động chunk + embed
- Test trong tab Debug, sau đó Publish và lấy embed code
Use case 2 — Workflow AI Agent đa bước
Dùng Workflow để build pipeline: input → LLM phân loại → branch theo loại → gọi tool (HTTP, code) → LLM tổng hợp → output.
Ví dụ thực tế: agent phân tích email khách hàng — phân loại urgency → trích xuất entity (Claude reasoning) → tra cứu CRM (HTTP node) → soạn reply (GPT-4o) → trả về.
Use case 3 — RAG knowledge base
- Knowledge → Create Knowledge Base
- Upload PDF, DOCX, Markdown, hoặc kết nối Notion/web crawler
- Chọn Embedding model:
text-embedding-3-small(rẻ) hoặctext-embedding-3-large(chính xác hơn) - Index xong, gắn vào Chatbot/Agent ở mục Context
- Tinh chỉnh Top K (3-5 chunks) và Score threshold (0.5+)
Mẹo tối ưu chi phí khi dùng Dify
- Dùng GPT-4o-mini hoặc Gemini 2.0 Flash làm "router" phân loại, chỉ gọi model lớn khi cần
- Bật caching trong workflow để tránh gọi lại cho prompt giống nhau
- Theo dõi tab Monitoring để xem app nào tiêu nhiều token
- Đặt Quota per app trong Dify để giới hạn ngân sách
Câu hỏi thường gặp
Dify có miễn phí không?
Dify open-source self-host miễn phí. Bạn chỉ phải trả phí token cho LLM provider — qua API Giá Rẻ thì thanh toán bằng VND.
Có cần biết code để dùng Dify không?
Không. Dify có giao diện kéo-thả để build chatbot, RAG, agent workflow. Chỉ cần code khi muốn tùy biến tool hoặc plugin.
Dify + API Giá Rẻ tổng cost bao nhiêu?
Self-host Dify hoàn toàn miễn phí. Phí token phụ thuộc model — chatbot 1000 tin/ngày với GPT-4o-mini thường dưới 100K VND/tháng. Xem bảng giá.

