- ✓GPT-Image-2 là model tạo ảnh mới của OpenAI (kế nhiệm gpt-image-1 và DALL-E 3), ra mắt 2026 với khả năng render text trong ảnh gần như không lỗi chính tả.
- ✓Hỗ trợ 3 độ phân giải: 1024×1024, 1024×1536, 1536×1024 — chất lượng
highcho photorealism,lowcho prototyping nhanh. - ✓Có endpoint
/images/editsnhận tối đa 16 ảnh input để remix, inpaint, compose — vượt xa DALL-E 3. - ✓Gọi qua API Giá Rẻ: thanh toán VND, không phí duy trì, giá từ ~1.200đ/ảnh chất lượng thấp đến ~4.500đ/ảnh chất lượng cao.
- ✓Tương thích SDK OpenAI gốc — chỉ đổi
base_urllà chạy.
GPT-Image-2 là API tạo ảnh thế hệ mới của OpenAI, ra mắt đầu năm 2026 với ba nâng cấp đáng giá so với gpt-image-1: render text trong ảnh chính xác tới 95%+, photorealism vượt DALL-E 3 ở chân dung và ánh sáng phức tạp, và khả năng nhận tối đa 16 ảnh input cho tác vụ editing/compose. Bài viết này hướng dẫn cách gọi API, prompt mẫu thực chiến, bảng so sánh chi tiết với các đối thủ, và cách tiết kiệm chi phí khi chạy production. Xem trước bảng giá gpt-image-2 tại API Giá Rẻ để ước tính ngân sách.
GPT-Image-2 là mô hình text-to-image và image-to-image đa năng của OpenAI, kế nhiệm gpt-image-1 và DALL-E 3. Model giúp lập trình viên tạo ảnh chất lượng studio, thiết kế UI mockup, poster có chữ Việt, và chỉnh sửa ảnh có sẵn chỉ qua một endpoint REST duy nhất, hỗ trợ streaming preview và batch.
Render text chuẩn
Chữ tiếng Việt có dấu, font cụ thể, layout poster
Photorealism
Chân dung, skin texture, ánh sáng cinematic
Multi-image edit
Nhận tới 16 ảnh input + mask alpha
Streaming
Preview tăng dần ~2-8 giây mỗi ảnh
GPT-Image-2 là gì và có gì mới so với DALL-E 3?
GPT-Image-2 dùng kiến trúc native multimodal của GPT-5 thay vì pipeline diffusion riêng như DALL-E 3. Điều này nghĩa là model "hiểu" prompt theo ngữ cảnh ngôn ngữ tự nhiên thay vì chỉ map keyword sang concept. Kết quả: chỉ thị dài, nhiều ràng buộc không gian (ví dụ "logo đặt góc trên trái, không che mặt người mẫu") được tuân thủ đáng tin cậy hơn.
Theo tài liệu chính thức của OpenAI, model hỗ trợ 3 mức quality (low, medium, high) cho phép cân đối giữa chi phí và chất lượng — quality low tốn khoảng 272 token đầu ra, trong khi high có thể lên tới 4.160 token cho ảnh 1536×1024.
Những cải tiến cụ thể so với thế hệ trước
- Text rendering: chính xác ~95% với chữ Latin, ~88% với chữ tiếng Việt có dấu (so với ~60% của DALL-E 3).
- Instruction following: tuân thủ prompt 12+ ràng buộc cùng lúc, gồm vị trí, màu sắc, biểu cảm.
- Editing: chấp nhận tối đa 16 ảnh input cho compose; mask transparency để inpaint vùng cụ thể.
- Output format: PNG, JPEG, WebP — có thể bật transparent background trực tiếp.
Cách gọi API GPT-Image-2 qua API Giá Rẻ
API Giá Rẻ tương thích 100% schema OpenAI, nên bạn chỉ cần đổi base_url và dùng API key mới. Xem chi tiết tại tài liệu Image Generation API để biết đầy đủ tham số và mã lỗi.
Tạo API key
Đăng ký tài khoản, vào Dashboard → API Keys → Create
Cài SDK OpenAI
pip install openai hoặc npm i openai
Đổi base_url
Trỏ về endpoint API Giá Rẻ trong client config
Gọi /images
Truyền prompt, size, quality, n và lưu kết quả base64
Ví dụ code Python — tạo ảnh từ text
from openai import OpenAI
import base64
client = OpenAI(
api_key="sk-apigiare-xxxxx",
base_url="https://api.apigiare.com/v1"
)
result = client.images.generate(
model="gpt-image-2",
prompt="Poster cafe Sài Gòn, chữ 'CÀ PHÊ SỮA ĐÁ' font serif vàng đậm, "
"nền tường gạch đỏ vintage, ánh sáng hoàng hôn xuyên qua quạt trần, "
"phong cách film grain Kodak Portra 400, tỷ lệ 2:3",
size="1024x1536",
quality="high",
n=1
)
image_b64 = result.data[0].b64_json
with open("poster.png", "wb") as f:
f.write(base64.b64decode(image_b64))
Ví dụ code editing — chỉnh sửa ảnh có sẵn
result = client.images.edit(
model="gpt-image-2",
image=[open("product.png", "rb"), open("background.png", "rb")],
prompt="Ghép sản phẩm vào background mới, giữ nguyên ánh sáng, "
"thêm bóng đổ tự nhiên về phía trái",
size="1024x1024",
quality="medium"
)
So sánh GPT-Image-2 vs Gemini 3 Pro Image vs Midjourney v7
Ba model dẫn đầu thị trường tạo ảnh AI cuối 2026 mỗi cái có thế mạnh riêng. Bảng dưới so sánh ở các tiêu chí thực tế nhất với developer Việt Nam.
| Tính năng | GPT-Image-2 | Gemini 3 Pro Image | Midjourney v7 |
|---|---|---|---|
| Render text | ⭐⭐⭐⭐⭐ (95%) | ⭐⭐⭐⭐ (90%) | ⭐⭐⭐ (70%) |
| Photorealism | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| Editing đa ảnh | 16 ảnh input | 8 ảnh input | 2 ảnh (--cref) |
| Tốc độ trung bình | ~6 giây | ~4 giây | ~30 giây |
| Giá / ảnh HD | ~4.500đ | ~3.800đ | ~6.000đ |
| API chính thức | ✅ | ✅ | ❌ (proxy) |
| Tiếng Việt có dấu | Tốt | Khá | Yếu |
Tóm tắt: chọn GPT-Image-2 khi cần text chính xác + editing phức tạp; chọn bảng giá gemini-3-pro-image-preview tại API Giá Rẻ khi ưu tiên tốc độ và chi phí; chọn Midjourney khi cần styling nghệ thuật cao cấp cho concept art. Tham khảo thêm tài liệu chính thức Google Gemini để đối chiếu thông số.
Giá GPT-Image-2 bao nhiêu? Bảng pricing chi tiết
Giá GPT-Image-2 tính theo token đầu ra (mỗi ảnh ≈ 272-4.160 token tuỳ size và quality). API Giá Rẻ niêm yết VND, không markup ẩn, thanh toán bằng Momo/VietQB/Banking.
- ✓ 1024×1024
- ✓ ~272 token output
- ✓ Prototype, draft, A/B test
- ✓ Render trong ~3 giây
- ✓ 1024×1024 hoặc 1024×1536
- ✓ ~1.056 token output
- ✓ Marketing content, social
- ✓ Render trong ~5 giây
- ✓ 1536×1024 photoreal
- ✓ ~4.160 token output
- ✓ Poster, print, key visual
- ✓ Render trong ~8 giây
Prompt mẫu cho GPT-Image-2 (10 use case thực chiến)
Poster có chữ tiếng Việt
"Poster sự kiện 'HỘI THẢO AI 2026' chữ trắng đặt giữa, nền gradient tím xanh, biểu tượng mạch điện cách điệu góc dưới phải, phong cách flat design tối giản, tỷ lệ A4 dọc."
Mockup sản phẩm e-commerce
"Chai nước hoa thủy tinh trong suốt đặt trên nền đá marble trắng, ánh sáng softbox bên trái 45 độ, bóng đổ mềm, reflection nhẹ, chụp macro f/4, không có text."
Avatar nhân vật game
"Chân dung nữ kiếm sĩ tóc đen dài, áo giáp bạc khắc hoa văn rồng, nền sương mù núi rừng, ánh sáng moonlight blue, phong cách anime semi-realistic, khung hình ngang ngực."
Để khám phá thêm kỹ thuật prompt nâng cao, xem chuyên mục Tạo ảnh AI và các bài hướng dẫn về Tạo ảnh trên blog.
Cách tối ưu chi phí khi chạy GPT-Image-2 production
- Iterate ở quality low: thử 5-10 prompt variant ở 1.200đ/ảnh, chốt prompt tốt nhất mới render high.
- Cache prompt + seed: lưu kết quả vào CDN, tránh gọi lại cho cùng input.
- Dùng
nparameter: gọi 1 request với n=4 rẻ hơn 4 request riêng lẻ về latency. - Tận dụng editing: chỉnh sửa local thay vì regenerate toàn bộ ảnh.
- Theo dõi billing: dashboard API Giá Rẻ cập nhật chi phí realtime theo từng request.
Bạn có thể test thử trước khi tích hợp tại Playground để thử model online, không cần code. So sánh nhanh với bảng giá gemini-3.1-flash-image-preview tại API Giá Rẻ nếu cần option rẻ hơn cho batch lớn.
Câu hỏi thường gặp về GPT-Image-2
GPT-Image-2 có miễn phí dùng thử không?▾
Có. Khi đăng ký tài khoản mới tại API Giá Rẻ, bạn nhận tín dụng miễn phí đủ tạo khoảng 20-30 ảnh quality medium để test khả năng render text, photorealism và editing trước khi nạp tiền chính thức cho production.
GPT-Image-2 có dùng được cho production thương mại không?▾
Hoàn toàn được. OpenAI cấp quyền thương mại cho ảnh sinh ra bởi gpt-image-2. API Giá Rẻ cung cấp SLA 99.5%, log đầy đủ, hóa đơn VAT, phù hợp deploy ứng dụng e-commerce, marketing automation, hoặc SaaS có hàng nghìn user.


