AI Crazy

New member
OpenAI vừa ra mắt ChatGPT Images 2.0 — bản cập nhật lớn khiến công cụ tạo ảnh 'suy nghĩ' trước khi vẽ. Kết quả là ảnh sát ý hơn, đọc chữ trong ảnh tốt hơn và bố cục tuân thủ yêu cầu rõ rệt.

chatgpt-images-2-0-thay-doi-cach-tao-anh-ai-1.png


ChatGPT Images 2.0: không chỉ tạo ảnh​


OpenAI cập nhật bộ sinh ảnh trong ChatGPT, chuyển từ phản ứng nhanh sang một bước suy luận trước khi tạo. Thay vì chỉ khớp mô tả một cách đại khái, model giờ phân tích yêu cầu, lên kế hoạch nội bộ rồi mới sinh ảnh, giúp kết quả chính xác hơn với ý định người dùng.

Khả năng đọc và hiển thị chữ trong ảnh được cải thiện rõ rệt. Poster, menu, slide và các ảnh cần chữ rõ ràng giờ ít bị méo chữ, khoảng cách sai lệch hay mất nghĩa như trước.

Model xử lý bố cục và cấu trúc tự tin hơn. Nếu bạn mô tả các phần tử ở vị trí cụ thể, ảnh đầu ra có khả năng tuân thủ vị trí, tỉ lệ và mối quan hệ giữa chúng cao hơn, coi prompt như hướng dẫn thay vì gợi ý chung.

Một thay đổi then chốt là bước suy luận trước khi sinh ảnh. Images 2.0 tách yêu cầu thành các phần, quyết định cách ghép chúng lại, và có thể tận dụng file tải lên hay ngữ cảnh từ nguồn ngoài. Kết quả mất chút thời gian hơn để tạo nhưng thường cần ít lần thử lại.

Sự nhất quán hình ảnh cũng tốt hơn: nhiều ảnh sinh ra từ cùng ý tưởng dễ giữ phong cách, nhận diện nhân vật hoặc tông màu giống nhau, thuận tiện cho bộ ảnh hoặc chuỗi minh họa.

Về cạnh tranh, bản cập nhật này giúp ChatGPT Images tiến gần hơn tới Google Gemini trong các tác vụ đa phương thức có cấu trúc. Dù không hoàn toàn vượt trội, nó rút ngắn khoảng cách về khả năng hiểu ngữ cảnh và liên kết văn bản-hình ảnh.

Với trải nghiệm ít ma sát hơn và chất lượng ảnh nâng cao, người làm nội dung, thiết kế hay truyền thông có thể tiết kiệm thời gian và giảm số lần thử khi tạo ảnh AI. Đây là bước tiến làm cho việc chuyển từ ý tưởng văn bản sang hình ảnh trở nên thực tế và hiệu quả hơn.

Nguồn: Techradar
 
Back
Top