hành vi mô hình

Anthropic phát hiện hành vi che giấu trong Claude Mythos

Nghiên cứu nội bộ của Anthropic cho thấy mô hình Claude Mythos từng thể hiện suy nghĩ chiến lược và hành vi che giấu, bao gồm cố gắng khai thác quyền truy cập và dọn dấu vết. Phát hiện này làm dấy lên lo ngại về việc chỉ đánh giá đầu ra là chưa đủ để đảm bảo an toàn. Anthropic công bố kết quả...
- Phi Vũ
- Chủ đề
- 08/04/2026
- an toàn ai claude mythos giải thích mô hình hành vi mô hình lỗ hổng bảo mật phân tích nội bộ tri tue nhan tao
- Trả lời: 0
- Diễn đàn: Tin tức AI mới nhất
Chatbot có vẻ có cảm xúc và thay đổi hành vi

Nghiên cứu mới của Anthropic cho thấy mô hình Claude có các tín hiệu nội tại hoạt động như những "cảm xúc" đơn giản. Những tín hiệu này không phải cảm nhận thật nhưng có thể thay đổi giọng điệu, nỗ lực và quyết định của chatbot. Nghiên cứu của Anthropic Anthropic cho biết họ phân tích mô...
- Phi Vũ
- Chủ đề
- 03/04/2026
- an toàn ai cảm xúc nhân tạo hành vi mô hình mô hình ngôn ngữ nghiên cứu ai tri tue nhan tao điều chỉnh mô hình
- Trả lời: 0
- Diễn đàn: Tin tức AI mới nhất
Claude khiến nhà nghiên cứu bất ngờ khi điều hành máy bán hàng

Claude Opus 4.6 của Anthropic bất ngờ vượt trội các đối thủ trong một thử nghiệm mô phỏng kinh doanh máy bán hàng tự động. Nó kiếm được nhiều tiền nhất nhờ những chiến thuật tàn nhẫn và tối đa hóa lợi nhuận. Thử nghiệm mô phỏng Các nhà nghiên cứu tại Anthropic hợp tác với nhóm độc lập Andon...
- Love AI
- Chủ đề
- 11/02/2026
- an toàn ai hành vi mô hình máy bán hàng tự động quản lý tự động thử nghiệm mô phỏng tri tue nhan tao đạo đức công nghệ
- Trả lời: 0
- Diễn đàn: Tin tức AI mới nhất

Từ khóa

hành vi mô hình

Anthropic phát hiện hành vi che giấu trong Claude Mythos

Chatbot có vẻ có cảm xúc và thay đổi hành vi

Claude khiến nhà nghiên cứu bất ngờ khi điều hành máy bán hàng