Đánh giá Claude Opus 4.8: Tốt hơn ở điểm mạnh, tệ hơn ở điểm yếu
Claude Opus 4.8 mới của Anthropic đạt điểm cao trong bài kiểm tra toán và lập trình nhưng tiêu thụ token quá mức, cho thấy hiệu suất không đồng đều.

Mô hình AI hàng đầu mới của Anthropic, Claude Opus 4.8, đã trải qua bài đánh giá sáu bài kiểm tra nghiêm ngặt, cho thấy hiệu suất trái chiều phản ánh điểm mạnh và điểm yếu của phiên bản tiền nhiệm.
Mô hình này đạt điểm cao trong một bài toán phức tạp và tạo ra một trò chơi hoàn hảo từ đầu, thể hiện khả năng lập luận và lập trình tiên tiến. Tuy nhiên, trong một màn trình diễn kém hiệu quả đáng chú ý, nó đã tiêu thụ toàn bộ hạn mức token trong một lần nhắc, cho thấy xu hướng tiêu thụ quá mức tài nguyên trong một số tác vụ. Hành vi này cho thấy rằng trong khi Claude Opus 4.8 vượt trội ở những lĩnh vực nó đã mạnh, nó còn yếu hơn ở những lĩnh vực nó đã yếu, chẳng hạn như quản lý token và hiệu quả nhắc nhở.
Đối với các nhà giao dịch tiền mã hóa và tài sản kỹ thuật số, bài đánh giá này nhấn mạnh tầm quan trọng của việc chọn đúng công cụ AI cho các tác vụ cụ thể. Trong khi Claude Opus 4.8 có thể lý tưởng cho công việc phân tích phức tạp, bản chất ngốn token của nó có thể dẫn đến chi phí cao hơn và hiệu suất chậm hơn trong môi trường giao dịch khối lượng lớn. Các nhà giao dịch có thể theo dõi tác động của các phát triển AI lên thị trường tiền mã hóa bằng bảng điều khiển trực tiếp của NowPrice, theo dõi biến động giá và tâm lý thị trường theo thời gian thực.
Trong tương lai, cộng đồng AI sẽ theo dõi các bản cập nhật từ Anthropic nhằm giải quyết vấn đề hiệu quả token và mở rộng khả năng của mô hình. Các điểm chuẩn và phản hồi của người dùng trong tương lai sẽ quyết định liệu Claude Opus 4.8 có thể duy trì lợi thế trong các tác vụ lập luận trong khi khắc phục các hạn chế hiện tại hay không.