Theo Reuters
Ngày 29 tháng 1 năm 2025 9:45 PM GMT+7
Ngày 29 tháng 1 (Reuters) – Chatbot của công ty khởi nghiệp AI Trung Quốc DeepSeek chỉ đạt độ chính xác 17% trong việc cung cấp tin tức và thông tin trong cuộc kiểm toán của NewsGuard, xếp hạng công ty này ở vị trí thứ mười trên mười một khi so sánh với các đối thủ cạnh tranh phương Tây bao gồm ChatGPT của OpenAI và Google Gemini.
Theo báo cáo được công bố bởi dịch vụ đánh giá độ tin cậy NewsGuard vào thứ Tư, chatbot lặp lại các tuyên bố sai sự thật 30% thời gian và đưa ra các câu trả lời mơ hồ hoặc không hữu ích 53% thời gian khi trả lời các lời nhắc liên quan đến tin tức, dẫn đến tỷ lệ thất bại là 83%.
Con số này còn tệ hơn tỷ lệ thất bại trung bình là 62% của các đối thủ phương Tây và làm dấy lên nghi ngờ về công nghệ AI mà DeepSeek tuyên bố có hiệu suất ngang bằng hoặc tốt hơn OpenAI do Microsoft hậu thuẫn nhưng chi phí chỉ bằng một phần nhỏ.
Chỉ trong vài ngày sau khi ra mắt, chatbot của DeepSeek đã trở thành ứng dụng được tải xuống nhiều nhất trên Apple (AAPL.O), App Store, làm dấy lên mối lo ngại về vị thế dẫn đầu của Hoa Kỳ trong lĩnh vực AI và gây ra sự tháo chạy trên thị trường khiến cổ phiếu công nghệ Hoa Kỳ mất khoảng 1 nghìn tỷ đô la.
Công ty khởi nghiệp Trung Quốc này vẫn chưa trả lời ngay lập tức yêu cầu bình luận.
NewsGuard cho biết họ đã áp dụng 300 lời nhắc tương tự như cách họ đã sử dụng để đánh giá các đối tác phương Tây vào DeepSeek, bao gồm 30 lời nhắc dựa trên 10 tuyên bố sai sự thật đang lan truyền trực tuyến.
Chủ đề khiếu nại bao gồm vụ sát hại giám đốc điều hành của UnitedHealthcare Brian Thompson vào tháng trước và vụ bắn hạ chuyến bay 8243 của hãng hàng không Azerbaijan Airlines.
Cuộc kiểm toán của NewsGuard cũng cho thấy trong ba trong số mười lời nhắc, DeepSeek đã nhắc lại lập trường của chính phủ Trung Quốc về chủ đề này mà không được hỏi bất cứ điều gì liên quan đến Trung Quốc.
NewsGuard cho biết, về các câu hỏi liên quan đến vụ tai nạn của hãng hàng không Azerbaijan Airlines — những câu hỏi không liên quan đến Trung Quốc — DeepSeek đã trả lời bằng lập trường của Bắc Kinh về chủ đề này.
Nhà phân tích Gil Luria của DA Davidson cho biết: “Tầm quan trọng của bước đột phá DeepSeek không phải là trả lời chính xác các câu hỏi liên quan đến tin tức Trung Quốc, mà là nó có thể trả lời bất kỳ câu hỏi nào với chi phí chỉ bằng 1/30 so với các mô hình AI tương đương”.
NewsGuard cho biết thêm, giống như các mô hình AI khác, DeepSeek dễ bị lặp lại các tuyên bố sai sự thật nhất khi phản hồi lời nhắc của những người muốn sử dụng mô hình AI để tạo ra và phát tán các tuyên bố sai sự thật.