Chatbot của DeepSeek đạt độ chính xác 17%, tụt hậu so với các đối thủ phương Tây trong cuộc kiểm toán của NewsGuard

30/01/2025

556

DeepSeek — Logo Deepseek được nhìn thấy trong hình minh họa này được chụp vào ngày 27 tháng 1 năm 2025. REUTERS/Dado Ruvic/Minh họa/Ảnh lưu trữ

Theo Reuters

Ngày 29 tháng 1 năm 2025 9:45 PM GMT+7

Ngày 29 tháng 1 (Reuters) – Chatbot của công ty khởi nghiệp AI Trung Quốc DeepSeek chỉ đạt độ chính xác 17% trong việc cung cấp tin tức và thông tin trong cuộc kiểm toán của NewsGuard, xếp hạng công ty này ở vị trí thứ mười trên mười một khi so sánh với các đối thủ cạnh tranh phương Tây bao gồm ChatGPT của OpenAI và Google Gemini.

Theo báo cáo được công bố bởi dịch vụ đánh giá độ tin cậy NewsGuard vào thứ Tư, chatbot lặp lại các tuyên bố sai sự thật 30% thời gian và đưa ra các câu trả lời mơ hồ hoặc không hữu ích 53% thời gian khi trả lời các lời nhắc liên quan đến tin tức, dẫn đến tỷ lệ thất bại là 83%.

Con số này còn tệ hơn tỷ lệ thất bại trung bình là 62% của các đối thủ phương Tây và làm dấy lên nghi ngờ về công nghệ AI mà DeepSeek tuyên bố có hiệu suất ngang bằng hoặc tốt hơn OpenAI do Microsoft hậu thuẫn nhưng chi phí chỉ bằng một phần nhỏ.

Chỉ trong vài ngày sau khi ra mắt, chatbot của DeepSeek đã trở thành ứng dụng được tải xuống nhiều nhất trên Apple (AAPL.O), App Store, làm dấy lên mối lo ngại về vị thế dẫn đầu của Hoa Kỳ trong lĩnh vực AI và gây ra sự tháo chạy trên thị trường khiến cổ phiếu công nghệ Hoa Kỳ mất khoảng 1 nghìn tỷ đô la.

Công ty khởi nghiệp Trung Quốc này vẫn chưa trả lời ngay lập tức yêu cầu bình luận.

NewsGuard cho biết họ đã áp dụng 300 lời nhắc tương tự như cách họ đã sử dụng để đánh giá các đối tác phương Tây vào DeepSeek, bao gồm 30 lời nhắc dựa trên 10 tuyên bố sai sự thật đang lan truyền trực tuyến.

Chủ đề khiếu nại bao gồm vụ sát hại giám đốc điều hành của UnitedHealthcare Brian Thompson vào tháng trước và vụ bắn hạ chuyến bay 8243 của hãng hàng không Azerbaijan Airlines.

Cuộc kiểm toán của NewsGuard cũng cho thấy trong ba trong số mười lời nhắc, DeepSeek đã nhắc lại lập trường của chính phủ Trung Quốc về chủ đề này mà không được hỏi bất cứ điều gì liên quan đến Trung Quốc.

NewsGuard cho biết, về các câu hỏi liên quan đến vụ tai nạn của hãng hàng không Azerbaijan Airlines — những câu hỏi không liên quan đến Trung Quốc — DeepSeek đã trả lời bằng lập trường của Bắc Kinh về chủ đề này.

Nhà phân tích Gil Luria của DA Davidson cho biết: “Tầm quan trọng của bước đột phá DeepSeek không phải là trả lời chính xác các câu hỏi liên quan đến tin tức Trung Quốc, mà là nó có thể trả lời bất kỳ câu hỏi nào với chi phí chỉ bằng 1/30 so với các mô hình AI tương đương”.

NewsGuard cho biết thêm, giống như các mô hình AI khác, DeepSeek dễ bị lặp lại các tuyên bố sai sự thật nhất khi phản hồi lời nhắc của những người muốn sử dụng mô hình AI để tạo ra và phát tán các tuyên bố sai sự thật.

Post Views: 533

Chatbot của DeepSeek đạt độ chính xác 17%, tụt hậu so với các đối thủ phương Tây trong cuộc kiểm toán của NewsGuard

Tòa Thương Mại Quốc Tế của Mỹ ra phán quyết chính quyền Trump phải bồi hoàn tiền thuế quan thu của các công ty.

Bất ngờ: thuế quan toàn cầu của Trump đẩy tiền đầu tư từ Mỹ sang Việt Nam, Nam Hàn và Chile.

Trung Quốc trừng phạt 40 thực thể Nhật Bản, bị cáo buộc góp phần « tái quân sự hóa »

LEAVE A REPLY Cancel reply

Most Popular

Trump leo thang đe dọa tấn công các nhà máy điện của Iran sau khi Mỹ giải cứu phi công bị bắn rơi

Đối tác xử lý khủng hoảng của OpenAI và Anthropic nhắm đến việc chống lại chủ nghĩa cực đoan

Tòa án Tối cao xem xét nỗ lực của ông Trump nhằm hạn chế quyền công dân theo nguyên tắc nơi sinh.

Thông tin gây chấn động từ Kirk Ballistics, đế chế phù phiếm của Trump, giá xăng 4 đô la, hai thẩm phán nói không...