– Cù Tuấn dịch từ New York Times
Đây là ứng dụng video thành công nhất trên thế giới. Người phụ trách chuyên mục của chúng tôi đã có được một tài liệu nội bộ của công ty cung cấp một bản chi tiết mới về cách hoạt động của thuật toán TikTok.
Có bốn mục tiêu chính cho thuật toán của TikTok: 用户 价值, 用户 价值 (长期), 作者 价值 và 平台 价值, được công ty dịch là “giá trị người dùng”, “giá trị người dùng lâu dài”, “giá trị của người sáng tạo” và “ giá trị nền tảng.”
Các mục tiêu này được rút ra từ một tài liệu rõ ràng, cụ thể và dễ hiểu dành cho nhân viên công ty cung cấp các chi tiết mới về cách ứng dụng video thành công nhất trên thế giới đã tạo ra một sản phẩm có tính giải trí – và được cho là có tính gây nghiện.
Tài liệu có tên “TikTok Algo 101” do nhóm kỹ sư của TikTok ở Bắc Kinh viết ra. Người phát ngôn của công ty, Hilary McQuaide, đã xác nhận tính xác thực của nó và cho biết nó được viết để giải thích cho các nhân viên phi kỹ thuật về cách thức hoạt động của thuật toán. Tài liệu này cho chúng ta một cấp độ chi tiết mới về ứng dụng video đang thống trị thị trường này, cung cấp cái nhìn sơ lược về cả cốt lõi toán học của ứng dụng TikTok và cái nhìn sâu sắc về hiểu biết của công ty này về bản chất con người – xu hướng buồn chán, và tính nhạy cảm của chúng ta với các tín hiệu văn hóa – đã giúp giải thích tại sao việc một khi đã dùng TikTok thì rất khó để thoát ra. Tài liệu cũng vén bức màn về mối liên hệ bền chặt của TikTok với công ty mẹ Trung Quốc, ByteDance, vào thời điểm Bộ Thương mại Mỹ đang chuẩn bị một báo cáo về việc liệu TikTok có gây ra rủi ro bảo mật cho Mỹ hay không.
Nếu bạn nằm trong số hàng tỷ người (theo nghĩa đen!) dành thời gian xem video trên TikTok mỗi tháng, bạn đã quen thuộc với ứng dụng này như là ứng dụng trung tâm của năm 2021 đối với văn hóa thanh thiếu niên và văn hóa trực tuyến nói chung. Nó đưa ra một chuỗi video vô tận và, không giống như các ứng dụng truyền thông xã hội, TikTok đang ngày càng thay thế chúng, với việc mang tính giải trí nhiều hơn là kết nối với bạn bè.
TikTok đã thành công trong khi các ứng dụng video ngắn khác thất bại, một phần vì nó giúp người dùng tạo video quá dễ dàng, cung cấp cho người dùng nhạc nền để nhảy theo hoặc meme để tạo ra, thay vì buộc họ phải để video âm thanh chết. Và đối với nhiều người dùng, vốn là những người sử dụng mà không cần sáng tạo, ứng dụng này rất tốt trong việc tìm hiểu các sở thích của bạn và hướng bạn đến một trong nhiều “tầng” video của nó, dù là bạn quan tâm đến chủ nghĩa xã hội, thủ thuật Excel hay tình dục, chính trị bảo thủ hay một người nổi tiếng nào đó. TikTok rất giỏi tìm hiểu mong muốn của mọi người hơn là chính họ biết về bản thân – “Thuật toán TikTok hiểu về định hướng tình dục của tôi hơn cả tôi”, đó là một trong một loạt các tiêu đề bài viết về việc mọi người ngạc nhiên trước bức ảnh chi tiết của ứng dụng này về cuộc sống nội tâm của họ.
TikTok đã chia sẻ công khai các phác thảo rộng rãi của hệ thống đề xuất video của mình, cho biết nó có tính đến các yếu tố bao gồm lượt thích và nhận xét cũng như thông tin video như chú thích, âm thanh và thẻ hashtag. Các nhà phân tích bên ngoài cũng đã tìm cách tìm hiểu bí mật của nó. Một báo cáo gần đây của Wall Street Journal đã chứng minh cách TikTok phụ thuộc vào lượng thời gian bạn dành để xem mỗi video, để dụ bạn xem nhiều video hơn nữa bằng cách cuộn tiếp mãi, và quá trình đó đôi khi có thể dẫn người xem trẻ tuổi đến những cái bẫy nguy hiểm, đặc biệt là đối với nội dung khuyến khích tự tử hoặc tự làm hại bản thân. TikTok cho biết họ đang nỗ lực để ngăn chặn các vấn đề này bằng cách mạnh tay xóa nội dung vi phạm.
Tài liệu mới này đã được một người được ủy quyền chia sẻ với The New York Times, với điều kiện giấu tên, sau khi đọc nội dung cho thấy ứng dụng này thúc đẩy các nội dung “buồn bã” có thể tự gây hại cho bản thân.
Tài liệu này giải thích thẳng thắn rằng để theo đuổi “mục tiêu cuối cùng” của công ty là có thêm người dùng hoạt động hàng ngày, TikTok đã chọn tối ưu hóa cho hai chỉ số có liên quan chặt chẽ trong chuỗi video mà nó đưa ra: “giữ chân” – tức là việc liệu người dùng có quay lại ứng dụng – và “thời gian xem video.” TikTok luôn muốn giữ bạn trên ứng dụng này lâu nhất có thể. Trải nghiệm này đôi khi được mô tả như một cơn nghiện, mặc dù nó cũng gợi lại những lời chỉ trích đối với văn hóa đại chúng trước đó. Nhà viết kịch David Mamet, viết một cách khinh bỉ vào năm 1998 về “phim giả”, đã nhận xét rằng “mọi người bị thu hút bởi những bộ phim lãng mạn tình cảm mùa hè vì họ không hài lòng trong đời sống tình cảm, và vì vậy họ ra tạo cơ hội để xem đi xem lại các phim loại này.”
Đối với các nhà phân tích tin rằng các đề xuất video của thuật toán này gây ra mối đe dọa xã hội, tài liệu TikTok này xác nhận những nghi ngờ trên.
“Hệ thống này lấy thời gian xem là chìa khóa chính. Thuật toán này cố gắng khiến mọi người nghiện TikTok hơn là mang lại cho họ những gì họ thực sự muốn ”, Guillaume Chaslot, người sáng lập Algo Transparency, một nhóm có trụ sở tại Paris, đã nghiên cứu hệ thống khuyến nghị của YouTube và có cái nhìn bi quan về tác dụng của sản phẩm này đặc biệt là lên trẻ em. Ông Chaslot đã xem xét tài liệu TikTok này theo yêu cầu của tôi.
“Tôi nghĩ rằng đó là một ý tưởng điên rồ khi để thuật toán của TikTok định hướng cuộc sống của những đứa con của chúng ta,” ông nói. “Cứ mỗi video một đứa trẻ xem thì TikTok thu được một phần thông tin về nó. Trong vài giờ, thuật toán có thể phát hiện sở thích âm nhạc, sự hấp dẫn đối với vẻ ngoài của nó, liệu đứa trẻ có bị trầm cảm hay không, liệu nó có nghiện ma túy hay không và nhiều thông tin nhạy cảm khác. Có nhiều rủi ro là một số thông tin này sẽ được sử dụng để chống lại chính đứa trẻ. Các thông tin này có thể được sử dụng để nhắm mục tiêu bán hàng cho chúng hoặc khiến đứa trẻ trở nên nghiện xem TikTok hơn nữa.”
Tài liệu này cho biết thời gian xem không phải là yếu tố duy nhất mà TikTok xem xét. Nó đưa ra một phương trình cơ bản về cách video được chấm điểm, trong đó dự đoán được thúc đẩy bởi cơ chế học máy và hành vi thực tế của người dùng được tổng hợp từ ba dữ liệu: lượt thích, nhận xét và thời gian xem, cũng như dấu hiệu cho thấy video có đã được xem:
Plike * Vlike + Pcomment * Vcomment + Eplaytime * Vplaytime + Pplay * Vplay
“Hệ thống đề xuất cho điểm cho tất cả các video dựa trên tổng này và trả về cho người dùng những video có điểm cao nhất,” tài liệu cho biết. “Nói ngắn gọn, phương trình hiển thị trong tài liệu này được đơn giản hóa rất nhiều. Phương trình thực tế đang được sử dụng phức tạp hơn nhiều, nhưng logic đằng sau chúng là như nhau ”.
Tài liệu minh họa chi tiết cách công ty điều chỉnh hệ thống của mình để xác định và ngăn chặn “video câu like” – video được thiết kế để đánh lừa thuật toán bằng cách yêu cầu mọi người thích/like chúng – và cách công ty suy nghĩ thông qua các câu hỏi mang nhiều sắc thái hơn.
“Một số tác giả có thể có một số tham chiếu về văn hóa trong video của họ và người dùng chỉ có thể hiểu rõ hơn về những tham chiếu đó bằng cách xem nhiều video của tác giả hơn. Do đó, tổng giá trị mà người dùng xem tất cả các video đó cao hơn giá trị xem từng video đơn lẻ được cộng lại, ”tài liệu này cho biết. “Một ví dụ khác: nếu người dùng thích một loại video nhất định, nhưng ứng dụng vẫn tiếp tục quảng cáo loại video đó cho anh ta, anh ta sẽ nhanh chóng cảm thấy nhàm chán và đóng ứng dụng. Trong trường hợp này, tổng giá trị tạo ra bởi người dùng xem cùng một loại video sẽ thấp hơn so với việc xem từng video đơn lẻ, bởi vì sự lặp đi lặp lại dẫn đến sự nhàm chán ”.
Tài liệu này tiếp tục phân tích: “Có hai giải pháp cho vấn đề này. “Đưa ra một số giả định và chia nhỏ giá trị thành phương trình giá trị. Ví dụ: về số lần hiển thị lặp lại, chúng tôi có thể thêm giá trị ‘same_author_seen’ và đối với vấn đề nhàm chán, chúng tôi cũng có thể thêm giá trị âm ‘same_tag_today’. Các giải pháp khác ngoài công thức giá trị cũng có thể hoạt động, chẳng hạn như đề xuất bắt buộc ở người dùng’ và phân tán nội dung, v.v. Ví dụ, vấn đề buồn chán có thể được giải quyết thông qua phân tán. ”
Một biểu đồ khác trong tài liệu chỉ ra rằng “kiếm tiền từ người sáng tạo” là một trong những mục tiêu của công ty, một gợi ý rằng TikTok có thể ưu tiên các video phần nào nếu chúng là sinh lợi chứ không chỉ đơn thuần giải trí.
Julian McAuley, giáo sư khoa học máy tính tại Đại học California San Diego, sau khi xem xét tài liệu này, cho biết trong một email rằng tài liệu chưa nói chi tiết về cách TikTok thực hiện các dự đoán, nhưng đã mô tả về công cụ khuyến nghị của nó là “Hoàn toàn hợp lý, nhưng là những tư duy cũ.” Ông nói, lợi thế của công ty đến từ việc kết hợp công nghệ học máy với “khối lượng dữ liệu tuyệt vời, người dùng tương tác cao và cài đặt mà người dùng có thể sử dụng nội dung được đề xuất theo thuật toán (hãy nghĩ rằng có bao nhiêu phần mềm khác có tất cả các đặc điểm này!). Nó không phải là một điều thần kỳ nào đó”.
Ông McAuley nói thêm rằng ông hơi bối rối về việc tại sao mọi người luôn hỏi ông về TikTok.
“Có vẻ như có một số nhận thức (bởi phương tiện truyền thông hay công chúng?) rằng họ đã viết chương trình một cách thần kỳ khi đề xuất video cho người dùng, nhưng hầu hết những gì tôi thấy có vẻ khá bình thường,” ông viết.
Và thực sự, tài liệu này giúp làm sáng tỏ loại hệ thống khuyến nghị mà các công ty công nghệ thường trình bày khiến các nhà phê bình và cơ quan quản lý khó có thể nắm bắt được, nhưng thường tập trung vào các tính năng mà bất kỳ người dùng bình thường nào cũng có thể hiểu được. Chẳng hạn, việc đưa tin về các tài liệu Facebook bị rò rỉ đã minh họa cách Facebook quyết định đưa ra nhiều ý kiến hơn đối với các bình luận đã giúp nội dung gây chia rẽ lan truyền như thế nào. Mặc dù các mô hình này có thể khá phức tạp, nhưng không có gì khó hiểu về thuật toán đề xuất video tiếp theo của TikTok được nêu trong tài liệu trên.
Nhưng tài liệu này cũng cho thấy rõ rằng TikTok đã không làm gì để cắt đứt quan hệ với công ty mẹ Trung Quốc ByteDance, là công ty có quyền sở hữu TikTok mà đã trở thành tiêu điểm chú ý vào cuối chính quyền của Tổng thống Donald Trump vào năm 2020, khi ông cố gắng ép TikTok phải được bán cho Oracle, một công ty Mỹ liên minh với chính quyền của ông.
Tài liệu TikTok đề cập đến các câu hỏi cho một giám đốc kỹ thuật có tiểu sử trên LinkedIn cho biết anh ta làm việc trên cả ứng dụng tiếng Trung tương tự của TikTok và ByteDance, Douyin, mang đến một cái nhìn thoáng qua về yếu tố toàn cầu còn lại của ngành công nghệ ngày càng bị chia rẽ, đó là tài năng kỹ thuật. Theo LinkedIn, giám đốc kỹ thuật này đã theo học tại Đại học Bắc Kinh, nhận bằng thạc sĩ khoa học máy tính tại Đại học Columbia và làm việc cho Facebook trong hai năm trước khi làm cho ByteDance ở Bắc Kinh vào năm 2017. Tài liệu này được viết bằng tiếng Anh, nhưng không có định hướng toàn cầu và xuất phát từ quan điểm của ngành công nghiệp công nghệ Trung Quốc. Chẳng hạn, nó không đề cập đến các công ty đối thủ của Mỹ như Facebook và Google, nhưng có một cuộc thảo luận về “nếu Toutiao / Kuaishou / Weibo đã làm điều gì đó rồi, thì chúng ta có thể khởi động chiến lược tương tự như họ đã làm không?”
Tài liệu này cho biết, quá trình phát triển của TikTok gắn bó chặt chẽ với Douyin. Tại một thời điểm, tài liệu đề cập đến nhân viên TikTok về “Quy trình khởi động cho Chiến lược đề xuất cho Douyin” và liên kết đến một tài liệu nội bộ của công ty mà nó nói là “chung một tài liệu cho TikTok và Douyin”.
Các nhân viên của TikTok cũng được kết nối sâu vào hệ sinh thái của ByteDance. Họ sử dụng sản phẩm ByteDance có tên Lark, một hệ thống truyền thông nội bộ của công ty giống như Slack nhưng với các tính năng quản lý hiệu suất tích cực nhằm buộc nhân viên sử dụng hệ thống nhiều hơn. Ví dụ, có một hình ảnh cho bạn biết liệu bạn đã thực hiện các hành động – như mở tin nhắn – nhiều hơn hay ít hơn đồng nghiệp của bạn, theo ảnh chụp màn hình mà tôi được cung cấp.
Mối quan tâm về công nghệ tiêu dùng của Trung Quốc là mục tiêu của cả hai đảng ở Hoa Kỳ. Lệnh hành pháp của Tổng thống Trump khi cố gắng cấm ứng dụng vào tháng 8 năm 2020 đã cảnh báo rằng “việc thu thập dữ liệu của TikTok có nguy cơ cho phép Đảng Cộng sản Trung Quốc truy cập thông tin cá nhân và độc quyền của người Mỹ”. Chính phủ Trung Quốc có thể “xây dựng hồ sơ thông tin cá nhân để tống tiền và thực hiện hoạt động gián điệp của công ty”. Lệnh cấm đó bị giữ lại tại tòa án và mất dần sau cuộc bầu cử tổng thống. Tổng thống Biden đã hủy bỏ lệnh hành pháp, nhưng chính quyền của ông sau đó đã công bố cuộc điều tra riêng về các mối đe dọa an ninh do TikTok gây ra, với một quan chức cấp cao giấu tên nói với các phóng viên rằng Trung Quốc “đang làm việc để tận dụng các công nghệ kỹ thuật số và dữ liệu của Mỹ theo những cách gây ra rủi ro an ninh quốc gia không thể chấp nhận được.”
Trong một tuyên bố gửi qua email, bà McQuaide nói rằng “mặc dù có một số điểm chung trong chương trình, nhưng ứng dụng TikTok và Douyin được chạy hoàn toàn riêng biệt, trên các máy chủ riêng biệt và không có đoạn mã nào chứa dữ liệu người dùng”.
Cô ấy cũng nói, “TikTok chưa bao giờ cung cấp dữ liệu người dùng cho chính phủ Trung Quốc, chúng tôi cũng sẽ không cung cấp nếu được yêu cầu.”
TikTok, có giám đốc điều hành sống ở Singapore, đã thuê một nhóm gồm các giám đốc điều hành và chuyên gia an ninh người Mỹ và châu Âu có mối quan hệ tốt khi áp lực chính trị gia tăng dưới thời ông Trump. Công ty nói rằng nó không có trụ sở chính thức. TikTok đã tìm cách xoa dịu những lo ngại của người Mỹ bằng cách lưu trữ dữ liệu người dùng ở Mỹ, với một bản sao lưu ở Singapore.
Mối quan tâm về an ninh của chính phủ Mỹ có hai dạng. Điều đầu tiên, như ông Trump đề xuất trong lệnh hành pháp của mình, là liệu kho dữ liệu khổng lồ mà TikTok nắm giữ – về ham muốn tình dục riêng tư của những người dùng, mà có thể cuối cùng trở thành công chức Mỹ chẳng hạn – có nên được xem như một vấn đề an ninh quốc gia. Không có bằng chứng nào cho thấy dữ liệu đã từng được sử dụng theo cách đó và TikTok hầu như không phải là nơi duy nhất người Mỹ chia sẻ thông tin chi tiết về cuộc sống của họ trên mạng xã hội. Mối quan tâm thứ hai là liệu TikTok có kiểm duyệt các bài đăng nhạy cảm về mặt chính trị hay không.
Một báo cáo năm nay của Citizen Lab, tổ chức giám sát an ninh mạng ở Toronto, gợi ý rằng cả hai mối quan tâm này, nhiều nhất là tiềm ẩn: Tổ chức này không tìm thấy bất kỳ dấu hiệu nào cho thấy TikTok đang kiểm duyệt các chủ đề nhạy cảm hoặc gửi dữ liệu đến Trung Quốc.
Nhưng việc quan sát về cuộc sống nội tâm của mọi người của TikTok là không bình thường. Một ảnh chụp màn hình khác được chia sẻ với tôi cho thấy rằng người kiểm duyệt nội dung của TikTok không chỉ có quyền truy cập vào các video được đăng công khai mà còn cả nội dung được gửi cho bạn bè hoặc tải lên hệ thống nhưng không được chia sẻ, một sự khác biệt so với các ứng dụng như WhatsApp và Signal cung cấp mã hóa hai chiều.
Câu hỏi thứ hai là liệu chính phủ Trung Quốc có thể sử dụng nền tảng này để tuyên truyền hay không. Sau khi bị bắt quả tang kiểm duyệt một video lên án việc giam giữ hàng loạt người Hồi giáo thiểu số ở Trung Quốc, TikTok đã cho phép người dùng có thể chỉ trích chính phủ Trung Quốc. Ví dụ: hashtag #whereispengshuai, liên quan đến ngôi sao quần vợt Trung Quốc Bành Soái, người đã cáo buộc một nhà lãnh đạo hàng đầu của Trung Quốc về tội tấn công tình dục, được tự động hoàn thành trong hệ thống này, mặc dù các video TikTok có hashtag đó có ít lượt xem. Không có nghiên cứu độc lập nào cho thấy liệu công ty này có đang ngăn chặn tìm kiếm hay không, vốn có nhiều tương tác hơn trên Twitter nhưng rất ít trên Instagram.
Một số nhà phân tích Mỹ coi TikTok là một mối đe dọa sâu sắc; những người khác xem đó là việc hoảng sợ vô cớ mà người Mỹ hiện đang ở độ tuổi trung niên phải đối mặt khi cha mẹ họ cảnh báo rằng nếu họ chia sẻ chi tiết về cuộc sống của họ trên mạng xã hội, họ sẽ không bao giờ kiếm được việc làm. Rất nhiều sản phẩm khác, từ mạng xã hội đến ngân hàng và thẻ tín dụng, đều thu thập dữ liệu thậm chí còn kỹ càng hơn về người dùng của họ. Nếu các dịch vụ bảo mật nước ngoài muốn dữ liệu đó, họ có thể tìm cách mua nó từ chợ dữ liệu đen công nghiệp của các hacker cơ sở dữ liệu.
Samm Sacks, chuyên gia về chính sách an ninh mạng tại tổ chức nghiên cứu New America, cho biết: “Băn khoăn về sự giám sát hoặc kiểm duyệt của TikTok là một thực tế rằng những vấn đề này lớn hơn nhiều so với bất kỳ công ty cụ thể nào hoặc quyền sở hữu của Trung Quốc. “Ngay cả khi TikTok thuộc sở hữu của người Mỹ, không có luật hoặc quy định nào ngăn cản Bắc Kinh mua dữ liệu người dùng của TikTok trên các chợ dữ liệu đen”.
Một điều mà báo cáo của chuyên mục này đã cho thấy: Mối đe dọa mà TikTok gây ra đối với an ninh quốc gia của Mỹ dường như hoàn toàn là giả thuyết và phụ thuộc vào phân tích của bạn về cả mối quan hệ Mỹ-Trung, cũng như tương lai của công nghệ và văn hóa. Nhưng việc thuật toán này nắm bắt được những gì tôi thích – những cú đánh tennis hiểm hóc, video về món ăn Thổ Nhĩ Kỳ và tất cả những thứ khác mà TikTok đoán được là tôi thích xem – đã tạo ra mối nguy hiểm rõ ràng và hiện hữu đối với khả năng hoàn tất bài viết này của tôi.
https://www.nytimes.com/2021/12/05/business/media/tiktok-algorithm.html