Giải mã thuật toán

Giải mã thuật toán "gây mê" người dùng của TikTok, những góc khuất nhức nhối ít người biết

Thứ 2, 21/04/2025 14:56
TikTok thu hút hàng trăm triệu người dùng mỗi ngày, và bí mật đằng sau sức hút ấy là thuật toán đề xuất nội dung cực kỳ tinh vi, cá nhân hóa đến mức khó cưỡng.

Thành công phi thường của Douyin không thể tách rời khỏi thuật toán đề xuất nội dung được xem là một trong những hệ thống tiên tiến nhất thế giới. Nó có khả năng phân phối một luồng video ngắn được cá nhân hóa đến mức gần như vô tận, khiến người dùng khó lòng rời mắt khỏi màn hình.

"Công thức" đề xuất của TikTok

Trước sức ép từ cơ quan quản lý Trung Quốc về việc minh bạch hóa thuật toán vào cuối năm 2024 - đầu 2025, Douyin (TikTok phiên bản Trung Quốc) đã công khai việc sử dụng hai kiến trúc học máy chính. Đầu tiên là mô hình Wide&Deep, một cấu trúc lai kết hợp khả năng "ghi nhớ" (memorization) các mối liên hệ trực tiếp dựa trên lịch sử tương tác (ví dụ: người giống bạn thích video A thì bạn cũng có thể thích A) và khả năng "khái quát hóa" (generalization) để khám phá các mối liên hệ phức tạp, ẩn giấu hơn giữa các nội dung và sở thích, giúp đề xuất những video mới lạ nhưng vẫn phù hợp. Thứ hai là mô hình Two-Tower Retrieval, tập trung vào việc khớp nối hiệu quả giữa người dùng và video bằng cách chuyển đổi đặc điểm của cả hai thành các "dấu vân tay kỹ thuật số" và tìm kiếm sự tương đồng giữa chúng.

Để xây dựng dấu vân tay người dùng (User Persona) chi tiết, thuật toán của Douyin xử lý một lượng lớn tín hiệu dữ liệu: từ các tương tác trực tiếp như lượt thích, bình luận, chia sẻ, theo dõi; các tín hiệu ngầm như thời gian xem, tỷ lệ xem hết video, lượt xem lại; đến thông tin video như caption, hashtag, âm thanh, nhãn nội dung (được phân loại theo một cây cấu trúc sở thích phức tạp); và cả cài đặt thiết bị như ngôn ngữ, vị trí địa lý, loại máy...

Việc phân phối nội dung được điều khiển bởi các chiến lược như Mô hình Phễu (Funnel Model), nơi video mới được thử nghiệm qua các nhóm người dùng nhỏ ("Data Buckets"), và chỉ những video đạt hiệu quả tương tác cao (lượt xem, thích, bình luận, thời gian xem...) mới được đẩy lên các "phễu" lớn hơn để tiếp cận nhiều người hơn. Kỹ thuật Lọc Cộng tác (Collaborative Filtering) cũng đóng vai trò quan trọng, đề xuất nội dung dựa trên sự tương đồng giữa những người dùng có cùng sở thích hoặc giữa các nội dung tương tự nhau, đồng thời giúp khám phá các chủ đề mới tiềm năng cho người dùng.

qf blog how does tiktok algorithm work in 2023 scaled
TikTok sử dụng nhiều kỹ thuật thông minh để giữ chân người dùng. Ảnh: QuickFrame

TikTok và Douyin: Anh em song sinh nhưng khác biệt

Dù có chung mã nguồn gốc và giao diện tương tự, Douyin và TikTok hoạt động như hai hệ sinh thái hoàn toàn riêng biệt, được tùy chỉnh cho các thị trường và quy định khác nhau. Phân tích kỹ thuật cho thấy Douyin có xu hướng thu thập nhiều loại dữ liệu hơn một chút so với TikTok (ví dụ: địa chỉ MAC của thiết bị) và sử dụng các dịch vụ bên thứ ba của Trung Quốc. Về mặt triết lý thuật toán, Douyin đôi khi được xem là một "Nền tảng Truyền thông" (Media Platform), nơi thứ hạng có thể bị ảnh hưởng nhiều hơn bởi mức độ phổ biến sẵn có của tài khoản, trong khi TikTok được mô tả giống một "Cộng đồng" hơn, với khả năng lan truyền (viral) cao hơn cho các tài khoản nhỏ và ưu tiên nội dung theo khu vực địa lý. Sự khác biệt này còn thể hiện ở các tính năng: Douyin tích hợp thương mại điện tử và livestream bán hàng sâu rộng hơn nhiều so với TikTok, đồng thời chịu sự kiểm duyệt nội dung chặt chẽ hơn theo quy định của Trung Quốc.

tiktok and douyin
Dù khác nhau nhưng bản chất TikTok và Douyin gần như là 2 ứng dụng giống nhau. Ảnh: The China Project

Mặt trái của thuật toán

Sức mạnh của thuật toán TikTok chính là con dao hai lưỡi. Cơ chế đề xuất nội dung dựa trên hành vi tương tác và tính tương đồng giúp nền tảng giữ chân người dùng cực kỳ hiệu quả đến mức gây ra tình trạng “nghiện TikTok”. Tuy nhiên, chính cơ chế này cũng tiềm ẩn nguy cơ tạo ra “bong bóng lọc” (filter bubble), khi người dùng liên tục được tiếp cận những nội dung củng cố định kiến sẵn có, thay vì được mở rộng góc nhìn. Dù TikTok nhiều lần phủ nhận điều này, lo ngại về tính đơn chiều trong luồng thông tin vẫn ngày càng gia tăng.

Nghiêm trọng hơn, nghiên cứu chỉ ra thuật toán có thể vô tình tạo ra "bất bình đẳng kỹ thuật số kiểu mới". Một thử nghiệm cho thấy người dùng mô phỏng sử dụng điện thoại rẻ tiền hơn nhận được ít đề xuất về các video thông tin sức khỏe đáng tin cậy hơn so với người dùng mô phỏng dùng máy đắt tiền. Điều này cho thấy thuật toán, khi sử dụng các yếu tố như loại thiết bị làm tín hiệu đầu vào, có thể đang phân phối thông tin quan trọng một cách không công bằng dựa trên yếu tố kinh tế xã hội. Ngoài ra, việc tối ưu hóa cho tương tác cũng khiến nền tảng trở thành mảnh đất màu mỡ cho tin giả lan truyền nếu những tin tức đó giật gân và thu hút nhiều lượt xem, thích, chia sẻ hơn là thông tin xác thực.

cq5damweb12801280
Thuật toán của TikTok khiến người dùng bị cuốn vào ứng dụng nhiều hơn. Ảnh: UOC

Trước áp lực pháp lý, ByteDance đã có những bước đi nhằm tăng cường minh bạch như việc ra mắt trang "Trung tâm An toàn và Tin cậy" và công bố tên các mô hình thuật toán chính. Tuy nhiên, các chuyên gia cho rằng mức độ minh bạch này vẫn còn hạn chế, chỉ dừng lại ở việc mô tả kiến trúc tổng quan mà thiếu đi các chi tiết vận hành cốt lõi như cách các yếu tố được cân nhắc trọng số hay dữ liệu nào được ưu tiên. Việc quản lý nội dung và chống lại các hành vi thao túng thuật toán cũng là những thách thức lớn đối với một nền tảng quy mô khổng lồ như TikTok.

Thuật toán của TikTok là một thành tựu công nghệ ấn tượng, động lực chính cho sự thành công của nền tảng. Tuy nhiên, sức mạnh của nó đi kèm với trách nhiệm lớn và những hệ lụy xã hội phức tạp cần được nhìn nhận một cách nghiêm túc, đòi hỏi sự giám sát chặt chẽ hơn và các giải pháp quản trị hiệu quả hơn trong tương lai.

Theo SCMP

Nguyễn Nghĩa

Cùng chuyên mục

Loại quả Việt Nam lọt top ngon nhất thế giới: Chỉ có ở Thanh Hóa, mỗi năm thu 1 lần, cận vụ càng khó mua

Thứ 2, 22/06/2026 00:00
Loại quả đặc biệt này gây ấn tượng bởi màu sắc hiếm có và chỉ xuất hiện một lần trong năm.

Nếu chỉ được chọn 1, bạn sẽ dạy con điều gì? Đây là câu trả lời cực bất ngờ của một siêu mẫu Việt

Chủ nhật, 21/06/2026 22:32
Đây là câu trả lời khiến nhiều phụ huynh phải suy ngẫm.

Nhờ chiến lược thông minh từ năm lớp 8, bà mẹ Hà Nôị đồng hành cùng con đỗ lớp 10 Chuyên xịn sò

Chủ nhật, 21/06/2026 22:05
Nhìn lại hành trình gian nan nhưng đầy tự hào ấy, chị Cẩm Chi đã có những chia sẻ rút ruột về kinh nghiệm đồng hành cùng con "vượt vũ môn".

Ra lệnh bắt tạm giam cựu cán bộ ngân hàng Vũ Công Giang SN 1989

Chủ nhật, 21/06/2026 22:04
Vũ Công Giang đã dùng các thủ đoạn gian dối để chiếm đoạt tài sản có giá trị lớn.

Lễ cưới Xuân Trường và Nhuệ Giang sau 5 năm đám hỏi: Cô dâu khóc nức nở, con gái được giao trọng trách đặc biệt

Chủ nhật, 21/06/2026 21:19
Cặp đôi cực kỳ kín tiếng, không cập nhật nhiều thông tin về đám cưới.
     
Nổi bật trong ngày

Mỹ nhân T-ara chăm sóc, cổ vũ chồng cầu thủ giữa biến cố World Cup

Thứ 7, 20/06/2026 08:53
Với tư cách vợ hiền, Soyeon đã chăm sóc chồng hết mực trong khoản thời gian khó khăn này.

Bảo hiểm xã hội Việt Nam thông báo khẩn tới tất cả người dân đang nhận lương hưu

Thứ 7, 20/06/2026 11:20
BHXH Việt Nam khuyến nghị người hưởng lương hưu, trợ cấp BHXH hằng tháng cần chủ động kiểm tra thời hạn văn bản ủy quyền, không chờ đến sát thời điểm 30/6 mới thực hiện thủ tục.

Tìm thấy thiếu nữ lớp 7 mất tích bí ẩn sau cuộc gọi "khóc nấc" kỳ lạ

Thứ 7, 20/06/2026 14:08
Sau nhiều ngày đêm ròng rã tìm kiếm, nữ sinh Lê Kim Bảo Ngọc đã chính thức được đưa về an toàn cùng người thân.

Lời khuyên cho những người thường xuyên thức khuya rồi ngủ bù vào cuối tuần

Thứ 7, 20/06/2026 16:49
Ngủ nướng cuối tuần không thể xóa hết tác động của những đêm thức khuya trong tuần. Thậm chí, thói quen này còn có thể khiến cơ thể trả giá bằng nhiều vấn đề sức khỏe.
xe.nguoiduatin.vn