Giải mã thuật toán

Giải mã thuật toán "gây mê" người dùng của TikTok, những góc khuất nhức nhối ít người biết

Thứ 2, 21/04/2025 14:56
TikTok thu hút hàng trăm triệu người dùng mỗi ngày, và bí mật đằng sau sức hút ấy là thuật toán đề xuất nội dung cực kỳ tinh vi, cá nhân hóa đến mức khó cưỡng.

Thành công phi thường của Douyin không thể tách rời khỏi thuật toán đề xuất nội dung được xem là một trong những hệ thống tiên tiến nhất thế giới. Nó có khả năng phân phối một luồng video ngắn được cá nhân hóa đến mức gần như vô tận, khiến người dùng khó lòng rời mắt khỏi màn hình.

"Công thức" đề xuất của TikTok

Trước sức ép từ cơ quan quản lý Trung Quốc về việc minh bạch hóa thuật toán vào cuối năm 2024 - đầu 2025, Douyin (TikTok phiên bản Trung Quốc) đã công khai việc sử dụng hai kiến trúc học máy chính. Đầu tiên là mô hình Wide&Deep, một cấu trúc lai kết hợp khả năng "ghi nhớ" (memorization) các mối liên hệ trực tiếp dựa trên lịch sử tương tác (ví dụ: người giống bạn thích video A thì bạn cũng có thể thích A) và khả năng "khái quát hóa" (generalization) để khám phá các mối liên hệ phức tạp, ẩn giấu hơn giữa các nội dung và sở thích, giúp đề xuất những video mới lạ nhưng vẫn phù hợp. Thứ hai là mô hình Two-Tower Retrieval, tập trung vào việc khớp nối hiệu quả giữa người dùng và video bằng cách chuyển đổi đặc điểm của cả hai thành các "dấu vân tay kỹ thuật số" và tìm kiếm sự tương đồng giữa chúng.

Để xây dựng dấu vân tay người dùng (User Persona) chi tiết, thuật toán của Douyin xử lý một lượng lớn tín hiệu dữ liệu: từ các tương tác trực tiếp như lượt thích, bình luận, chia sẻ, theo dõi; các tín hiệu ngầm như thời gian xem, tỷ lệ xem hết video, lượt xem lại; đến thông tin video như caption, hashtag, âm thanh, nhãn nội dung (được phân loại theo một cây cấu trúc sở thích phức tạp); và cả cài đặt thiết bị như ngôn ngữ, vị trí địa lý, loại máy...

Việc phân phối nội dung được điều khiển bởi các chiến lược như Mô hình Phễu (Funnel Model), nơi video mới được thử nghiệm qua các nhóm người dùng nhỏ ("Data Buckets"), và chỉ những video đạt hiệu quả tương tác cao (lượt xem, thích, bình luận, thời gian xem...) mới được đẩy lên các "phễu" lớn hơn để tiếp cận nhiều người hơn. Kỹ thuật Lọc Cộng tác (Collaborative Filtering) cũng đóng vai trò quan trọng, đề xuất nội dung dựa trên sự tương đồng giữa những người dùng có cùng sở thích hoặc giữa các nội dung tương tự nhau, đồng thời giúp khám phá các chủ đề mới tiềm năng cho người dùng.

qf blog how does tiktok algorithm work in 2023 scaled
TikTok sử dụng nhiều kỹ thuật thông minh để giữ chân người dùng. Ảnh: QuickFrame

TikTok và Douyin: Anh em song sinh nhưng khác biệt

Dù có chung mã nguồn gốc và giao diện tương tự, Douyin và TikTok hoạt động như hai hệ sinh thái hoàn toàn riêng biệt, được tùy chỉnh cho các thị trường và quy định khác nhau. Phân tích kỹ thuật cho thấy Douyin có xu hướng thu thập nhiều loại dữ liệu hơn một chút so với TikTok (ví dụ: địa chỉ MAC của thiết bị) và sử dụng các dịch vụ bên thứ ba của Trung Quốc. Về mặt triết lý thuật toán, Douyin đôi khi được xem là một "Nền tảng Truyền thông" (Media Platform), nơi thứ hạng có thể bị ảnh hưởng nhiều hơn bởi mức độ phổ biến sẵn có của tài khoản, trong khi TikTok được mô tả giống một "Cộng đồng" hơn, với khả năng lan truyền (viral) cao hơn cho các tài khoản nhỏ và ưu tiên nội dung theo khu vực địa lý. Sự khác biệt này còn thể hiện ở các tính năng: Douyin tích hợp thương mại điện tử và livestream bán hàng sâu rộng hơn nhiều so với TikTok, đồng thời chịu sự kiểm duyệt nội dung chặt chẽ hơn theo quy định của Trung Quốc.

tiktok and douyin
Dù khác nhau nhưng bản chất TikTok và Douyin gần như là 2 ứng dụng giống nhau. Ảnh: The China Project

Mặt trái của thuật toán

Sức mạnh của thuật toán TikTok chính là con dao hai lưỡi. Cơ chế đề xuất nội dung dựa trên hành vi tương tác và tính tương đồng giúp nền tảng giữ chân người dùng cực kỳ hiệu quả đến mức gây ra tình trạng “nghiện TikTok”. Tuy nhiên, chính cơ chế này cũng tiềm ẩn nguy cơ tạo ra “bong bóng lọc” (filter bubble), khi người dùng liên tục được tiếp cận những nội dung củng cố định kiến sẵn có, thay vì được mở rộng góc nhìn. Dù TikTok nhiều lần phủ nhận điều này, lo ngại về tính đơn chiều trong luồng thông tin vẫn ngày càng gia tăng.

Nghiêm trọng hơn, nghiên cứu chỉ ra thuật toán có thể vô tình tạo ra "bất bình đẳng kỹ thuật số kiểu mới". Một thử nghiệm cho thấy người dùng mô phỏng sử dụng điện thoại rẻ tiền hơn nhận được ít đề xuất về các video thông tin sức khỏe đáng tin cậy hơn so với người dùng mô phỏng dùng máy đắt tiền. Điều này cho thấy thuật toán, khi sử dụng các yếu tố như loại thiết bị làm tín hiệu đầu vào, có thể đang phân phối thông tin quan trọng một cách không công bằng dựa trên yếu tố kinh tế xã hội. Ngoài ra, việc tối ưu hóa cho tương tác cũng khiến nền tảng trở thành mảnh đất màu mỡ cho tin giả lan truyền nếu những tin tức đó giật gân và thu hút nhiều lượt xem, thích, chia sẻ hơn là thông tin xác thực.

cq5damweb12801280
Thuật toán của TikTok khiến người dùng bị cuốn vào ứng dụng nhiều hơn. Ảnh: UOC

Trước áp lực pháp lý, ByteDance đã có những bước đi nhằm tăng cường minh bạch như việc ra mắt trang "Trung tâm An toàn và Tin cậy" và công bố tên các mô hình thuật toán chính. Tuy nhiên, các chuyên gia cho rằng mức độ minh bạch này vẫn còn hạn chế, chỉ dừng lại ở việc mô tả kiến trúc tổng quan mà thiếu đi các chi tiết vận hành cốt lõi như cách các yếu tố được cân nhắc trọng số hay dữ liệu nào được ưu tiên. Việc quản lý nội dung và chống lại các hành vi thao túng thuật toán cũng là những thách thức lớn đối với một nền tảng quy mô khổng lồ như TikTok.

Thuật toán của TikTok là một thành tựu công nghệ ấn tượng, động lực chính cho sự thành công của nền tảng. Tuy nhiên, sức mạnh của nó đi kèm với trách nhiệm lớn và những hệ lụy xã hội phức tạp cần được nhìn nhận một cách nghiêm túc, đòi hỏi sự giám sát chặt chẽ hơn và các giải pháp quản trị hiệu quả hơn trong tương lai.

Theo SCMP

Nguyễn Nghĩa

Cùng chuyên mục

Khởi tố, bắt tạm giam Dương Thị Yến Oanh và Hồ Tú Phụng

Thứ 5, 07/05/2026 11:50
Bằng nghiệp vụ, Công an đã triệt phá đường dây làm giả bột ngọt, hạt nêm nhãn hiệu nổi tiếng rồi bán lại cho các cửa hàng, tiệm tạp hóa, hộ kinh doanh ở tỉnh Tây Ninh và một số tỉnh, thành phố lân cận để kiếm lời.

Nga tạo phát minh chưa từng có: Vạch mặt "tác nhân gây phóng xạ" giấu mặt trong các tòa nhà

Thứ 5, 07/05/2026 11:49
Phát minh này có thể tránh được nguy cơ nhiễm phóng xạ tự nhiên cho con người.

F-16 phụt khói, né tên lửa R-77 Nga trong gang tấc: Tuyệt kỹ "sơn ca" cứu nguy hay chỉ là hên xui?

Thứ 5, 07/05/2026 11:44
Cơ hội sống sót của F-16 trước R-77 gần như bằng không. Bằng cách thần kỳ nào đó, nó đã làm được.

BXH 7 thế giới Isekai tồi tệ nhất: Bạn sẽ trụ lại được bao lâu nếu không có "buff bẩn"?

Thứ 5, 07/05/2026 11:40
Đừng để những kỹ năng bá đạo đánh lừa, thực tế tại các thế giới này trong anime isekai tàn khốc hơn bạn tưởng rất nhiều, đặc biệt là khi bạn chỉ là một người qua đường đen đủi.

Vì sao U17 Việt Nam 10 năm vào chung kết ĐNÁ 4 lần, nhưng không thắng được trận nào ở giải châu Á?

Thứ 5, 07/05/2026 11:39
Không ít người hâm mộ bất ngờ trước thông tin trận thắng U17 Yemen vào rạng sáng nay (7/5) mới là lần đầu tiên sau 10 năm, U17 Việt Nam có được một thắng lợi ở giải châu Á.
     
Nổi bật trong ngày

6 loại cây ăn quả tuyệt đẹp có thể trồng làm hàng rào

Thứ 4, 06/05/2026 20:00
Không chỉ tạo khoảng riêng tư cho sân vườn, một số cây ăn quả còn có thể thay thế hàng rào khô cứng bằng tán lá xanh, hoa đẹp và những mùa quả ngọt.

Rating 9/10 từ người dùng, tựa game này vừa ra mắt Steam đã gây sốt, miễn phí 100%

Thứ 4, 06/05/2026 09:20
Đây hoàn toàn có thể là lựa chọn giải trí rẻ nhưng đầy chất lượng dành cho các game thủ.

HLV Indonesia phản ứng bất ngờ sau khi hạ tuyển Trung Quốc, rộng cửa dự World Cup

Thứ 4, 06/05/2026 10:48
HLV Indonesia không muốn các học trò ăn mừng quá cuồng nhiệt sau trận thắng tuyển Trung Quốc ở giải châu Á.

Ford Ranger Wildtrak nâng cấp tại Việt Nam: Động cơ 3.0L V6, thiết kế tinh chỉnh nhẹ cá tính hơn, ‘phả hơi nóng’ lên Hilux, Triton

Thứ 4, 06/05/2026 10:45
Sự thay đổi lớn trên Ford Ranger Wildtrak mới nằm ở động cơ 3.0L V6 diesel.

Chỉ có 30 khách Việt có cơ hội mua chiếc Mercedes-Benz GLS 450 này: Giá dự kiến 6,068 tỷ, đắt hơn bản 'base' gần 400 triệu

Thứ 4, 06/05/2026 14:15
Mercedes-Benz GLS 450 4MATIC Edition 140 là bản đặc biệt nhằm kỷ niệm 140 năm ra đời của thương hiệu Đức, mở bán số lượng giới hạn tại Việt Nam.
xe.nguoiduatin.vn