Giải pháp hiệu quả phát hiện và ngăn chặn tin giả

TS. Nguyễn Thanh Bình

09:55 - 17/03/2024

Một phương pháp hiệu quả được sử dụng trong việc phát hiện tin giả (fake news) là kết hợp mô hình Học sâu (Deep Learning) với Xử lý ngôn ngữ tự nhiên (NLP). Công nghệ này dựa trên việc sử dụng mạng nơ-ron nhân tạo để phân tích và hiểu ngôn ngữ tự nhiên, từ đó đánh giá tính xác thực của thông tin.

Tin giả (fake news) là thông tin sai lệch được tạo ra và phát tán mà không dựa trên sự thật. Vấn đề này có nguồn gốc từ nhiều yếu tố khác nhau và đã trở nên phổ biến hơn trong kỷ nguyên số.

UNESCO nhấn mạnh rằng tin giả là thông tin sai lệch được tạo ra và phát tán mà không có ý định chính trực. Ủy ban Châu Âu (EC) định nghĩa tin giả là thông tin được kiểm chứng là sai lệch hoặc gây hiểu lầm, được tạo ra, trình bày và phát tán với mục đích lừa dối công chúng hoặc gây hại, không phụ thuộc vào phương tiện lan truyền. Luật An ninh mạng 2018 mặc dù không đưa ra một định nghĩa cụ thể cho tin giả nhưng bộ luật này có quy định về việc xử lý thông tin sai sự thật trên mạng, gây hậu quả nghiêm trọng, ảnh hưởng đến trật tự an toàn xã hội.

Thực tế cho thấy các tổ chức và các quốc gia khác nhau có cách tiếp cận khác nhau đối với việc định nghĩa và xử lý tin giả, nhưng mục tiêu chung đều nhằm bảo vệ công chúng khỏi thông tin sai lệch và những hậu quả tiêu cực của nó.

Thống kê tỷ lệ tiếp xúc với tin giả và những hậu quả của việc phát tán tin giả

Thống kê	Tỷ lệ/Số lượng	Nguồn	Ghi chú
Công dân toàn cầu tiếp xúc với tin giả	86%	Ipsos	Cuộc khảo sát trên hơn 25.000 người tại hơn 25 nền kinh tế
Số ca nhập viện do thông tin sai lệch về COVID-19 (3 tháng đầu năm 2020)	6000	Tổ chức Y tế Thế giới (WHO)	Nghiên cứu gợi ý về tác động của tin giả trong 3 tháng đầu năm 2020
Số ca tử vong do thông tin sai lệch về COVID-19 (3 tháng đầu năm 2020)	800	Tổ chức Y tế Thế giới (WHO)	Ước tính số ca tử vong có thể liên quan đến thông tin sai lệch
Người Mỹ gặp thông tin sai lệch trực tuyến hàng ngày	53%	DemandSage	Theo khảo sát của YouGov
Người Mỹ thấy tin giả trên mạng xã hội hàng ngày	67%	DemandSage	Theo báo cáo của Statista
Công dân toàn cầu ủng hộ giáo dục nhận biết tin giả	87%	Techjury	87% người trên toàn cầu ủng hộ cải thiện giáo dục để nhận diện tin giả
Người Mỹ không tin tưởng vào nguồn tin tức truyền thống	44%	Techjury	44% người tiêu dùng tin tức không còn tin tưởng vào nguồn truyền thống
Người Mỹ chia sẻ câu chuyện sau này nhận ra là giả	16%	Techjury	16% người lớn tại Mỹ thừa nhận đã chia sẻ thông tin sau này nhận ra là giả

Phương pháp hiệu quả phát hiện tin giả

Phát hiện tin giả là một thách thức phức tạp đòi hỏi sự kết hợp giữa các phương pháp truyền thống và công nghệ hiện đại. Một công nghệ điển hình và hiệu quả trong việc phát hiện tin giả là kết hợp mô hình Học sâu (Deep Learning) với Xử lý ngôn ngữ tự nhiên (NLP). Công nghệ này dựa trên việc sử dụng các mạng nơ-ron nhân tạo để phân tích và hiểu ngôn ngữ tự nhiên của con người, từ đó xác định tính xác thực của thông tin.

Tiêu biểu cho việc sử dụng kết hợp Deep Learning với NLP để phát hiện tin giả hiện nay là mô hình học máy BERT (Bidirectional Encoder Representations from Transformers), một bước tiến đáng kể trong lĩnh vực xử lý ngôn ngữ tự nhiên được phát triển bởi Google. BERT đã đạt được thành công đáng chú ý trong việc hiểu ngữ cảnh của từ ngữ trong văn bản, mở ra cánh cửa mới cho việc phát hiện tin giả một cách hiệu quả.

BERT là một mô hình NLP được huấn luyện sẵn có khả năng hiểu ngữ cảnh của từ ngữ trong một câu từ cả hai hướng: trái qua phải và phải qua trái, giúp nó nắm bắt được ngữ nghĩa đầy đủ và phức tạp của văn bản. Điều này làm cho BERT trở nên mạnh mẽ trong việc xử lý các tác vụ liên quan đến ngôn ngữ tự nhiên, bao gồm cả việc phát hiện tin giả.

Cách hoạt động của BERT trong phát hiện tin giả

- Hiểu ngữ cảnh: BERT xử lý văn bản bằng cách hiểu ngữ cảnh của từng từ trong một câu, thay vì chỉ xem xét từ độc lập. Điều này giúp mô hình phân biệt được ý nghĩa của cùng một từ khi nó xuất hiện trong các ngữ cảnh khác nhau.

- Phân tích cảm xúc và ý kiến: BERT có thể được sử dụng để đánh giá cảm xúc và ý kiến trong văn bản, giúp xác định liệu một bài báo có đang cố tình mang tính chất cực đoan, thiên vị, hoặc gây hiểu lầm.

- So sánh và xác minh thông tin: Bằng cách so sánh thông tin trong bài báo với cơ sở dữ liệu thông tin đã được xác minh, BERT có thể xác định xem thông tin đó có phải là tin giả hay không.

Mô hình BERT, những biến thể và khả năng ứng dụng

Mô hình BERT được phát triển bởi Google AI và là một phần của nỗ lực nghiên cứu rộng lớn của Google trong lĩnh vực xử lý ngôn ngữ tự nhiên. BERT đã được Google sử dụng để cải thiện hiểu biết về các truy vấn tìm kiếm và nội dung trang web, giúp tăng cường chất lượng của kết quả tìm kiếm trên Google Search.

Tuy nhiên, về mặt kỹ thuật, mô hình BERT là một mô hình ngôn ngữ được huấn luyện độc lập và không trực tiếp liên kết với cơ sở dữ liệu cụ thể nào của Google hay bất kỳ hệ thống dữ liệu nào khác. Thay vào đó, BERT được huấn luyện trên một lượng lớn văn bản từ Internet, bao gồm Wikipedia và các nguồn mở khác, để học cách hiểu ngôn ngữ tự nhiên.

Khi được áp dụng vào các sản phẩm và dịch vụ cụ thể như Google Search, BERT có thể giúp Google hiểu tốt hơn các truy vấn của người dùng và nội dung của các trang web mà nó lập chỉ mục. Điều này dẫn đến việc cải thiện độ chính xác và liên quan của kết quả tìm kiếm. Nhưng không có nghĩa là BERT trực tiếp truy cập hoặc tương tác với cơ sở dữ liệu riêng của Google.

BERT có thể được tích hợp vào các hệ thống tự động để lọc và phân loại thông tin, giảm bớt gánh nặng cho các biên tập viên và nhà kiểm duyệt nội dung; đồng thời tạo ra một lớp kiểm duyệt ban đầu, giúp người dùng hoặc tổ chức đưa ra quyết định nhanh chóng về việc phát tán, chia sẻ hoặc xử lý thông tin.

Nói chung, mô hình BERT và các biến thể của nó có thể được tích hợp vào nhiều hệ thống khác nhau và sử dụng cho nhiều mục đích khác nhau, không giới hạn trong phạm vi của dữ liệu hoặc hệ thống cụ thể nào.

Tuy nhiên, việc triển khai mô hình BERT đòi hỏi tài nguyên tính toán cao, cập nhật thông tin liên tục và đối mặt với khó khăn về tinh chỉnh, quản lý dữ liệu và bảo mật.

Đến nay, có nhiều tổ chức và một số quốc gia đã bắt đầu khám phá và ứng dụng mô hình BERT và các biến thể của nó vào việc phát hiện tin giả như: Full (một tổ chức kiểm định thực tế hàng đầu tại Anh), Snopes (một trang web kiểm định thực tế lâu đời nhất tại Mỹ). Snopes áp dụng công nghệ AI để nhanh chóng phân tích và xác minh tính xác thực của các câu chuyện và thông tin lan truyền trên Internet.

Singapore, Ấn Độ, và nhiều quốc gia khác cũng đã thử nghiệm việc sử dụng BERT và các mô hình AI khác để phát hiện tin giả, đặc biệt là trong các sự kiện quan trọng.

Một tổ chức hoặc tòa soạn báo có thể tích hợp hoặc mua một phiên bản thương mại của BERT để sử dụng trong các nhiệm vụ như phát hiện tin giả, phân tích cảm xúc, hiểu ngôn ngữ tự nhiên, và nhiều hơn nữa.

Phương pháp Agile - xu thế hiện đại trong quản lý dự án ĐỌC NGAY

Google cũng cung cấp phiên bản BERT đã được huấn luyện sẵn trên dữ liệu văn bản lớn. Các tổ chức có thể tinh chỉnh mô hình BERT để nâng cao khả năng phát hiện tin giả bằng việc xác định siêu tham số phù hợp và chọn lựa dữ liệu huấn luyện chất lượng cao. Do yêu cầu về tài nguyên tính toán cao, việc triển khai mô hình BERT thường được thực hiện trên các dịch vụ đám mây như Google Cloud Platform, Amazon Web Services, hoặc Microsoft Azure, sử dụng GPU hoặc TPU để tăng tốc quá trình huấn luyện và dự đoán.

Cùng với việc nghiên cứu, ứng dụng các giải pháp tiên tiến trong phát hiện tin giả sử dụng công nghệ AI và NLP có thể được tăng cường thông qua vai trò kiểm soát và hỗ trợ của Chính phủ bằng cách thiết lập các quy định, khuyến khích hợp tác liên ngành, cung cấp tài trợ cho nghiên cứu và phát triển công nghệ, triển khai chương trình giáo dục và nhận thức công cộng, tạo cơ chế thu thập phản hồi từ người dùng, tham gia vào hợp tác quốc tế.

Những biện pháp này nhằm mục đích không chỉ kiểm soát thông tin giả mạo mà còn tạo ra một môi trường thông tin đáng tin cậy và minh bạch trong xã hội. Qua đó thể hiện vai trò của Chính phủ không chỉ là kiểm soát và quản lý mà còn tạo ra một môi trường thông tin lành mạnh thông qua việc hỗ trợ đổi mới công nghệ, giáo dục công chúng, tăng cường hợp tác cả trong và ngoài nước. Mục tiêu cuối cùng là tạo dựng một xã hội thông tin mở, trong đó thông tin chính xác và đáng tin cậy được lan tỏa.

Bình luận của bạn

Bình luận

Giải pháp hiệu quả phát hiện và ngăn chặn tin giả

Thống kê tỷ lệ tiếp xúc với tin giả và những hậu quả của việc phát tán tin giả

Phương pháp hiệu quả phát hiện tin giả

Cách hoạt động của BERT trong phát hiện tin giả

Mô hình BERT, những biến thể và khả năng ứng dụng

Phương pháp Agile - xu thế hiện đại trong quản lý dự án ĐỌC NGAY

Quyết liệt rà soát, phạt nặng để ngăn chặn tin giả

Gỡ bỏ hàng chục nghìn tin giả trên Facebook, Youtube, TikTok, Netflix

Bộ Công an sẽ xử lý một số doanh nghiệp lớn là thông tin giả, sai sự thật

Báo động tình trạng tin giả, độc hại trên mạng Internet

Liên minh châu Âu đẩy mạnh cuộc chiến chống tin giả trên các nền tảng truyền thông xã hội

Giải pháp hiệu quả phát hiện và ngăn chặn tin giả

Thống kê tỷ lệ tiếp xúc với tin giả và những hậu quả của việc phát tán tin giả

Phương pháp hiệu quả phát hiện tin giả

Cách hoạt động của BERT trong phát hiện tin giả

Mô hình BERT, những biến thể và khả năng ứng dụng

Phương pháp Agile - xu thế hiện đại trong quản lý dự ánĐỌC NGAY

Quyết liệt rà soát, phạt nặng để ngăn chặn tin giả

Gỡ bỏ hàng chục nghìn tin giả trên Facebook, Youtube, TikTok, Netflix

Bộ Công an sẽ xử lý một số doanh nghiệp lớn là thông tin giả, sai sự thật

Báo động tình trạng tin giả, độc hại trên mạng Internet

Liên minh châu Âu đẩy mạnh cuộc chiến chống tin giả trên các nền tảng truyền thông xã hội

Phương pháp Agile - xu thế hiện đại trong quản lý dự án ĐỌC NGAY