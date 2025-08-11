Hơn một thập niên qua, nhiều chuyên gia liêm chính khoa học liên tục cảnh báo về các nghiên cứu giả mạo hoặc kém chất lượng tràn lan khắp các tạp chí học thuật. Tuy nhiên, phần lớn giới nghiên cứu, các cơ quan quản lý và xã hội vẫn cho rằng gian lận khoa học chỉ là hiện tượng đơn lẻ, con sâu làm rầu nồi canh, xuất phát từ hành vi bất chính của một số ít người.

Nghiên cứu vừa công bố trên Kỷ yếu của Viện Hàn lâm khoa học quốc gia Mỹ (Proceedings of the National Academy of Sciences - PNAS) đánh dấu bước ngoặt trong nhận thức của thế giới về quy mô và mức độ nghiêm trọng của gian lận học thuật khi lần đầu tiên phác họa bức tranh toàn cảnh cuộc khủng hoảng hiện sinh đang đe dọa sự tồn tại của khoa học.

Biểu đồ tăng trưởng số bài báo theo thời gian ẢNH: PNAS Đường nét liền biểu diễn dữ liệu thực tế, đường nét đứt là số liệu ước tính đến năm 2030. Đường màu đen thể hiện tổng số bài báo khoa học, cứ 15 năm lại tăng gấp đôi. Đường màu tím là số bài bị gỡ bỏ, tăng gấp đôi sau mỗi 3,3 năm. Đường màu xanh biểu diễn số bài bị đặt nghi vấn trên PubPeer, nhân đôi sau mỗi 3,6 năm. Đường màu đỏ thể hiện số bài từ công xưởng bán bài báo dỏm, cứ 1,5 năm lại tăng gấp đôi. Như vậy, tốc độ gia tăng sản phẩm từ lò bán bài nhanh gấp hơn 2 lần số bài bị gỡ bỏ hoặc bị đặt nghi vấn và nhanh gấp 10 lần so với tăng trưởng chung của tài liệu học thuật.

C ÔNG XƯỞNG BÁN BÀI BÁO DỎM

Bằng cách phân tích hơn 1 triệu bài báo từ rất nhiều cơ sở dữ liệu, nhóm nghiên cứu ở ĐH Northwestern (Mỹ) và ĐH Sydney (Úc) đã vạch trần mạng lưới gian lận khổng lồ hình thành từ sự cấu kết giữa các công xưởng bán bài báo dỏm (paper mills), dịch vụ môi giới đăng bài, tác giả, biên tập viên, tạp chí và nhà xuất bản.

Xuất phát từ nhu cầu có tên trong công bố quốc tế của nhà nghiên cứu, các công xưởng đã biến gian lận khoa học thành một ngành kinh doanh béo bở bằng cách sản xuất hàng loạt bài báo rởm từ kết quả ngụy tạo hay đạo văn. Những bài báo rác này sau đó được rao bán công khai với cam kết đăng trên tạp chí thuộc danh mục ISI, Scopus. Giá bán bài dao động từ vài trăm đến vài ngàn USD tùy vị trí tác giả chính hay phụ và chỉ số ảnh hưởng của tạp chí.

Để đảm bảo bài báo dỏm được đăng trót lọt trên tạp chí, các công xưởng cài cắm người vào ban biên tập hoặc hối lộ biên tập viên, thậm chí mua lại hay mạo danh tạp chí ISI, Scopus. Khi tạp chí bị phát hiện đã trở thành loại săn mồi và bị xóa tên khỏi danh mục, công xưởng bán bài nhanh chóng tiếp cận các mục tiêu mới.

Trong nghiên cứu trên PNAS, nhóm tác giả lập danh sách khoảng 30.000 bài báo đã bị các tạp chí gỡ bỏ hoặc nghi do công xưởng sản xuất. Rất nhiều bài trong số này có liên hệ với nhau thông qua các cụm tác giả và biên tập viên thường xuyên cộng tác, liên tục duyệt bài cho nhau.

C ẤU KẾT ĐĂNG BÀI

Một thí dụ điển hình về tạp chí bị các bài báo rác xâm nhập là PLOS ONE. Do tạp chí này công khai danh tính biên tập viên phụ trách bình duyệt từng bài báo, nhóm nghiên cứu xác định được 45 biên tập viên phụ trách chỉ 1,3% tổng số bài công bố trên PLOS ONE trong các năm 2006 - 2023. Tuy nhiên, số bài báo mà các biên tập viên này duyệt đăng lại chiếm tới hơn 30% tổng số bài bị tạp chí gỡ bỏ do quy trình bình duyệt bị lũng đoạn. Trong số 45 biên tập viên này, nhiều người thường xuyên duyệt bài cho nhau hoặc chuyên duyệt bài cho cùng một nhóm tác giả nhất định, và có tới hơn một nửa (25 người) là tác giả các bài báo bị chính PLOS ONE gỡ bỏ.

Tình trạng tương tự xảy ra ở 10 tạp chí thuộc Hindawi, nhà xuất bản đã phải đóng cửa vì bị các công xưởng bán bài xâm nhập đến mức mất kiểm soát. Ngoài ra, hàng trăm kỷ yếu hội thảo của Hiệp hội Kỹ sư điện và điện tử (IEEE) có tỷ lệ bài bị gỡ hay bị đặt nghi vấn cao đột biến. Chỉ ít ngày trước, Nhà xuất bản Frontiers gỡ bỏ đồng loạt 122 bài báo sau khi phát hiện mạng lưới biên tập viên và tác giả thông đồng với nhau nhằm thao túng bình duyệt, bao gồm 35 cá nhân đăng tới hơn 4.000 bài đáng ngờ trên các tạp chí thuộc nhiều nhà xuất bản.

Nghiên cứu trên PNAS cũng xem xét hơn 2.000 bài báo có hình ảnh trùng lặp, phát hiện những nhóm bài đăng vào cùng khoảng thời gian trên một vài tạp chí, cho thấy các công xưởng sản xuất bài báo rởm theo đợt dựa trên thư viện hình ảnh giả mạo. 34,1% số bài này đã bị các tạp chí gỡ bỏ.

Nhóm nghiên cứu cũng điều tra Academic Research and Development Association (ARDA), công ty môi giới đăng bài tại Ấn Độ quảng cáo dịch vụ viết luận văn, bài báo, đảm bảo đăng bài trên các tạp chí ISI, Scopus. Danh sách tạp chí mà ARDA cam kết thay đổi liên tục với nhiều tạp chí mới được bổ sung ngay khi có tạp chí bị loại khỏi các danh mục. Phân tích chi tiết toàn bộ bài báo đăng trên 5 tạp chí liệt kê trên trang web của ARDA cho thấy VN nằm trong số những nước đăng nhiều bài nhất.

Hình chụp trang web 123mi.ru (trên) cho thấy bài báo của một tác giả VN đã được rao bán nhiều tháng trước khi công bố trên tạp chí Digital Scholarship in the Humanities vào ngày 21.10.2019 (dưới) ảnh: CHỤP MÀN HÌNH

C UỘC ĐUA KHÔNG CÂN SỨC

Theo nhóm nghiên cứu, những gì họ phát hiện mới chỉ là chóp của tảng băng. Số bài do các công xưởng sản xuất có thể nhiều gấp 100 lần con số đã biết và mới chỉ 28,7% lượng bài nghi ngờ bị gỡ bỏ, nghĩa là phần lớn bài báo dỏm vẫn đang len lỏi trong kho tài liệu khoa học.

Nghiên cứu cũng cho thấy tốc độ gia tăng đáng kinh ngạc sản phẩm từ các lò bán bài với số bài tăng gấp đôi chỉ sau mỗi 1,5 năm, nhanh gấp 10 lần so với tăng trưởng chung của tài liệu học thuật. Trong khi đó, số bài bị gỡ bỏ và bị đặt nghi vấn trên PubPeer tăng gấp đôi sau 3 - 4 năm, cho thấy nỗ lực dọn rác, làm sạch tài liệu học thuật đang bị các công xưởng bỏ lại rất xa. Khi một lĩnh vực nghiên cứu bị ô nhiễm bởi bài báo rác đến mức độ nhất định, các nhà khoa học nghiêm túc sẽ rời bỏ nó. Nguy hiểm hơn, nghiên cứu giả mạo có thể xâm nhập những lĩnh vực nhạy cảm như y khoa, lọt vào các hướng dẫn điều trị, đe dọa tính mạng hàng triệu người.

Sự nở rộ của trí tuệ nhân tạo (AI) khiến việc đối phó với gian lận học thuật càng khó khăn. Lò bán bài có thể dùng AI để tạo hình ảnh, kết quả giả mạo ngày một tinh vi. Trong khi đó, AI lại được huấn luyện từ nguồn tài liệu chứa cả nghiên cứu nghiêm túc lẫn bài báo rởm, dẫn đến sai lệch ngày càng lớn, rác lại đẻ thêm rác.

Không thể giải quyết cuộc khủng hoảng hiện sinh này của khoa học chỉ bằng cách chạy đua với các lò bán bài, tìm cách phát hiện thêm gian lận hay gỡ thêm bài. Nỗ lực khử độc tài liệu học thuật là cần thiết, nhưng gốc rễ vấn đề nằm ở động lực khiến không ít người làm nghiên cứu chọn con đường gian lận. Chừng nào hệ thống đánh giá khoa học vẫn dựa vào số lượng thay vì chất lượng nghiên cứu, còn những kẻ gian lận chẳng những không bị trừng phạt mà còn dễ dàng thăng tiến và kiếm danh lợi thì khoa học càng tiến gần đến bờ vực sụp đổ.