Lý do sai 9 câu, thủ khoa TSA vẫn đạt 98,98/100 điểm
Thí sinh làm thủ tục trước khi vào dự thi TSA.
Thủ khoa TSA 2026 Nguyễn Tuấn Đạt với số điểm 98,98/100 là học sinh Trường THPT Vĩnh Bảo (Hải Phòng). Dù không làm đúng tuyệt đối 100 câu, nam sinh vẫn đạt mức điểm gần như tuyệt đối do bài thi Đánh giá tư duy của Đại học Bách khoa Hà Nội được chấm theo thang điểm quy đổi, không tính đơn thuần theo số câu đúng – sai.
Ngày 24/3, Đại học Bách khoa Hà Nội công bố kết quả đợt 2. Nhà trường đã nhận được nhiều câu hỏi về cách tính điểm bài thi đánh giá tư duy (TSA).
Theo nhà trường, phổ điểm của hơn 20.000 thí sinh dự thi đợt này có phân phối chuẩn, với điểm trung bình đạt 55,44/100. Thủ khoa là Nguyễn Tuấn Đạt, học sinh Trường THPT Vĩnh Bảo (Hải Phòng), đạt 98,98 điểm – mức cao nhất trong lịch sử 6 năm tổ chức kỳ thi.
Theo kết quả công bố, Tuấn Đạt trả lời đúng 40/40 câu phần Tư duy Toán học, 18/20 câu phần Tư duy Đọc hiểu và 33/40 câu phần Tư duy Khoa học/Giải quyết vấn đề. Như vậy, Tuấn Đạt đã sai 9 câu và tương ứng mất 1,02 điểm.
Tuy nhiên, sau khi kết quả được công bố, trên nhiều diễn đàn xuất hiện không ít thắc mắc xoay quanh cách chấm điểm.
Ngoài ra, một số ý kiến cũng so sánh với thủ khoa TSA đợt 1 hồi tháng 1, khi thí sinh này làm đúng 92/100 câu, tức nhiều hơn về số câu chính xác, nhưng tổng điểm vẫn thấp hơn Tuấn Đạt 2,88 điểm.
Liên quan đến thắc mắc này, PGS.TS Vũ Duy Hải, Trưởng ban Tuyển sinh - Hướng nghiệp, Đại học Bách khoa Hà Nội lý giải: "Bài thi TSA không sử dụng cách tính điểm thô như đa số kỳ thi ở Việt Nam hiện nay".
Đồng thời, theo PGS.TS Vũ Duy Hải, các kỳ thi thường tính tổng điểm câu hỏi trong đề thi đó. Ví dụ đề có 100 câu, mỗi câu 1 điểm, thí sinh đúng 70 câu được tính là 70 điểm.
Tuy nhiên, Đại học Bách khoa Hà Nội không sử dụng cách tính trên bởi khó phân biệt được khả năng của các thí sinh có cùng mức điểm thô (ví dụ cùng 70 điểm), không đánh giá chính xác năng lực của các em khi đề thi có độ khó trung bình khác nhau.

PGS.TS Vũ Duy Hải, Trưởng ban Tuyển sinh - Hướng nghiệp, Đại học Bách khoa Hà Nội
Trên thế giới, để giải quyết vấn đề này, các kỳ thi quy mô lớn như SAT, ACT đã sử dụng các lý thuyết đo lường hiện đại để ước lượng năng lực của thí sinh một cách chính xác và tin cậy. Một trong đó là lý thuyết ứng đáp câu hỏi (IRT).
Lý thuyết này đưa ra giả thuyết mỗi thí sinh trả lời một câu hỏi trong đề thi có một mức năng lực nhất định. Thí sinh có năng lực cao sẽ có xác suất trả lời đúng một câu hỏi bất kỳ cao hơn so với người có năng lực thấp. Dựa vào đó, trường có thể định lượng được các tham số về độ khó và độ phân biệt của câu hỏi, cũng như năng lực của thí sinh.
Đại học Bách khoa Hà Nội áp dụng lý thuyết IRT 2 tham số (độ khó và độ phân biệt) ở bài thi TSA. Trong đó, câu hỏi được tính là khó khi có ít người trả lời đúng. Câu càng nhiều thí sinh đúng thì được tính là càng dễ.
"Với mô hình này, thí sinh càng làm được nhiều câu hỏi khó thì điểm số TSA sẽ càng cao. Ngược lại, nếu thí sinh chỉ làm được những câu hỏi dễ, điểm số TSA sẽ thấp. Điều này dẫn đến việc các thí sinh có thể trả lời đúng được số câu hỏi như nhau nhưng có điểm TSA khác nhau", PGS.TS Vũ Duy Hải thông tin.

TSA không chấm theo số câu đúng đơn thuần, mà đánh giá năng lực thí sinh dựa trên độ khó và khả năng phân loại của từng câu hỏi
Để đảm bảo chính xác và công bằng giữa các đợt thi, PGS.TS Vũ Duy Hải cho biết trường còn áp dụng thuật toán chấm điểm theo nhiều công đoạn, xử lý trên dữ liệu thi chung trước đó để ước lượng các tham số, sau đó mới tính toán ra điểm số TSA cho từng thí sinh.
Theo nhà trường, 4 bước chấm điểm IRT 2 tham số trong TSA như sau:
Bước 1: Căn cứ kết quả làm bài của toàn bộ thí sinh trong từng kíp thi, phần mềm chấm thi sẽ ước lượng độ khó và độ phân biệt của từng câu hỏi trong đề thi hiện tại.
Bước 2: Phần mềm chấm thi ước lượng điểm năng lực tư duy của từng thí sinh dựa theo kết quả làm bài và thang đo của đề thi hiện tại.
Bước 3: Quy đổi thang đo của đề thi hiện tại về thang tham chiếu chung với các đợt thi trước để đưa điểm năng lực tư duy của thí sinh về cùng một thang đo.
Bước 4: Quy đổi điểm năng lực tư duy của thí sinh đã tham chiếu sang thang điểm TSA.
Như vậy, với quy trình chấm điểm IRT 2 tham số như trên, điểm TSA không chỉ được xác định từ số câu trả lời đúng của thí sinh, mà là từ toàn bộ kết quả trả lời của thí sinh đó trên bài thi.
"Điều này lý giải vì sao thủ khoa đợt 1 trả lời được nhiều hơn thủ khoa đợt 2 một câu nhưng tổng điểm thấp hơn", ông Duy Hải giải đáp.