Theo đuổi khoa học "thị giác máy tính" để hỗ trợ tốt hơn nhóm người yếu thế
Trần Thị Cẩm Giang được vinh danh tại lễ trao giải Nữ sinh Khoa học Công nghệ Việt Nam năm 2025
Sinh viên Trần Thị Cẩm Giang, ngành Khoa học Máy tính, Trường Đại học Công nghệ Thông tin (Đại học Quốc gia TPHCM) cho rằng, việc nghiên cứu phải hướng tới mục tiêu giúp máy tính “hiểu” được thế giới hình ảnh xung quanh con người và phục vụ cho cuộc sống hằng ngày.
Từ bảng hiệu đời thường đến bài toán khoa học
Trần Thị Cẩm Giang (SN 2004) vừa xuất sắc giành Giải thưởng Nữ sinh khoa học - công nghệ Việt Nam năm 2025. Lĩnh vực cô đang theo đuổi là thị giác máy tính (Computer Vision) - một nhánh quan trọng của trí tuệ nhân tạo, cho phép máy tính xử lý và khai thác thông tin từ hình ảnh. "Hình ảnh là nguồn dữ liệu rất trực quan và phong phú, xuất hiện ở khắp nơi trong đời sống như bảng hiệu, biển báo, quảng cáo hay nhãn sản phẩm. Nếu máy tính có thể hiểu được những hình ảnh này, chúng ta có thể xây dựng nhiều ứng dụng thông minh và hữu ích hơn cho con người", cô chia sẻ.
Dự án mà cô theo đuổi mang tên "Phân tích bố cục logic của văn bản trong bảng hiệu". Thay vì chỉ dừng lại ở việc phát hiện chữ trong ảnh, nghiên cứu này hướng tới việc giúp máy tính hiểu được vai trò và ý nghĩa của từng nhóm chữ xuất hiện trên bảng hiệu ngoài đời thực. Trên một bảng hiệu, không phải mọi dòng chữ đều mang giá trị thông tin giống nhau. "Có những dòng là tên cửa hàng, địa chỉ, số điện thoại hay thông tin phụ. Bài toán của mình là giúp hệ thống không chỉ đọc được chữ, mà còn hiểu được cấu trúc và chức năng của từng phần thông tin đó", cô nói.

Ảnh: NVCC
Cách tiếp cận này mở ra khả năng trích xuất dữ liệu có cấu trúc từ những hình ảnh vốn rất phức tạp, thiếu chuẩn hóa - một vấn đề thường gặp trong môi trường đô thị. Nếu giải quyết tốt bài toán này, các hệ thống tra cứu, bản đồ số hay dịch vụ thông minh có thể khai thác thông tin từ hình ảnh hiệu quả hơn nhiều so với hiện nay.
Thị giác máy tính đã và đang hiện diện trong nhiều ứng dụng quen thuộc hằng ngày. "Từ mở khóa điện thoại bằng khuôn mặt, quét mã QR, đến tự động đọc thông tin từ hóa đơn, bảng hiệu hay biển báo giao thông, tất cả đều là ứng dụng của thị giác máy tính". Nhờ công nghệ này, nhiều thao tác trước đây phải làm thủ công nay được tự động hóa, giúp tiết kiệm thời gian, giảm sai sót và mang lại trải nghiệm tiện lợi hơn cho người dùng.
Hỗ trợ các nhóm yếu thế
Cẩm Giang quyết tâm theo đuổi lĩnh vực này là khả năng hỗ trợ các nhóm yếu thế trong xã hội, đặc biệt là người khiếm thị. Nhờ các hệ thống nhận diện hình ảnh, người khiếm thị có thể biết được bảng hiệu, biển chỉ dẫn hay dịch vụ xung quanh mình, từ đó nâng cao khả năng di chuyển độc lập và cải thiện chất lượng cuộc sống. Đây chính là giá trị nhân văn quan trọng mà công nghệ nên hướng tới, bên cạnh những ứng dụng thương mại hay kỹ thuật thuần túy.
Công nghệ nhận diện hình ảnh sẽ đóng vai trò nền tảng trong nhiều lĩnh vực quan trọng như giao thông thông minh hay xe tự hành. "Nhờ khả năng nhận diện làn đường, biển báo, phương tiện và người tham gia giao thông, hệ thống có thể hỗ trợ ra quyết định chính xác hơn, nâng cao an toàn và giảm thiểu rủi ro", cô chia sẻ. Mục tiêu lâu dài của Cẩm Giang là tiếp tục nghiên cứu các bài toán thị giác máy tính, và đưa những kết quả đó đến gần hơn với cộng đồng, thực sự hữu ích trong đời sống hằng ngày.