"Seeing AI" của Microsoft là một ứng dụng dành cho smartphone, sử dụng công nghệ tầm nhìn để mô tả thế giới cho người khiếm thị. Khi tải ứng dụng về máy, người dùng có thể hướng máy ảnh của điện thoại vào một người và thiết bị sẽ nói cho người đó biết họ là ai và họ đang cảm thấy thế nào.
Họ cũng có thể hướng nó vào một sản phẩm và nó sẽ mô tả cho họ biết nó là gì. Tất cả điều này được thực hiện bằng cách sử dụng trí thông minh nhân tạo chạy trên điện thoại.
Cũng như nhận diện những người đứng trước mặt, đoán tuổi và cảm xúc của người lạ, nó có thể nhận diện các đồ gia dụng hay những vật quen thuộc hàng ngày bằng cách quét mã vạch. Nó cũng có thể đọc và quét tài liệu, và thậm chí còn nhận ra đồng đô la Mỹ.
Chức năng cuối cùng này la một ví dụ khá hay về mức độ hữu ích của nó. Vì tất cả các đồng đô la đều có kích cỡ và màu sắc giống nhau bất kể giá trị, việc nhận ra sự khác biệt có thể gây khó khăn hay nói cách khác là gần như không thể đối với người khiếm thị. Seeing AI giúp họ nhận biết được không chút khó khăn.
Tuy nhiên, các tính năng thử nghiệm của Seeing AI như mô tả toàn cảnh hoặc nhận dạng chữ viết tay cần yêu cầu kết nối với dữ liệu đám mây.
Shaikh nói rằng, sự khác biệt giữa ứng dụng này và các ứng dụng tương tự là tốc độ của mạng lưới thần kinh: "Một trong những điều chúng tôi muốn làm là nhận dạng khuôn mặt trên thiết bị và chúng tôi có thể làm như vậy chỉ trong vòng một vài mili giây thôi, rồi bạn sẽ nghe thấy kết quả.
Đó là cải tiến vượt trội về tốc độ, và chúng tôi cố gắng càng nhiều càng tốt trên thiết bị để nó ngày càng nhanh hơn".
Họ cũng có thể hướng nó vào một sản phẩm và nó sẽ mô tả cho họ biết nó là gì. Tất cả điều này được thực hiện bằng cách sử dụng trí thông minh nhân tạo chạy trên điện thoại.
Công ty này đã trình diện một nguyên mẫu của Seeing AI vào tháng 3/2016 tại hội nghị Build, nhưng kể từ giờ, ứng dụng này có thể tải xuống miễn phí ở Mỹ trên hệ điều hành iOS.
Tuy nhiên, hiện vẫn chưa có thông tin chính xác về việc khi nào nó sẽ tương thích với các thiết bị chạy trên nền tảng Android hay các thiết bị tại các nước khác. Ứng dụng hoạt động dựa trên một số kịch bản.Cũng như nhận diện những người đứng trước mặt, đoán tuổi và cảm xúc của người lạ, nó có thể nhận diện các đồ gia dụng hay những vật quen thuộc hàng ngày bằng cách quét mã vạch. Nó cũng có thể đọc và quét tài liệu, và thậm chí còn nhận ra đồng đô la Mỹ.
Chức năng cuối cùng này la một ví dụ khá hay về mức độ hữu ích của nó. Vì tất cả các đồng đô la đều có kích cỡ và màu sắc giống nhau bất kể giá trị, việc nhận ra sự khác biệt có thể gây khó khăn hay nói cách khác là gần như không thể đối với người khiếm thị. Seeing AI giúp họ nhận biết được không chút khó khăn.
Ứng dụng sử dụng công nghệ mạng lưới thần kinh để nhận diện thế giới xung quanh - một công nghệ cơ bản đang được áp dụng phổ biến trên toàn Thung lũng Silicon, cung cấp năng lượng cho xe hơi tự lái, máy bay không người lái và hơn thế nữa.
Các chức năng cơ bản nhất của ứng dụng được thực hiện trực tiếp trên chính thiết bị. Điều này có nghĩa là chúng có thể truy cập nhanh hơn và tốt hơn kể cả trong những trường hợp không có kết nối internet ổn định.Tuy nhiên, các tính năng thử nghiệm của Seeing AI như mô tả toàn cảnh hoặc nhận dạng chữ viết tay cần yêu cầu kết nối với dữ liệu đám mây.
Phát biểu với phóng viên The Verge tại một sự kiện của Microsoft ở London, ông Saqib Shaikh, giám đốc công nghệ của Seeing AI, cho biết, ông thường sử dụng ứng dụng này để đọc những thứ như chữ ký và thực đơn.
Ông khẳng định rằng, ứng dụng không chỉ thực hiện nhiệm vụ cơ bản của công nghệ là nhận dạng ký tự quang học, mà còn hỗ trợ định hướng người dùng - yêu cầu họ di chuyển máy ảnh sang trái hoặc phải để xác định chính xác được mục tiêu hơn.Shaikh nói rằng, sự khác biệt giữa ứng dụng này và các ứng dụng tương tự là tốc độ của mạng lưới thần kinh: "Một trong những điều chúng tôi muốn làm là nhận dạng khuôn mặt trên thiết bị và chúng tôi có thể làm như vậy chỉ trong vòng một vài mili giây thôi, rồi bạn sẽ nghe thấy kết quả.
Đó là cải tiến vượt trội về tốc độ, và chúng tôi cố gắng càng nhiều càng tốt trên thiết bị để nó ngày càng nhanh hơn".