ChatGPT - hệ lụy khôn lường hay tương lai của nhân loại?

Sự phát triển thần kỳ của ChatGPT

Tháng 11/2022, Công ty OpenAI của Mỹ đã trình làng sản phẩm công nghệ trí tuệ nhân tạo mang tên ChatGPT. Ngay lập tức, ChatGPT khiến cả thế giới ngạc nhiên khi có thể trả lời và đối thoại với con người một cách tự nhiên. ChatGPT có khả năng tạo ra văn bản, trò chuyện đa ngôn ngữ, viết các loại nội dung sáng tạo khác nhau và trả lời câu hỏi với nhiều thông tin phức tạp.

ChatGPT "biết" nhiều kiến thức hơn bất kỳ ai. Nó có thể trò chuyện như một chuyên gia về vấn đề khai thác khoáng sản ở Papua New Guinea (một quốc gia quần đảo ở châu Đại Dương bên bờ Thái Bình Dương) hoặc chuyển chủ đề để bàn luận về sản xuất chất bán dẫn của tập đoàn TSMC (tập đoàn chuyên về chế tạo chip bán dẫn lớn nhất thế giới có trụ sở tại Đài Loan, Trung Quốc).

Mô hình thứ tư trong loạt mô hình nền tảng GPT (GPT-4) với mạng lưới nơron nhân tạo (ANN) mới nhất đã thi đỗ các kỳ thi mà những người muốn làm việc trong ngành luật pháp và y học ở Mỹ phải vượt qua. Nó cũng có khả năng tạo ra các bài hát, bài thơ hay bài tiểu luận. Những mô hình AI tương tự thì có thể tạo ra các bức ảnh, bản vẽ và các đoạn phim hoạt hình.

GPT-4 là một phân loại của AI tạo sinh với tên gọi "mô hình ngôn ngữ lớn" (viết tắt LLM). Các công ty công nghệ khổng lồ như Alphabet (công ty mẹ của Google), Amazon và Nvidia đều đã đào tạo các LLM của riêng họ và đặt cho chúng những cái tên như Palm, Megatron, Titan và Chinchilla.

ChatGPT - hệ lụy khôn lường hay tương lai của nhân loại?- Ảnh 1.

GPT-4 vượt qua kỳ thi tuyển dụng vào làm việc làm việc trong ngành luật pháp và y học ở Mỹ và cũng có thể tạo ra các bài hát, bài thơ hay bài tiểu luận, bức ảnh, tranh vẽ hay đoạn phim hoạt hình.

 

ChatGPT đi vào những hoạt động mang tính con người

Bước nhảy vọt về năng lực của AI trong những năm gần đây bắt nguồn ở nửa đầu của thập niên 2010, khi một kỹ thuật phần mềm với tên gọi "deep learning" (học sâu) trở nên phổ biến. Kết hợp giữa các tập dữ liệu khổng lồ và các mạng nơron nhân tạo được tạo nên bằng các Bộ xử lý đồ hoạ (GPU), deep learning đã cải thiện đáng kể khả năng nhận dạng hình ảnh, xử lý âm thanh và chơi trò chơi của máy tính. Đến cuối thập niên 2010, máy tính đã vượt qua con người ở nhiều trong số các tác vụ này.

Bằng cách hoạt động dưới dạng thức "con người" nhất - trò chuyện, ChatGPT mang đến sự ngỡ ngàng khi một phần mềm máy tính có thể thực hiện các tác vụ mà trí tuệ con người từng độc chiếm. Những người được trải nghiệm trực tiếp sức mạnh của công nghệ này khi đó đều rất kinh ngạc với khả năng của chúng.

Lee Sedol, một trong những kỳ thủ xuất sắc nhất của môn cờ vây, đã giải nghệ sau khi phần mềm AlphaGo, sử dụng mạng nơron nhân tạo của công ty Alphabet, đánh bại anh vào năm 2016. "Ngay cả khi tôi trở thành số một, vẫn có một thực thể không thể bị đánh bại", kỳ thủ này phát biểu khi quyết định giải nghệ.

ChatGPT - hệ lụy khôn lường hay tương lai của nhân loại?- Ảnh 2.

Kỳ thủ cờ vây hàng đầu thế giới Lee Sedol (Hàn Quốc) đã để thua 4-1 trước AlphaGo, một phần mềm deep learning của DeepMind (công ty con của Google) vào năm 2016. Ảnh: Getty Images

Thế nhưng, đi kèm với sự thán phục này là mối quan ngại sâu sắc đến từ cả những nhân sự trong và ngoài ngành công nghệ. Họ lo sợ rằng các mô hình AI tạo sinh (generative AI) đang được phát triển quá nhanh.

Mỹ, các nước châu Âu và Trung Quốc đều đã bắt đầu bàn luận về các quy định để kiểm soát những phần mềm này. Nhiều tiếng nói nổi bật đang kêu gọi tạm dừng việc phát triển trí tuệ nhân tạo, để tránh trường hợp con người mất kiểm soát chúng, gây ra những hậu quả khó lường. Vậy, để biết xem con người nên lo lắng đến đâu trước tốc độ phát triển nhanh chóng của AI, chúng ta cần phải biết nguồn gốc, cách thức hoạt động, và giới hạn của công nghệ này.

Khả năng ẩn giấu – hai mặt của AI

Mặc dù chúng ta biết được quy tắc hoạt động của ngôn ngữ lớn sử dụng trong trí tuệ nhân tạo nhưng chúng ta không dự đoán được chính xác các câu trả lời mà chúng tạo ra. Những chiếc "bàn tính" với lượng dữ liệu khổng lồ này sở hữu những khả năng mà các bàn tính nhỏ hơn không có, nhiều lúc gây bất ngờ cho chính đội ngũ kỹ sư đã lập trình ra chúng. Jason Wei, một nhà nghiên cứu tại OpenAI, đã đếm được 137 khả năng "nổi lên" (emergent capabilities). Đây là những khả năng mà các kỹ sư không dự tính được, ở nhiều mô hình "ngôn ngữ lớn" khác nhau.

Các khả năng nổi lên này thực chất đều tồn tại trong dữ liệu được sử dụng để huấn luyện các mô hình này nhưng không trở nên rõ ràng cho đến khi "ngôn ngữ lớn" vượt qua một ngưỡng kích thước nhất định. Đây là lý do mà GPT-4 đã vượt qua kỳ thi để cấp giấy chứng nhận hành nghề luật sư tại Hoa Kỳ với số điểm nằm trong ngưỡng 10% xuất sắc nhất. Còn GPT-3.5, phiên bản có kích thước dữ liệu nhỏ hơn một chút, đã trượt bài kiểm tra này.

ChatGPT - hệ lụy khôn lường hay tương lai của nhân loại?- Ảnh 3.

Các khả năng nổi lên này rất thú vị, vì chúng cho chúng ta thấy tiềm năng của các "ngôn ngữ lớn". Jonas Degrave, một kỹ sư tại DeepMind, công ty nghiên cứu AI thuộc sở hữu của Alphabet, đã sử dụng ChatGPT để viết và chạy các chương trình phần mềm một cách chính xác. Vậy logic là, chỉ lớn hơn một chút nữa, và các "ngôn ngữ lớn" đột nhiên có thể thực hiện một loạt các tác vụ hữu ích khác.

Nhưng các chuyên gia cũng lo lắng vì lý do tương tự. Có phân tích đã cho thấy rằng một số thiên kiến xã hội xuất hiện khi các "ngôn ngữ lớn" mở rộng cơ sở dữ liệu của mình. Rất khó dự đoán được những mặt trái nào đang ẩn nấp, chờ đợi sự gia tăng về kích cỡ để "nổi lên".

Những thách thức với phát triển của ChatGPT

Thành công gần đây của các "ngôn ngữ lớn" trong việc tạo ra các văn bản với độ chân thực cao, cũng như sự xuất hiện các khả năng nổi lên, là do sự hợp nhất của ba yếu tố: lượng dữ liệu khổng lồ, các thuật toán có khả năng học hỏi từ chính mình và sức mạnh tính toán để vận hành những mô hình này.

Quy mô dữ liệu khổng lồ của các "ngôn ngữ lớn" đã thúc đẩy sự phát triển gần đây của chúng. GPT-3 có hàng trăm lớp (layer), hàng tỷ trọng số (weight) và được đào tạo dựa vào hàng trăm tỷ từ vựng. Phiên bản đầu tiên của GPT, được tạo ra 5 năm về trước, thì chỉ bé bằng một phần mười nghìn GPT-3. Tuy nhiên, theo Tiến sĩ Bengio, có một vài lý do để cho rằng sự phát triển này không thể tiếp tục vô hạn định. Những "nguyên liệu" của "ngôn ngữ lớn" - dữ liệu, sức mạnh tính toán, điện, các lao động lành nghề - đều tiêu tốn nhiều tiền của.

Chẳng hạn, việc đào tạo GPT-3 đã sử dụng 1,3 gigawatt giờ điện (đủ để cung cấp năng lượng cho 121 ngôi nhà ở Mỹ trong một năm) và tiêu tốn của OpenAI khoảng 4,6 triệu đô la (112 tỷ đồng). Chi phí dành cho GPT-4, một mô hình lớn hơn nhiều, rơi vào khoảng 100 triệu đô la (2,4 nghìn tỷ đồng).

Vì yêu cầu về sức mạnh tính toán tăng nhanh hơn nhiều so với kích cỡ của dữ liệu đầu vào, nên việc mở rộng quy mô của các "ngôn ngữ lớn" sẽ ngày càng đắt đỏ. Sam Altman, nhà đồng sáng lập của OpenAI, cho rằng: "Chúng ta đang ở giai đoạn cuối cùng ở kỷ nguyên của những mô hình khổng lồ. Chúng ta sẽ cải thiện chúng bằng những cách khác".

ChatGPT - hệ lụy khôn lường hay tương lai của nhân loại?- Ảnh 4.

Nhưng giới hạn quan trọng nhất đối với sự phát triển của "ngôn ngữ lớn" là nguồn cấp dữ liệu. Việc đào tạo GPT-3 đã sử dụng gần như tất cả các văn bản chất lượng cao có thể được truy cập công khai trên Internet. Một bài nghiên cứu được công bố vào tháng 10 năm 2022 kết luận rằng "kho dữ liệu chất lượng cao sẽ sớm cạn kiệt; có thể trước năm 2026". Chắc chắn có nhiều văn bản chất lượng cao khác, nhưng chúng bị cất giữ trong các cơ sở dữ liệu của các doanh nghiệp hoặc trên các thiết bị cá nhân, không thể truy cập được với quy mô lớn và chi phí thấp như OpenAI đã từng làm.

Ngoài ra, máy tính sẽ trở nên mạnh mẽ hơn theo thời gian, nhưng không có phần cứng mới nào sắp ra mắt sẽ mang tính cách mạng như việc sử dụng GPU cho deep learning vào những năm 2010. Vì vậy, việc đào tạo các mô hình lớn hơn sẽ ngày càng đắt đỏ. Việc cải tiến là khả thi, có thể là nhờ các loại chip mới như Tensor Processing Unit của Google, nhưng chúng sẽ không đem đến bước nhảy vọt như trước đây nữa.

ChatGPT - hệ lụy khôn lường hay tương lai của nhân loại?- Ảnh 5.

Một bức ảnh minh hoạ từ vụ kiện của Getty Images, cho thấy một bức ảnh gốc (ở bên trái) và một bức ảnh tương tự được tạo ra bởi một AI, chứa hình mờ của Getty Images. Ảnh: Getty Images

Các vấn đề pháp lý cũng là một quan ngại. Stability AI, công ty tạo ra Stable Diffusion, một AI có khả năng tạo ra các hình ảnh, đã bị kiện bởi Getty Images (một doanh nghiệp nhiếp ảnh). Getty Images chỉ ra rằng các hình ảnh do Stable Diffusion tạo ra có chứa hình mờ (watermark) của họ, cho thấy Stable Diffusion đã sử dụng các hình ảnh bản quyền khi không được phép. Điều đó cho thấy, quá trình xây dựng "ngôn ngữ lớn" chắc chắn đã sử dụng một số lượng không nhỏ các văn bản có bản quyền, và OpenAI có lẽ sẽ phải hầu tòa vào một ngày nào đó.

Nhưng ngay cả nếu "ngôn ngữ lớn" không thể được cải tiến hơn nữa và một vụ kiện lớn khiến OpenAI phá sản, sức mạnh của các mô hình này vẫn sẽ tồn tại. Dữ liệu và các công cụ để xử lý nó đều được công khai rộng rãi, mặc dù việc đạt được đến quy mô lớn như OpenAI sẽ tốn kém.

Những sản phẩm mã nguồn mở hiện nay phần nào đã bắt chước được hiệu suất của GPT-4. Đây là một tín hiệu đáng mừng, vì việc đa dạng hoá sẽ đẩy nhanh quá trình tìm ra các ứng dụng mới, từ đó hỗ trợ con người ở nhiều lĩnh vực khác nhau.

Nhưng điều này cũng khiến giới công nghệ lo lắng, khi khả năng của "ngôn ngữ lớn" sẽ ngày càng vượt khỏi tầm hiểu biết của những người tạo ra chúng. Khi đó, con người không thể biết được trí tuệ nhân tạo sẽ ẩn chứa những hệ luỵ nào.

ChatGPT, viết tắt của Chat Generative Pre-training Transformer, là một chatbot do công ty OpenAI của Mỹ phát triển và ra mắt vào ngày 30 tháng 11 năm 2022. ChatGPT được xây dựng dựa trên GPT-3.5 - một dòng mô hình ngôn ngữ lớn của OpenAI.

Ngay sau khi ra mắt, ChatGPT nhanh chóng thu hút sự chú ý nhờ việc nó có thể hồi đáp chi tiết và trả lời lưu loát trên nhiều lĩnh vực kiến thức khác nhau. Đến ngày 4 tháng 12 năm 2022, OpenAI ước tính ChatGPT đã có hơn một triệu người dùng. Tính đến 31 tháng 1 năm 2023, ứng đã đạt 100 triệu người dùng chỉ sau 2 tháng ra mắt.

Sau khi phát hành ChatGPT, OpenAI được định giá 29 tỷ USD. Dịch vụ này được phát hành miễn phí thời gian đầu cho công chúng. Ngày 2 tháng 2 năm 2023, OpenAI tung ra gói đăng ký 20 USD/tháng cho phiên bản ChatGPT Plus, cung cấp cho người dùng dịch vụ ổn định hơn, nhanh hơn cùng các tính năng tiên tiến so với bản miễn phí. Nhà phát triển cũng hé lộ về ChatGPT Professional, phiên bản cao cấp dành cho doanh nghiệp.

Economist)