Sự phát triển thần kỳ của ChatGPT
Tháng 11/2022, Công ty OpenAI của Mỹ đã trình làng sản phẩm công nghệ trí tuệ nhân tạo mang tên ChatGPT. Ngay lập tức, ChatGPT khiến cả thế giới ngạc nhiên khi có thể trả lời và đối thoại với con người một cách tự nhiên. ChatGPT có khả năng tạo ra văn bản, trò chuyện đa ngôn ngữ, viết các loại nội dung sáng tạo khác nhau và trả lời câu hỏi với nhiều thông tin phức tạp.
ChatGPT "biết" nhiều kiến thức hơn bất kỳ ai. Nó có thể trò chuyện như một chuyên gia về vấn đề khai thác khoáng sản ở Papua New Guinea (một quốc gia quần đảo ở châu Đại Dương bên bờ Thái Bình Dương) hoặc chuyển chủ đề để bàn luận về sản xuất chất bán dẫn của tập đoàn TSMC (tập đoàn chuyên về chế tạo chip bán dẫn lớn nhất thế giới có trụ sở tại Đài Loan, Trung Quốc).
Mô hình thứ tư trong loạt mô hình nền tảng GPT (GPT-4) với mạng lưới nơron nhân tạo (ANN) mới nhất đã thi đỗ các kỳ thi mà những người muốn làm việc trong ngành luật pháp và y học ở Mỹ phải vượt qua. Nó cũng có khả năng tạo ra các bài hát, bài thơ hay bài tiểu luận. Những mô hình AI tương tự thì có thể tạo ra các bức ảnh, bản vẽ và các đoạn phim hoạt hình.
GPT-4 là một phân loại của AI tạo sinh với tên gọi "mô hình ngôn ngữ lớn" (viết tắt LLM). Các công ty công nghệ khổng lồ như Alphabet (công ty mẹ của Google), Amazon và Nvidia đều đã đào tạo các LLM của riêng họ và đặt cho chúng những cái tên như Palm, Megatron, Titan và Chinchilla.
GPT-4 vượt qua kỳ thi tuyển dụng vào làm việc làm việc trong ngành luật pháp và y học ở Mỹ và cũng có thể tạo ra các bài hát, bài thơ hay bài tiểu luận, bức ảnh, tranh vẽ hay đoạn phim hoạt hình.
ChatGPT đi vào những hoạt động mang tính con người
Bước nhảy vọt về năng lực của AI trong những năm gần đây bắt nguồn ở nửa đầu của thập niên 2010, khi một kỹ thuật phần mềm với tên gọi "deep learning" (học sâu) trở nên phổ biến. Kết hợp giữa các tập dữ liệu khổng lồ và các mạng nơron nhân tạo được tạo nên bằng các Bộ xử lý đồ hoạ (GPU), deep learning đã cải thiện đáng kể khả năng nhận dạng hình ảnh, xử lý âm thanh và chơi trò chơi của máy tính. Đến cuối thập niên 2010, máy tính đã vượt qua con người ở nhiều trong số các tác vụ này.
Bằng cách hoạt động dưới dạng thức "con người" nhất - trò chuyện, ChatGPT mang đến sự ngỡ ngàng khi một phần mềm máy tính có thể thực hiện các tác vụ mà trí tuệ con người từng độc chiếm. Những người được trải nghiệm trực tiếp sức mạnh của công nghệ này khi đó đều rất kinh ngạc với khả năng của chúng.
Lee Sedol, một trong những kỳ thủ xuất sắc nhất của môn cờ vây, đã giải nghệ sau khi phần mềm AlphaGo, sử dụng mạng nơron nhân tạo của công ty Alphabet, đánh bại anh vào năm 2016. "Ngay cả khi tôi trở thành số một, vẫn có một thực thể không thể bị đánh bại", kỳ thủ này phát biểu khi quyết định giải nghệ.
Kỳ thủ cờ vây hàng đầu thế giới Lee Sedol (Hàn Quốc) đã để thua 4-1 trước AlphaGo, một phần mềm deep learning của DeepMind (công ty con của Google) vào năm 2016. Ảnh: Getty Images
Thế nhưng, đi kèm với sự thán phục này là mối quan ngại sâu sắc đến từ cả những nhân sự trong và ngoài ngành công nghệ. Họ lo sợ rằng các mô hình AI tạo sinh (generative AI) đang được phát triển quá nhanh.
Mỹ, các nước châu Âu và Trung Quốc đều đã bắt đầu bàn luận về các quy định để kiểm soát những phần mềm này. Nhiều tiếng nói nổi bật đang kêu gọi tạm dừng việc phát triển trí tuệ nhân tạo, để tránh trường hợp con người mất kiểm soát chúng, gây ra những hậu quả khó lường. Vậy, để biết xem con người nên lo lắng đến đâu trước tốc độ phát triển nhanh chóng của AI, chúng ta cần phải biết nguồn gốc, cách thức hoạt động, và giới hạn của công nghệ này.
Khả năng ẩn giấu – hai mặt của AI
Mặc dù chúng ta biết được quy tắc hoạt động của ngôn ngữ lớn sử dụng trong trí tuệ nhân tạo nhưng chúng ta không dự đoán được chính xác các câu trả lời mà chúng tạo ra. Những chiếc "bàn tính" với lượng dữ liệu khổng lồ này sở hữu những khả năng mà các bàn tính nhỏ hơn không có, nhiều lúc gây bất ngờ cho chính đội ngũ kỹ sư đã lập trình ra chúng. Jason Wei, một nhà nghiên cứu tại OpenAI, đã đếm được 137 khả năng "nổi lên" (emergent capabilities). Đây là những khả năng mà các kỹ sư không dự tính được, ở nhiều mô hình "ngôn ngữ lớn" khác nhau.
Các khả năng nổi lên này thực chất đều tồn tại trong dữ liệu được sử dụng để huấn luyện các mô hình này nhưng không trở nên rõ ràng cho đến khi "ngôn ngữ lớn" vượt qua một ngưỡng kích thước nhất định. Đây là lý do mà GPT-4 đã vượt qua kỳ thi để cấp giấy chứng nhận hành nghề luật sư tại Hoa Kỳ với số điểm nằm trong ngưỡng 10% xuất sắc nhất. Còn GPT-3.5, phiên bản có kích thước dữ liệu nhỏ hơn một chút, đã trượt bài kiểm tra này.
Các khả năng nổi lên này rất thú vị, vì chúng cho chúng ta thấy tiềm năng của các "ngôn ngữ lớn". Jonas Degrave, một kỹ sư tại DeepMind, công ty nghiên cứu AI thuộc sở hữu của Alphabet, đã sử dụng ChatGPT để viết và chạy các chương trình phần mềm một cách chính xác. Vậy logic là, chỉ lớn hơn một chút nữa, và các "ngôn ngữ lớn" đột nhiên có thể thực hiện một loạt các tác vụ hữu ích khác.
Nhưng các chuyên gia cũng lo lắng vì lý do tương tự. Có phân tích đã cho thấy rằng một số thiên kiến xã hội xuất hiện khi các "ngôn ngữ lớn" mở rộng cơ sở dữ liệu của mình. Rất khó dự đoán được những mặt trái nào đang ẩn nấp, chờ đợi sự gia tăng về kích cỡ để "nổi lên".
Những thách thức với phát triển của ChatGPT
Thành công gần đây của các "ngôn ngữ lớn" trong việc tạo ra các văn bản với độ chân thực cao, cũng như sự xuất hiện các khả năng nổi lên, là do sự hợp nhất của ba yếu tố: lượng dữ liệu khổng lồ, các thuật toán có khả năng học hỏi từ chính mình và sức mạnh tính toán để vận hành những mô hình này.
Quy mô dữ liệu khổng lồ của các "ngôn ngữ lớn" đã thúc đẩy sự phát triển gần đây của chúng. GPT-3 có hàng trăm lớp (layer), hàng tỷ trọng số (weight) và được đào tạo dựa vào hàng trăm tỷ từ vựng. Phiên bản đầu tiên của GPT, được tạo ra 5 năm về trước, thì chỉ bé bằng một phần mười nghìn GPT-3. Tuy nhiên, theo Tiến sĩ Bengio, có một vài lý do để cho rằng sự phát triển này không thể tiếp tục vô hạn định. Những "nguyên liệu" của "ngôn ngữ lớn" - dữ liệu, sức mạnh tính toán, điện, các lao động lành nghề - đều tiêu tốn nhiều tiền của.
Chẳng hạn, việc đào tạo GPT-3 đã sử dụng 1,3 gigawatt giờ điện (đủ để cung cấp năng lượng cho 121 ngôi nhà ở Mỹ trong một năm) và tiêu tốn của OpenAI khoảng 4,6 triệu đô la (112 tỷ đồng). Chi phí dành cho GPT-4, một mô hình lớn hơn nhiều, rơi vào khoảng 100 triệu đô la (2,4 nghìn tỷ đồng).
Vì yêu cầu về sức mạnh tính toán tăng nhanh hơn nhiều so với kích cỡ của dữ liệu đầu vào, nên việc mở rộng quy mô của các "ngôn ngữ lớn" sẽ ngày càng đắt đỏ. Sam Altman, nhà đồng sáng lập của OpenAI, cho rằng: "Chúng ta đang ở giai đoạn cuối cùng ở kỷ nguyên của những mô hình khổng lồ. Chúng ta sẽ cải thiện chúng bằng những cách khác".
Nhưng giới hạn quan trọng nhất đối với sự phát triển của "ngôn ngữ lớn" là nguồn cấp dữ liệu. Việc đào tạo GPT-3 đã sử dụng gần như tất cả các văn bản chất lượng cao có thể được truy cập công khai trên Internet. Một bài nghiên cứu được công bố vào tháng 10 năm 2022 kết luận rằng "kho dữ liệu chất lượng cao sẽ sớm cạn kiệt; có thể trước năm 2026". Chắc chắn có nhiều văn bản chất lượng cao khác, nhưng chúng bị cất giữ trong các cơ sở dữ liệu của các doanh nghiệp hoặc trên các thiết bị cá nhân, không thể truy cập được với quy mô lớn và chi phí thấp như OpenAI đã từng làm.
Ngoài ra, máy tính sẽ trở nên mạnh mẽ hơn theo thời gian, nhưng không có phần cứng mới nào sắp ra mắt sẽ mang tính cách mạng như việc sử dụng GPU cho deep learning vào những năm 2010. Vì vậy, việc đào tạo các mô hình lớn hơn sẽ ngày càng đắt đỏ. Việc cải tiến là khả thi, có thể là nhờ các loại chip mới như Tensor Processing Unit của Google, nhưng chúng sẽ không đem đến bước nhảy vọt như trước đây nữa.
Một bức ảnh minh hoạ từ vụ kiện của Getty Images, cho thấy một bức ảnh gốc (ở bên trái) và một bức ảnh tương tự được tạo ra bởi một AI, chứa hình mờ của Getty Images. Ảnh: Getty Images
Các vấn đề pháp lý cũng là một quan ngại. Stability AI, công ty tạo ra Stable Diffusion, một AI có khả năng tạo ra các hình ảnh, đã bị kiện bởi Getty Images (một doanh nghiệp nhiếp ảnh). Getty Images chỉ ra rằng các hình ảnh do Stable Diffusion tạo ra có chứa hình mờ (watermark) của họ, cho thấy Stable Diffusion đã sử dụng các hình ảnh bản quyền khi không được phép. Điều đó cho thấy, quá trình xây dựng "ngôn ngữ lớn" chắc chắn đã sử dụng một số lượng không nhỏ các văn bản có bản quyền, và OpenAI có lẽ sẽ phải hầu tòa vào một ngày nào đó.
Nhưng ngay cả nếu "ngôn ngữ lớn" không thể được cải tiến hơn nữa và một vụ kiện lớn khiến OpenAI phá sản, sức mạnh của các mô hình này vẫn sẽ tồn tại. Dữ liệu và các công cụ để xử lý nó đều được công khai rộng rãi, mặc dù việc đạt được đến quy mô lớn như OpenAI sẽ tốn kém.
Những sản phẩm mã nguồn mở hiện nay phần nào đã bắt chước được hiệu suất của GPT-4. Đây là một tín hiệu đáng mừng, vì việc đa dạng hoá sẽ đẩy nhanh quá trình tìm ra các ứng dụng mới, từ đó hỗ trợ con người ở nhiều lĩnh vực khác nhau.
Nhưng điều này cũng khiến giới công nghệ lo lắng, khi khả năng của "ngôn ngữ lớn" sẽ ngày càng vượt khỏi tầm hiểu biết của những người tạo ra chúng. Khi đó, con người không thể biết được trí tuệ nhân tạo sẽ ẩn chứa những hệ luỵ nào.
ChatGPT, viết tắt của Chat Generative Pre-training Transformer, là một chatbot do công ty OpenAI của Mỹ phát triển và ra mắt vào ngày 30 tháng 11 năm 2022. ChatGPT được xây dựng dựa trên GPT-3.5 - một dòng mô hình ngôn ngữ lớn của OpenAI.
Ngay sau khi ra mắt, ChatGPT nhanh chóng thu hút sự chú ý nhờ việc nó có thể hồi đáp chi tiết và trả lời lưu loát trên nhiều lĩnh vực kiến thức khác nhau. Đến ngày 4 tháng 12 năm 2022, OpenAI ước tính ChatGPT đã có hơn một triệu người dùng. Tính đến 31 tháng 1 năm 2023, ứng đã đạt 100 triệu người dùng chỉ sau 2 tháng ra mắt.
Sau khi phát hành ChatGPT, OpenAI được định giá 29 tỷ USD. Dịch vụ này được phát hành miễn phí thời gian đầu cho công chúng. Ngày 2 tháng 2 năm 2023, OpenAI tung ra gói đăng ký 20 USD/tháng cho phiên bản ChatGPT Plus, cung cấp cho người dùng dịch vụ ổn định hơn, nhanh hơn cùng các tính năng tiên tiến so với bản miễn phí. Nhà phát triển cũng hé lộ về ChatGPT Professional, phiên bản cao cấp dành cho doanh nghiệp.
10 sự kiện tác động đến bình đẳng giới và quyền phụ nữ trên thế giới năm 2025
Giới & Phát triển 13:48 28/12/2025Năm 2025 là thời điểm then chốt trong nỗ lực toàn cầu hướng tới trao quyền cho phụ nữ và trẻ em gái. Hãy cùng báo PNVN điểm lại 10 sự kiện nổi bật tác động đến bình đẳng giới trên thế giới.
Nỗ lực “thắp sáng” di sản nghề thêu truyền thống ở Huổi Lèng
Văn hóa 08:43 25/12/2025Nằm ẩn mình giữa mây ngàn gió núi của xã Mường Tùng (Điện Biên), những phụ nữ Xạ Phang, ở bản Huổi Lèng đang nỗ lực “thắp sáng” một báu vật vô giá của dân tộc mình. Đó là di sản nghề làm giày thêu truyền thống, nơi từng đường kim mũi chỉ không chỉ dệt nên hoa văn rực rỡ, mà còn gìn giữ nguyên vẹn linh hồn, cốt cách và bản sắc của cả cộng đồng qua bao thế hệ.
Thế nước và lòng dân trong giai đoạn phát triển mới của đất nước (Phần cuối)
Thời cuộc 23:37 24/12/2025Trong bối cảnh thế giới đang trải qua những biến động nhanh chóng, phức tạp và khó dự báo, với sự đan xen của cạnh tranh chiến lược giữa các nước lớn, các cuộc xung đột khu vực, biến động kinh tế toàn cầu, cách mạng công nghệ và các thách thức an ninh phi truyền thống, yêu cầu đặt ra đối với Việt Nam không chỉ dừng lại ở việc giữ vững ổn định hiện có. Quan trọng hơn, đất nước phải chủ động tạo lập và củng cố một thế nước vững chắc, đủ khả năng thích ứng linh hoạt trước những cú sốc từ bên ngoài, đồng thời bảo đảm không gian phát triển an toàn, bền vững trong dài hạn.
"Báu vật sống" của điệu xòe cổ người Thái trắng ở lòng chảo Mường Lay
Văn hóa 09:41 24/12/2025Giữa lòng chảo Mường Lay (phường Mường Lay, tỉnh Điện Biên), nơi “tụ thủy” của ba dòng chảy (sông Đà, Nậm Na và suối Nậm Lay), có một người phụ nữ Thái trắng miệt mài “ngược dòng” thời gian để đánh thức những di sản đang ngủ yên. Đó là nghệ nhân Lò Thị Lả, người đã dành hơn nửa thế kỷ để sưu tầm, chắp nối những mảnh ký ức về điệu xòe cổ từ thời “vua Thái” Đèo Văn Long, biến chúng thành tài sản vô giá cho thế hệ mai sau.
Những mô hình làm nên dấu ấn của Hội LHPN tỉnh Hưng Yên giai đoạn 2021-2025
Giới & Phát triển 14:21 21/12/2025Trong hành trình đổi mới và phát triển, Hội LHPN tỉnh Hưng Yên đã để lại dấu ấn đậm nét bằng những mô hình hoạt động sát thực tiễn, chạm tới nhu cầu của phụ nữ ở từng địa bàn.
Thế nước và lòng dân trong giai đoạn phát triển mới của đất nước (Phần 4)
Thời cuộc 20:01 19/12/2025Trong khi thế nước đang từng bước được nâng lên và lòng dân về cơ bản ổn định, đất nước ta đồng thời phải đối diện với những thách thức “kép”, vừa mang tính toàn cầu, vừa mang tính nội tại. Việc nhận diện đầy đủ, phân tích sâu sắc và chủ động ứng phó với các thách thức này sẽ quyết định khả năng Việt Nam giữ vững ổn định, củng cố thế nước và bồi đắp lòng dân trong giai đoạn phát triển mới.
Lễ cúng bến nước của người M’Nông hồi sinh giữa đại ngàn Đam Rông
Văn hóa 08:06 17/12/2025“Lễ cúng bến nước” của đồng bào M’Nông tại xã Đam Rông 4 - Lâm Đồng đã được phục dựng hoành tráng, mang đậm bản sắc và linh thiêng vào sáng ngày 16/12/2025. Đây chính là thành quả đầy đầy ý nghĩa phát xuất từ khát khao tìm lại những giá trị văn hóa lâu đời đã và đang mai một dần của bà con người M’Nông cùng với sự hỗ trợ, tạo điều kiện của Cục Văn hóa các Dân tộc (Bộ Văn hóa, Thể thao và Du lịch) và chính quyền địa phương.
Thế nước và lòng dân trong giai đoạn phát triển mới của đất nước (phần 3)
Thời cuộc 09:04 12/12/2025Trong tư duy phát triển hiện đại, lòng dân không chỉ là yếu tố chính trị - xã hội, mà là nguồn lực chiến lược, là "sức mạnh mềm" có vai trò quyết định trong tạo lập thế nước và trong việc duy trì ổn định - phát triển bền vững.




