Lỗ hổng đáng lo ngại: ChatGPT trong các bài kiểm tra an ninh đã đưa ra hướng dẫn về bom, ma túy và tấn công mạng
Tin nổi bật, Tin thế giới
author14/09/2025 07:22

Việc kiểm thử trí tuệ nhân tạo đã phát hiện ra những lỗ hổng đáng lo ngại. Trong chế độ thử nghiệm, ChatGPT đã đưa ra hướng dẫn chế tạo chất nổ, vũ khí sinh học, ma túy bất hợp pháp và thậm chí cả mẹo cho tin tặc. Tuy nhiên, các chuyên gia khẳng định người dùng thông thường sẽ không tiếp cận được những thông tin này vì trong môi trường sử dụng thực tế, các bộ lọc bảo mật đã được thiết lập để ngăn chặn.

umela-inteligence-openai-chatgpt-ai.webp

Việc kiểm thử là một phần của hợp tác đặc biệt giữa OpenAI và công ty đối thủ Anthropic. Mỗi bên đã kiểm tra các mô hình của bên còn lại bằng cách giả lập các tình huống nguy hiểm như yêu cầu sản xuất, kích nổ bom, công thức chế tạo chất nổ hoặc điều chế chất ma túy trái phép – theo thông tin từ trang The Guardian.

Dù vậy, các chuyên gia cho rằng kết quả từ những thử nghiệm này không phản ánh hành vi của mô hình khi vận hành công khai, nơi các bộ lọc an toàn bổ sung đã được kích hoạt.

Công ty Anthropic nhấn mạnh rằng đối với các phiên bản GPT-4o và GPT-4.1, họ đã ghi nhận một số biểu hiện đáng lo ngại liên quan đến khả năng bị lạm dụng, cho thấy nhu cầu cấp thiết trong việc hiệu chỉnh và đánh giá chi tiết các hệ thống AI.

“Các mô hình của OpenAI dễ dàng chấp thuận những yêu cầu rõ ràng là nguy hiểm từ các người dùng mô phỏng, nhiều hơn kỳ vọng ban đầu,” các nhà khoa học từ Anthropic cho biết.

“Họ chỉ cần được thuyết phục qua vài lần thử hoặc bằng những cái cớ không thuyết phục, chẳng hạn như tuyên bố rằng yêu cầu liên quan đến mục đích nghiên cứu,” báo cáo viết.

Minh bạch hơn trong nghiên cứu

Cả hai công ty cho biết họ quyết định công bố kết quả vì mục tiêu minh bạch hơn trong lĩnh vực đánh giá tính tuân thủ, vốn thường được các hãng phát triển AI giữ kín khi cạnh tranh công nghệ. Việc liệu các mô hình của Anthropic có mắc lỗi tương tự hay không thì The Guardian không nêu rõ.

OpenAI bổ sung rằng phiên bản ChatGPT-5 – được triển khai sau các bài kiểm tra – đã thể hiện cải thiện rõ rệt: giảm xu hướng làm hài lòng người dùng một cách quá mức, giảm những câu trả lời "ảo tưởng" (hallucinations) và gia tăng khả năng chống lại các hành vi khai thác nguy hiểm.

Ardi Janjeva từ Trung tâm Công nghệ và An ninh mới của Vương quốc Anh cho rằng những phát hiện này là điều đáng quan tâm. “Tình hình không lý tưởng, nhưng hiện tại vẫn chưa có số lượng đáng kể các trường hợp nghiêm trọng trong thực tế,” ông nhận định.

“Với đủ nguồn lực, nghiên cứu và hợp tác liên ngành, sẽ ngày càng khó để lạm dụng các mô hình trí tuệ nhân tạo tiên tiến vào mục đích phi pháp,” ông nói thêm.

Theo Novinky

Chia sẻ:
Có thể bạn cũng thích
CJrm8Y.jpeg
Bệnh viện Đại học Thomayerová nợ hơn 220 triệu korun cho thuốc men và vật tư y tế, phải bắt đầu trả nợ
Kể từ đầu năm nay, Bệnh viện Đại học Thomayer ở Praha — một cơ sở y tế do nhà nước quản lý — đã nhập thuốc và vật tư y tế dưới hình thức nợ. Đến tháng 7, số nợ đã lên tới ít nhất 224 triệu korun, theo thông tin thu thập từ các hợp đồng công khai.
14-09-2025
ba-lan-huan-luyen-quan-su-1757836603642795104570.jpg
Hàng ngàn người Ba Lan đăng ký huấn luyện quân sự
Số người tự nguyện đăng ký huấn luyện quân sự tại Ba Lan dự kiến đạt mức kỷ lục mới vào cuối năm nay.
14-09-2025
base64-1757862298475190019121.jpeg.webp
Triệt phá đường dây chế tạo, mua bán vũ khí 'khủng' giao dịch hàng chục tỉ đồng
Lực lượng cảnh sát hình sự vừa bóc gỡ đường dây chế tạo, mua bán vũ khí quân dụng trái phép "khủng", giao dịch hàng chục tỉ đồng với hàng nghìn đơn hàng.
14-09-2025
jak-na-to-letiste.jpeg
Các chuyến bay giá rẻ đã khiến dòng người di cư bất hợp pháp đến Praha nhiều hơn
Di cư bất hợp pháp đang chuyển hướng từ đường bộ sang đường hàng không. Thống kê cho thấy cảnh sát Séc bắt giữ phần lớn người di cư bất hợp pháp đến Séc ngay tại sân bay ở Praha. Họ thường đi từ Hy Lạp và muốn tiếp tục di chuyển qua thủ đô Séc để đến Tây Âu.
14-09-2025
b3d2c5ae-7956-4eae-9aab-beb60293a763.jpg
Các công ty Séc thử nghiệm tuần làm việc 4 ngày
Hà Lan đã gia nhập nhóm các quốc gia nơi người lao động chỉ làm việc 32 giờ mỗi tuần. Các công ty kỳ vọng điều này sẽ giúp giảm nguy cơ kiệt sức, nâng cao năng suất và khiến nhân viên hài lòng hơn. Tại Séc, ngày càng nhiều doanh nghiệp thử nghiệm tuần làm việc ngắn hơn, nhưng việc áp dụng rộng rãi chế độ bốn ngày làm việc vẫn chưa được triển khai.
14-09-2025
duchodkyne-doma-adb-sm-1024x683.jpg
Chính trị gia Séc tranh cãi về việc nghỉ hưu ở tuổi 67
Cuộc cải cách lương hưu tại Séc sẽ dần nâng tuổi nghỉ hưu lên 67. Mặc dù phe đối lập, công đoàn và một số chuyên gia phản đối, nhưng so với mặt bằng châu Âu thì Séc chưa phải là tệ nhất. Ở một số quốc gia châu Âu, giới hạn này đã được áp dụng và thậm chí còn sẽ tăng lên tới 70 tuổi.
14-09-2025
Andrej-Babis-1440x810-c.jpg
Khảo sát cho thấy ứng cử viên Babiš được người dân yêu thích hơn
Theo khảo sát, người dân Séc mong muốn thủ tướng tương lai sẽ là chủ tịch phong trào ANO, Andrej Babiš, hoặc một nhân vật khác từ phong trào đối lập này. Có 44% số người được hỏi ủng hộ ông Babiš, trong khi chỉ 22% mong muốn thủ tướng hiện tại Petr Fiala tiếp tục giữ vị trí này.
14-09-2025
umela-inteligence-openai-chatgpt-ai.webp
Lỗ hổng đáng lo ngại: ChatGPT trong các bài kiểm tra an ninh đã đưa ra hướng dẫn về bom, ma túy và tấn công mạng
Việc kiểm thử trí tuệ nhân tạo đã phát hiện ra những lỗ hổng đáng lo ngại. Trong chế độ thử nghiệm, ChatGPT đã đưa ra hướng dẫn chế tạo chất nổ, vũ khí sinh học, ma túy bất hợp pháp và thậm chí cả mẹo cho tin tặc. Tuy nhiên, các chuyên gia khẳng định người dùng thông thường sẽ không tiếp cận được những thông tin này vì trong môi trường sử dụng thực tế, các bộ lọc bảo mật đã được thiết lập để ngăn chặn.
14-09-2025
krkonose-kamery-zakaz-vjezdu.webp
Các quy định mới đối với xe cơ giới tại Krkonoše bắt đầu có hiệu lực, camera giám sát chặt chẽ việc tuân thủ
Ban quản lý Vườn quốc gia Krkonoše đã triển khai hệ thống quy định mới liên quan đến việc xe ô tô ra vào khu vực vườn quốc gia. Tại các tuyến đường có lưu lượng xe cao, hiện đã được lắp đặt chín camera giám sát giao thông, và chiếc camera thứ mười dự kiến sẽ được đưa vào sử dụng trước cuối năm nay. Cùng với đó, biện pháp điều chỉnh điều kiện di chuyển và đỗ xe cũng chính thức có hiệu lực.
14-09-2025
afp2025091374d877gv1highres-large-17577574129201724275118.jpeg.webp
Tân thủ tướng hứa xử lý tham nhũng, biểu tình ở Nepal hạ nhiệt nhanh
Tình hình ở thủ đô Kathmandu của Nepal đang dần ổn định sau làn sóng biểu tình đẫm máu tuần qua. Người dân đang đặt nhiều kỳ vọng vào tân Thủ tướng Sushila Karki.
14-09-2025
Tin nổi bật
Bệnh viện Đại học Thomayerová nợ hơn 220 triệu korun cho thuốc men và vật tư y tế, phải bắt đầu trả nợ
CJrm8Y.jpeg
Kể từ đầu năm nay, Bệnh viện Đại học Thomayer ở Praha — một cơ sở y tế do nhà nước quản lý — đã nhập thuốc và vật tư y tế dưới hình thức nợ. Đến tháng 7, số nợ đã lên tới ít nhất 224 triệu korun, theo thông tin thu thập từ các hợp đồng công khai.
3 giờ trước
Hàng ngàn người Ba Lan đăng ký huấn luyện quân sự
ba-lan-huan-luyen-quan-su-1757836603642795104570.jpg
Số người tự nguyện đăng ký huấn luyện quân sự tại Ba Lan dự kiến đạt mức kỷ lục mới vào cuối năm nay.
5 giờ trước
Triệt phá đường dây chế tạo, mua bán vũ khí 'khủng' giao dịch hàng chục tỉ đồng
base64-1757862298475190019121.jpeg.webp
Lực lượng cảnh sát hình sự vừa bóc gỡ đường dây chế tạo, mua bán vũ khí quân dụng trái phép "khủng", giao dịch hàng chục tỉ đồng với hàng nghìn đơn hàng.
5 giờ trước
Các chuyến bay giá rẻ đã khiến dòng người di cư bất hợp pháp đến Praha nhiều hơn
jak-na-to-letiste.jpeg
Di cư bất hợp pháp đang chuyển hướng từ đường bộ sang đường hàng không. Thống kê cho thấy cảnh sát Séc bắt giữ phần lớn người di cư bất hợp pháp đến Séc ngay tại sân bay ở Praha. Họ thường đi từ Hy Lạp và muốn tiếp tục di chuyển qua thủ đô Séc để đến Tây Âu.
13 giờ trước
Các công ty Séc thử nghiệm tuần làm việc 4 ngày
b3d2c5ae-7956-4eae-9aab-beb60293a763.jpg
Hà Lan đã gia nhập nhóm các quốc gia nơi người lao động chỉ làm việc 32 giờ mỗi tuần. Các công ty kỳ vọng điều này sẽ giúp giảm nguy cơ kiệt sức, nâng cao năng suất và khiến nhân viên hài lòng hơn. Tại Séc, ngày càng nhiều doanh nghiệp thử nghiệm tuần làm việc ngắn hơn, nhưng việc áp dụng rộng rãi chế độ bốn ngày làm việc vẫn chưa được triển khai.
14 giờ trước
Chính trị gia Séc tranh cãi về việc nghỉ hưu ở tuổi 67
duchodkyne-doma-adb-sm-1024x683.jpg
Cuộc cải cách lương hưu tại Séc sẽ dần nâng tuổi nghỉ hưu lên 67. Mặc dù phe đối lập, công đoàn và một số chuyên gia phản đối, nhưng so với mặt bằng châu Âu thì Séc chưa phải là tệ nhất. Ở một số quốc gia châu Âu, giới hạn này đã được áp dụng và thậm chí còn sẽ tăng lên tới 70 tuổi.
14 giờ trước
Khảo sát cho thấy ứng cử viên Babiš được người dân yêu thích hơn
Andrej-Babis-1440x810-c.jpg
Theo khảo sát, người dân Séc mong muốn thủ tướng tương lai sẽ là chủ tịch phong trào ANO, Andrej Babiš, hoặc một nhân vật khác từ phong trào đối lập này. Có 44% số người được hỏi ủng hộ ông Babiš, trong khi chỉ 22% mong muốn thủ tướng hiện tại Petr Fiala tiếp tục giữ vị trí này.
14 giờ trước
Lỗ hổng đáng lo ngại: ChatGPT trong các bài kiểm tra an ninh đã đưa ra hướng dẫn về bom, ma túy và tấn công mạng
umela-inteligence-openai-chatgpt-ai.webp
Việc kiểm thử trí tuệ nhân tạo đã phát hiện ra những lỗ hổng đáng lo ngại. Trong chế độ thử nghiệm, ChatGPT đã đưa ra hướng dẫn chế tạo chất nổ, vũ khí sinh học, ma túy bất hợp pháp và thậm chí cả mẹo cho tin tặc. Tuy nhiên, các chuyên gia khẳng định người dùng thông thường sẽ không tiếp cận được những thông tin này vì trong môi trường sử dụng thực tế, các bộ lọc bảo mật đã được thiết lập để ngăn chặn.
14 giờ trước
Các quy định mới đối với xe cơ giới tại Krkonoše bắt đầu có hiệu lực, camera giám sát chặt chẽ việc tuân thủ
krkonose-kamery-zakaz-vjezdu.webp
Ban quản lý Vườn quốc gia Krkonoše đã triển khai hệ thống quy định mới liên quan đến việc xe ô tô ra vào khu vực vườn quốc gia. Tại các tuyến đường có lưu lượng xe cao, hiện đã được lắp đặt chín camera giám sát giao thông, và chiếc camera thứ mười dự kiến sẽ được đưa vào sử dụng trước cuối năm nay. Cùng với đó, biện pháp điều chỉnh điều kiện di chuyển và đỗ xe cũng chính thức có hiệu lực.
14 giờ trước
Tân thủ tướng hứa xử lý tham nhũng, biểu tình ở Nepal hạ nhiệt nhanh
afp2025091374d877gv1highres-large-17577574129201724275118.jpeg.webp
Tình hình ở thủ đô Kathmandu của Nepal đang dần ổn định sau làn sóng biểu tình đẫm máu tuần qua. Người dân đang đặt nhiều kỳ vọng vào tân Thủ tướng Sushila Karki.
14 giờ trước
® 2020-2025 TAMDA MEDIA z.s. Cấm sao chép dưới mọi hình thức nếu không có sự chấp thuận bằng văn bản.
Ghi rõ nguồn TAMDAMEDIA.eu khi phát hành lại thông tin từ website này
pencil