Trong một động thái được xem là bảo vệ tài sản trí tuệ của công ty, OpenAI vừa triển khai yêu cầu xác minh ID chính phủ đối với các nhà phát triển muốn truy cập vào các mô hình trí tuệ nhân tạo (AI) tiên tiến nhất của họ.
OpenAI chưa trả lời yêu cầu bình luận về thông tin trên. Tuy nhiên trong thông báo, “cha đẻ” của ứng dụng ChatGPT giải thích lý do đưa ra quy trình xác minh mới là do một số nhà phát triển cố ý sử dụng các giao diện lập trình ứng dụng (API) của OpenAI, theo đó vi phạm chính sách sử dụng của công ty.

Biểu tượng của Hãng OpenAI. Ảnh: REUTERS/TTXVN
Mặc dù công ty đưa ra lý do chính thức là nhằm ngăn chặn việc lạm dụng, nhưng dường như hành động này xuất phát từ mối quan ngại sâu sắc hơn: kết quả đầu ra từ các mô hình của OpenAI đang bị các đối thủ cạnh tranh thu thập để huấn luyện hệ thống AI riêng. Điều này được chứng minh qua một nghiên cứu mới từ công ty Copyleaks chuyên về phát hiện nội dung AI.
Bằng cách sử dụng hệ thống nhận dạng "dấu vân tay" phong cách của các mô hình AI lớn, Copyleaks phát hiện khoảng 74% đầu ra từ mô hình đối thủ DeepSeek-R1 (Trung Quốc) có thể được phân loại là do OpenAI viết. Con số này không chỉ cho thấy sự trùng lặp mà còn là sự bắt chước.
Copyleaks cũng kiểm tra các mô hình AI khác như phi-4 của Microsoft và Grok-1 của công ty xAI. Kết quả cho thấy gần như không có sự tương đồng với OpenAI, với tỷ lệ "không đồng thuận" lần lượt là 99,3% và 100%. Mô hình Mixtral của Mistral có một số điểm tương đồng.
Nghiên cứu này nhấn mạnh một thực tế: ngay cả khi các mô hình được yêu cầu viết với giọng điệu hoặc định dạng khác nhau, chúng vẫn để lại các chữ ký phong cách có thể phát hiện được - tương tự như dấu vân tay ngôn ngữ. Những dấu vân tay này tồn tại xuyên suốt các nhiệm vụ, chủ đề và câu lệnh (prompt) khác nhau, cũng như có thể được truy về nguồn gốc với độ chính xác nhất định.
Trong khi đó, một số nhà phê bình chỉ ra rằng chính OpenAI đã xây dựng các mô hình ban đầu của họ bằng cách thu thập dữ liệu từ web, bao gồm nội dung từ các nhà xuất bản tin tức, tác giả và người sáng tạo - thường không có sự đồng ý.
Giám đốc điều hành (CEO) của Copyleaks, ông Alon Yamin chỉ ra 2 vấn đề: huấn luyện trên nội dung có bản quyền của con người khi chưa được phép và việc sử dụng đầu ra của các hệ thống AI độc quyền để huấn luyện các mô hình cạnh tranh - giống như đảo ngược kỹ thuật sản phẩm của đối thủ.
Ông Yamin cho rằng trong khi cả 2 phương thức đều gây tranh cãi về mặt đạo đức, việc huấn luyện trên đầu ra của OpenAI đặt ra rủi ro cạnh tranh, bởi điều này cơ bản khai thác những đổi mới khó đạt được trong khi chưa có sự đồng ý hoặc bồi thường cho nhà phát triển ban đầu.
Khi các công ty AI đua nhau xây dựng các mô hình ngày càng mạnh mẽ hơn, cuộc tranh luận về ai sở hữu cái gì và ai có thể huấn luyện trên dữ liệu nào đang trở nên gay gắt hơn. Các công cụ như hệ thống lấy dấu vân tay kỹ thuật số của Copyleaks cung cấp một phương pháp tiềm năng để theo dõi và xác minh quyền tác giả ở các mô hình.
Nguồn: baotintuc.vn
Ghi rõ nguồn TAMDAMEDIA.eu khi phát hành lại thông tin từ website này