Tin Kỹ Thuật: Có nghi vấn Deepseek của Trung Cộng đạo dữ liệu từ Chat GPT

Theo Nhật báo Phố Wall

OpenAI đang điều tra xem liệu công ty khởi nghiệp trí tuệ nhân tạo Trung Quốc DeepSeek có đào tạo chatbot mới của mình bằng cách liên tục truy vấn các mô hình AI của mình vốn là một công ty ở Hoa Kỳ hay không.

DeepSeek đã gây ra một cơn sóng thần trên thị trường vào thứ Hai khi các nhà đầu tư tiếp nhận thông tin rằng mẫu R1 mới của công ty dường như hoạt động tốt mặc dù được đào tạo bằng những con chip kém tinh vi hơn – điều được cho là khó hoặc không thể thực hiện được.

Chưng cất là một kỹ thuật được sử dụng để phát triển các mô hình AI nhỏ hơn dựa vào mô hình lớn của Open AI, nó có hiệu quả cao hơn bằng cách đào tạo chúng trên cơ sở dữ liệu phản hồi từ một mô hình AI gốc vốn lớn hơn và đắt tiền hơn. Nó thực sự cô đọng chuyên môn của mô hình lớn thành một mô hình nhỏ hơn, đồng thời cho phép nó bắt chước lý luận của mô hình lớn. Trong khi OpenAI cho phép người dùng doanh nghiệp chắt lọc các mô hình trong nền tảng của mình, các điều khoản dịch vụ của công ty lại cấm người dùng lấy đầu ra của các mô hình OpenAI và sử dụng nó để đào tạo một mô hình cạnh tranh khác.

David Sacks , chuyên gia AI của Tổng thống Trump, hôm thứ Ba đã cáo buộc DeepSeek sử dụng bản sao của các mô hình OpenAI để xây dựng mô hình của riêng mình. “Có bằng chứng đáng kể cho thấy những gì DeepSeek đã làm ở đây là họ đã chắt lọc kiến thức từ các mô hình của OpenAI”, Sacks, một nhà đầu tư mạo hiểm kỳ cựu của Thung lũng Silicon, cho biết. “Và tôi không nghĩ OpenAI vui lòng về điều này”.

David Sacks, chuyên gia AI của Tổng thống Trump, đã nói chuyện với tổng thống tại Phòng Bầu dục vào tuần trước. (Anna Moneymaker/Getty Images)

Một số người dùng DeepSeek nhận thấy rằng đôi khi chatbot sẽ trả lời bằng văn bản có vẻ như được trích từ OpenAI. “Bây giờ, theo chính sách của OpenAI, tôi phải tránh khẳng định rằng tôi có ý thức hoặc tri giác”, chatbot trả lời, theo ảnh chụp màn hình được một người dùng của trang mạng xã hội Reddit đăng vào cuối tuần.

Ảnh chụp lại từ báo TechCrunch cho thấy Deepseek nói mình là Chat GPT khi được hỏi về model của mình thay vì trả lời mình là Deepseek.

Báo TechCrunch kết luận:

DeepSeek chưa tiết lộ nhiều về nguồn dữ liệu đào tạo của DeepSeek V3. Nhưng không thiếu các tập dữ liệu công khai chứa văn bản do GPT-4 tạo ra thông qua ChatGPT. Nếu DeepSeek V3 được đào tạo trên những dữ liệu này, mô hình có thể đã ghi nhớ một số đầu ra của GPT-4 và hiện đang lặp lại chúng nguyên văn.

“Rõ ràng là mô hình đang nhận được phản hồi thô từ ChatGPT tại một thời điểm nào đó, nhưng không rõ là ở đâu”, Mike Cook, một nghiên cứu viên tại King’s College London chuyên về AI, nói với TechCrunch. “Có thể là ‘vô tình’… nhưng thật không may, chúng tôi đã thấy những trường hợp mọi người trực tiếp đào tạo mô hình của họ từ kết quả của các mô hình khác để cố gắng tận dụng kiến thức của họ”.

Các điều kiện sử dụng của OpenAI cấm người dùng sản phẩm của mình, bao gồm cả khách hàng ChatGPT, sử dụng kết quả đầu ra để phát triển các mô hình cạnh tranh với mô hình của OpenAI.

Phải thừa nhận rằng DeepSeek V3 không phải là mô hình đầu tiên tự nhận dạng sai. Gemini của Google và các mô hình khác đôi khi tuyên bố là các mô hình cạnh tranh. Ví dụ, khi được nhắc bằng tiếng Quan Thoại, Gemini nói rằng đó là chatbot Wenxinyiyan của công ty Trung Quốc Baidu. Và đó là vì web, nơi các công ty AI lấy phần lớn dữ liệu đào tạo của họ, đang trở nên lộn xộn với AI sai lỗi.

“Sự ô nhiễm” này, đã khiến việc lọc kỹ lưỡng đầu ra AI từ các tập dữ liệu đào tạo trở nên khá khó khăn.

Chắc chắn là DeepSeek có thể đã đào tạo DeepSeek V3 trực tiếp trên văn bản do ChatGPT tạo ra. Google đã từng bị cáo buộc làm điều tương tự.

Heidy Khlaaf, nhà khoa học AI hàng đầu tại Viện AI Now, một tổ chức phi lợi nhuận, cho biết việc tiết kiệm chi phí từ việc “chắt lọc” kiến thức của mô hình hiện có có thể hấp dẫn các nhà phát triển, bất kể rủi ro (về pháp lý cũng như kết quả kém chính xác). “Nếu đúng là DeepSeek đã thực hiện chưng cất một phần bằng các mô hình OpenAI, thì điều đó sẽ không có gì đáng ngạc nhiên”.

Kẻ Đi Tìm:

Nếu cuộc điều tra tìm ra manh mối của thuật huấn luyện trong mô hình AI của Deepseek đến từ Chat GPT thì lại một lần nữa Trung Cộng đi đường tắt trong kỹ thuật. Và sẽ đúng với thuật thần thông khoa học kiểu cũ rích của Trung Cộng. Vươn lên nhờ đạo văn, đạo kỹ thuật, đạo dữ liệu và … đạo theo lối bá đạo!

Được xem 9 lần, bởi 1 Bạn Đọc trong ngày hôm nay