Theo như bài đăng trên tạp chi Nature thì nó không được coi là mở hoàn toàn vì dữ liệu để huấn luyện không cung cấp công khai. Còn thuật toán thì là có cung cấp mã nguồn công khai luôn.
Em đọc thế này, hiểu bập bõm thôi ạ. Mời cụ tự thẩm.
"Họ cung cấp Open Source luôn mô hình DeepSeek R1
Đây không phải đột phá kỹ thuật nhưng đột phá về mặt kinh doanh. Khi họ cho open source mô hình DeepSeek R1 thì họ mở ra hẳn một business ecosystem mới xoay quanh mô hình DeepSeek mà họ cung cấp, mọi người có thể tải mô hình về, mua card hay thuê card từ Nvidia để chạy AI DeepSeek. DeepSeek sẽ không phải tốn chi phí vận hành hạ tầng khổng lồ để cung cấp API cho mọi người như các mô hình đóng như OpenAI, Google hay Anthropic.
NHƯNG nếu bạn muốn chỉnh sửa mô hình DeepSeek R1 hoặc sao chép nó thì không
DeepSeek không cung cấp chi tiết về cách tạo Dataset - tức dữ liệu huấn luyện nên DeepSeek V3 và R1
DeepSeek không cung cấp chi tiết về thuật toán Group Relative Policy Optimization (GRPO) và các thuật toán liên quan dùng để đánh giá câu trả lời reasoning của AI
Trong ngành AI, dataset và các thuật toán dùng trong quá trình training mới là key turning point.
Không có chúng bạn không thể sao chép hoặc fine-tune mô hình DeepSeek R1 đạt hiệu quả như DeepSeek đang làm.
Soon thôi, DeepSeek sẽ bán các dịch vụ xoay quanh các mô hình Open Source này như fine-tuning…"