[Funland] Chào mừng DeepSeek R1!

Bayi 1921

Xe tải
Biển số
OF-816997
Ngày cấp bằng
4/8/22
Số km
476
Động cơ
14,115 Mã lực
Tuổi
36
Theo như bài đăng trên tạp chi Nature thì nó không được coi là mở hoàn toàn vì dữ liệu để huấn luyện không cung cấp công khai. Còn thuật toán thì là có cung cấp mã nguồn công khai luôn.
Ko thằng nào ngu mà công khai dữ liệu huấn luỵên để bị gõ đầu vì tội vi phạm bản quyền đâu cậu.

Meta Aphanet hay open ai điều ko công khai dũ lịêu huấn luỵên
 

losedow

Xe tải
Biển số
OF-822088
Ngày cấp bằng
6/11/22
Số km
456
Động cơ
761,239 Mã lực
Giá cp Meta tăng cụ nhé vì deepseek nó dựa trên mã nguồn mở của Meta đấy.
IMG_2976.jpeg
Vâng cụ. Ngoài Meta còn một số mã nữa cũng tăng, chứng tỏ cũng đều là chỗ dựa của deepseek cả.
Còn cụ Jensen Huang, cụ Oracle, cụ Microsoft nữa thì sao ạ?
Sao bọn Mỹ nó phải sợ nhỉ, cứ như cụ có phải vui cả phố uôn không.
 

Haiau69

Xe buýt
Biển số
OF-593147
Ngày cấp bằng
3/10/18
Số km
711
Động cơ
161,330 Mã lực
Nơi ở
Hà Nội
Ko thằng nào ngu mà công khai dữ liệu huấn luỵên để bị gõ đầu vì tội vi phạm bản quyền đâu cậu.

Meta Aphanet hay open ai điều ko công khai dũ lịêu huấn luỵên
Đó là người ta nói căn cứ trên định nghĩa thôi chứ việc nó ko công khai dữ liệu cũng là bình thường. Em trả lời cụ trên nói là nó giấu thuật toán thì ko phải.
 

Haiau69

Xe buýt
Biển số
OF-593147
Ngày cấp bằng
3/10/18
Số km
711
Động cơ
161,330 Mã lực
Nơi ở
Hà Nội
Vấn đề nó là phần mềm vs phần cứng cụ ạ. Em có post ở trên rồi. Thằng deepseek nó làm cho cái dự báo doanh thu của cụ Huang bị giảm so với trước. Nên giá NVDA sập nhanh. Bên cạnh đó các nhà đầu tư ko phải ai cũng hiểu sâu về AI nên cho rằng NVDA là đỉnh của chóp nên thấy NVDA xuống thì bán tháo cả các cp công nghệ khác.

Tất nhiên việc thằng Deepseek nó ra phần mềm hiệu suất cao hơn chứng tỏ nó đã tối ưu hoá về giải thuật tốt hơn mấy anh khác. Nên cũng phải nể nó đấy.

Vâng cụ. Ngoài Meta còn một số mã nữa cũng tăng, chứng tỏ cũng đều là chỗ dựa của deepseek cả.
Còn cụ Jensen Huang, cụ Oracle, cụ Microsoft nữa thì sao ạ?
Sao bọn Mỹ nó phải sợ nhỉ, cứ như cụ có phải vui cả phố uôn không.
 

vihali

Xe container
Biển số
OF-14218
Ngày cấp bằng
23/3/08
Số km
8,944
Động cơ
-137,779 Mã lực
Vẫn bình thường cụ ạ, e vừa test
Em test thì nó lại ok rồi. Em bảo làm thơ lục bát mà nó cứ làm thất ngôn bát cú. Hôm qua luyện xong cho nó làm đúng thì hôm nay vào bị lỗi.
 

laramoca

Xe tải
Biển số
OF-873768
Ngày cấp bằng
26/12/24
Số km
277
Động cơ
31,654 Mã lực
Em đọc bài của Hong Phuc Nguyen trên fb thì thấy không phải mở hoàn toàn. Nó vẫn phải giữ những thứ khiến cho đối thủ không theo kịp hoặc ko thể tạo một con tốt tương đương. Giữ thuật toán với cái gì nữa ấy.
Bon deepseek đưa ra khái niệm mới "mạng chuyên gia" khiến mô hình chạy cực nhanh trên GPU cũ, kể cả code public kia có full mà ko biết tham số và dữ liệu đưa vào phù hợp thì chỉ tạo ra cục gạch thôi mà nhiều cụ còn đòi tối ưu mô hình của ló😶
 

Haiau69

Xe buýt
Biển số
OF-593147
Ngày cấp bằng
3/10/18
Số km
711
Động cơ
161,330 Mã lực
Nơi ở
Hà Nội
MoE này cũng không mới cụ nhé. 1 năm trước có thằng Pháp đưa ra 1 công nghệ AI dựa trên kiến trúc MoE rồi:


Deepseek là chỉ áp dụng một cách tối ưu hơn thôi.

Khái niệm này có từ năm 1991 cơ đấy.
“The story begins in 1991 with the seminal paper by Robert Jacobs and Geoffrey Hinton titled "Adaptive Mixtures of Local Experts." They proposed a novel architecture that broke away from the traditional single-network approach.”




Bon deepseek đưa ra khái niệm mới "mạng chuyên gia" khiến mô hình chạy cực nhanh trên GPU cũ, kể cả code public kia có full mà ko biết tham số và dữ liệu đưa vào phù hợp thì chỉ tạo ra cục gạch thôi mà nhiều cụ còn đòi tối ưu mô hình của ló😶
 

Quê bầm

Xe container
Biển số
OF-740060
Ngày cấp bằng
20/8/20
Số km
5,997
Động cơ
115,706 Mã lực
Mấy hôm
Bận rộn nay khắp các tờ báo viết cái Seek này
 

piedaide

Xe buýt
Biển số
OF-157
Ngày cấp bằng
8/6/06
Số km
507
Động cơ
529,256 Mã lực
Căng nhể, anh Nvidia ra con GPU khủng, ăn điện như voi uống philatop mà giờ gặp anh TQ này cũng căng.
Con này vẫn chạy trên con chip Nvidia, H800, là chip loại 2 (cắt bớt options để xuất được sang TQ) giá 20K bằng nửa con xịn H100 :)) .
Đọc các bài review của hội chuyên AI nó test con AI tung của này, thì nó khủng phết đó. Các bài test này là các bài test chung do đóng góp của các chuyên gia toàn cầu.
Đừng hỏi nó về chính trị TQ, mà chỉ hỏi về khoa học kỹ thuật, kinh tế thôi, thì nó trả lời ngon phết, bằng tiếng Việt luôn nhé.
 

duongphong

Xe container
Biển số
OF-431207
Ngày cấp bằng
20/6/16
Số km
6,738
Động cơ
324,687 Mã lực
Nơi ở
Lầu Năm Góc
Mới nhìn thì có vẻ hoành phết. Nhưng mọi chuyện cứ phải từ từ.
1000001381.png
 

piedaide

Xe buýt
Biển số
OF-157
Ngày cấp bằng
8/6/06
Số km
507
Động cơ
529,256 Mã lực
Em đang thắc mắc đoạn này. Vì chắc chắn sẽ bị đối thủ mổ xẻ và copy thì vì sao họ lại tung mã nguồn ra vào thời điểm AI còn mới mẻ và 2 phe vẫn đang cố giành càng nhiều thị phần càng tốt chứ không phải thời điểm phe nguồn đóng đang chiếm phần lớn thị phần. Giả dụ Meta copy toàn bộ về, sửa thêm 1 chút trí tuệ của Meta vào và ra 1 sản phẩm vượt trội hơn DeepSeek thì DeepSeek sẽ được lợi ích gì?
hehe, ta chỉ ngồi xem họ đánh cờ thôi, nên chưa biết thế nào. Cái bác nêu, bên lãnh đạo DS nó chả nghĩ nát và cân nhắc lợi/hại chán chê trước khi tung mã nguồn, thậm chí nó còn xin ý kiến của chính phủ TQ trước khi công bố ấy chứ :))
 

toyota219

Xe điện
Biển số
OF-645333
Ngày cấp bằng
2/5/19
Số km
3,006
Động cơ
184,731 Mã lực
Tuổi
38
Baba mới ra con Qwen2.5-VL
 

tvu732

Xe tăng
Biển số
OF-708234
Ngày cấp bằng
21/11/19
Số km
1,079
Động cơ
124,798 Mã lực
Theo như bài đăng trên tạp chi Nature thì nó không được coi là mở hoàn toàn vì dữ liệu để huấn luyện không cung cấp công khai. Còn thuật toán thì là có cung cấp mã nguồn công khai luôn.
Em đọc thế này, hiểu bập bõm thôi ạ. Mời cụ tự thẩm.

"Họ cung cấp Open Source luôn mô hình DeepSeek R1
😃

Đây không phải đột phá kỹ thuật nhưng đột phá về mặt kinh doanh. Khi họ cho open source mô hình DeepSeek R1 thì họ mở ra hẳn một business ecosystem mới xoay quanh mô hình DeepSeek mà họ cung cấp, mọi người có thể tải mô hình về, mua card hay thuê card từ Nvidia để chạy AI DeepSeek. DeepSeek sẽ không phải tốn chi phí vận hành hạ tầng khổng lồ để cung cấp API cho mọi người như các mô hình đóng như OpenAI, Google hay Anthropic.
NHƯNG nếu bạn muốn chỉnh sửa mô hình DeepSeek R1 hoặc sao chép nó thì không
😃

DeepSeek không cung cấp chi tiết về cách tạo Dataset - tức dữ liệu huấn luyện nên DeepSeek V3 và R1
DeepSeek không cung cấp chi tiết về thuật toán Group Relative Policy Optimization (GRPO) và các thuật toán liên quan dùng để đánh giá câu trả lời reasoning của AI
Trong ngành AI, dataset và các thuật toán dùng trong quá trình training mới là key turning point.
Không có chúng bạn không thể sao chép hoặc fine-tune mô hình DeepSeek R1 đạt hiệu quả như DeepSeek đang làm.
Soon thôi, DeepSeek sẽ bán các dịch vụ xoay quanh các mô hình Open Source này như fine-tuning…"
 
Thông tin thớt
Đang tải

Bài viết mới

Top