[Funland] Chào mừng DeepSeek R1!

3005

Xe tăng
Biển số
OF-425991
Ngày cấp bằng
30/5/16
Số km
1,549
Động cơ
305,722 Mã lực
Tuổi
40
Cái đột phá của deep seek là tìm ra cách training tiết kiệm chi phí thôi chứ ko phải là tốt nhất và đặc biệt là opensource , mọi người trên thế giới có thể lấy về và phát triển 1 cách dễ dàng . Thực tế là deep seek chỉ là 1 lab nhỏ với thành viên mới ra trường và chi phí đầu tư rất thấp nên có nhiều sai sót . Tuy nhiên nó lại viral, và cp của mấy thằng như Nvidia vẫn giảm ko phải là fud để gom hàng
Em vẫn cho là bơm tin bẩn để gom hàng thôi. Em không vào được cổ Mỹ nhưng cũng sẵn tay nhận cược kèo nvda trong vòng 1 tháng tới hồi trên 135. Như em đã nói, con r1 tuy open nhưng chi phí triển khai cho doanh nghiệp nhỏ rất đắt đỏ và hiệu quả kinh tế không cao. Vì vậy chỉ có các tay chơi lớn như aws đủ nguồn lực triển khai và bán dịch vụ cloud cho khách có nhu cầu. Và như thế thì lại thành bình thường, sự đột phá rất hạn chế.
 

Haiau69

Xe buýt
Biển số
OF-593147
Ngày cấp bằng
3/10/18
Số km
717
Động cơ
163,569 Mã lực
Nơi ở
Hà Nội
“Tuần này, các báo cáo phương tiện truyền thông cho rằng OpenAI đang xem xét các khiếu nại rằng DeepSeek đã đào tạo mô hình của mình bằng cách sử dụng kết quả từ các mô hình OpenAI. (OpenAI đang bị các tổ chức tin tức kiện vì vi phạm quyền sở hữu trí tuệ). DeepSeek vẫn chưa phản hồi các khiếu nại. Ngay cả khi đúng, điều đó cũng "không làm giảm" thành tựu của DeepSeek trong việc tạo ra R1, Lewis Tunstall, một nhà nghiên cứu tại nền tảng khoa học mở Hugging Face có trụ sở tại Bern, Thụy Sĩ, cho biết. Ông cho biết bước tiến của họ là sử dụng phương pháp học tập để truyền khả năng "lý luận" vào LLM, mà các thí nghiệm đã tái tạo được. Hugging Face đang dẫn đầu một dự án nhằm cố gắng tái tạo R1 từ đầu. Ông nói rằng "Tôi hy vọng chúng ta sẽ nhanh chóng biết được liệu dữ liệu tổng hợp từ OpenAI có thực sự cần thiết hay không".” Theo tạp chí khoa học Nature
 

hoviethung

Xe lăn
Biển số
OF-98736
Ngày cấp bằng
5/6/11
Số km
12,407
Động cơ
533,695 Mã lực
Tuỳ theo định nghĩa thế nào là AI cho riêng mình cụ ạ. Lấy mã nguồn của mấy con mã nguồn mở rồi cải biên đi cũng được mà.

Em thấy một số công ty nhỏ nhỏ cũng đã có app AI riêng rồi nhưng họ thường mua license về rồi nạp dữ liệu của mình vào thôi. Ví dụ nạp hết dữ liệu về luật Việt Nam vào là có con AI chuyên về luật. Hỏi là nó trả lời vanh vách từng điều khoản.

Vinbrain nghe nói cũng làm một con chuyên về chuẩn đoán hình ảnh rồi thì phải.
Làm vậy cũng quá ngon rồi.
 

hoviethung

Xe lăn
Biển số
OF-98736
Ngày cấp bằng
5/6/11
Số km
12,407
Động cơ
533,695 Mã lực
Chủ đề 18 hình như bị kiểm duyệt, em hỏi deepseek cô giáo thảo là ai nó trả lời lung tung, em thêm vào truyện cô giáo thảo 18+ nó rẹp:
Tôi không thể cung cấp thông tin hoặc nội dung liên quan đến các tài liệu 18+. Nếu bạn có bất kỳ câu hỏi hoặc yêu cầu nào khác, tôi rất sẵn lòng hỗ trợ bạn!
Vậy nên chắc k phải tụi AI ngu mà vì tụi nó sợ bị kiện những chủ đề nhạy cảm nên lọc ra chăng
Cụ nói đúng. Qua cách phản hồi thì nó biết cả. Chỉ có điều sợ gặp rắc rối về pháp lý, văn hoá nên nó không trả lời thôi.
 

.Bo My

Xe lăn
Biển số
OF-795404
Ngày cấp bằng
1/11/21
Số km
10,834
Động cơ
274,306 Mã lực
Cái đột phá của deep seek là tìm ra cách training tiết kiệm chi phí thôi chứ ko phải là tốt nhất và đặc biệt là opensource , mọi người trên thế giới có thể lấy về và phát triển 1 cách dễ dàng . Thực tế là deep seek chỉ là 1 lab nhỏ với thành viên mới ra trường và chi phí đầu tư rất thấp nên có nhiều sai sót . Tuy nhiên nó lại viral, và cp của mấy thằng như Nvidia vẫn giảm ko phải là fud để gom hàng
Tiết kiệm chi phí là 1 cách để tăng công suất đấy, ví dụ 1 con card AI giá bằng 80 con card game, nhưng mua 80 con card game thì có thể tốc độ gấp 10 lần 1 con card AI kia.

Ngoài ra con R1 biết lý luận, và thể hiện rõ ra nó lý luận như thế nào. Khi dùng Deepseek thử click vào R1 rồi nghiên cứu phần diễn giải lý luận.
 

Vongai

Xe buýt
Biển số
OF-45835
Ngày cấp bằng
8/9/09
Số km
939
Động cơ
1,063,066 Mã lực
https://genk.vn/openai-tuyen-bo-tim-thay-bang-chung-cho-thay-deepseek-dung-mo-hinh-cua-ho-de-dao-tao-ai-20250130152705297.chn Như này thì sớm muộn sẽ có 1 AI siêu thông minh, chả cần phần cứng cao cấp hay thư viện khổng lồ, chỉ cần điều khiển hoặc sử dụng dữ liệu của các AI khác theo ý của mình giống kiểu mô hình người tí hon trên đầu kẻ khổng lồ vậy. Tất nhiên nó sẽ thừa thông minh để lách luật về bản quyền, pháp lý.
Như vậy có một thuật toán kiểu ví dụ sau ko bác nhỉ: Một kẻ có khả năng học hỏi tốt, thay vì tự đi thu lượm, tổng hợp kiến thức thì nó đi hỏi những người có kiến thức tốt, đã được công nhận trước đó, rồi biến nó thành kiến thức của mình.
Như vậy, chỉ cần tạo ra một mô hình AI vừa đủ tốt, có khả năng tự học, rồi học tập, học hỏi lấy dữ liệu, kiến thứ từ các Mô hình AI khác như Open AI, ...vv
Với tốc độ giao tiếp mạng đủ lớn như giờ, khả năng ấy liệu có xảy ra ko nhỉ?
 

detector

Xe tăng
Biển số
OF-318852
Ngày cấp bằng
8/5/14
Số km
1,387
Động cơ
833,409 Mã lực
Website
woodsoft.vn
Team Alibaba mạnh hơn team Deepseek nhiều. Con Qwen của Alibaba hiệu năng tốt, giá rẻ hơn cả Deepseek và khả năng chịu tải cũng như độ ổn định tốt. Con Deepseek từ trước khi viral thì chạy ứng dụng qua API đã chập chờn rồi. Hoặc là hạ tầng phần cứng của team chưa đủ hoặc là đua tốc độ nên bỏ qua nhiều cấu trúc tạo sự ổn định cho ứng dụng. Em nghiêng về phần làm vội nên bỏ qua nhiều phần cơ bản. Ví dụ như phần bảo mật của Deepseek cũng đang có phốt rất lớn. Team đã có 24h im lặng, cơ bản là coi như đã xác nhận phốt.
Con Deepseek R1 thì tải về máy chạy offline thì cần phải 16 con chip A100 mới đủ tải 1 người dùng (~50 tps). Một hệ thống như vậy giá trên 6 tỷ đồng đầu tư và vài triệu đồng tiền điện mỗi ngày mà chỉ phục vụ được 1 người dùng. Với hệ thống rẻ tiền (60-70 triệu đồng) thì chỉ chạy được bản rút gọn bé tí, kết quả đầu ra sánh ngang rác, không sử dụng được. Như vậy tính kinh tế, hiệu quả hoặc khả năng triển khai cho người dùng cá nhân, doanh nghiệp nhỏ là không khả thi như thông tin sai trên truyền thông mấy ngày nay.
Giá Deepseek R1 API trên OR đang là $8 so sánh với giá $15 của mô hình Claude 3.5 Sonnet (đang được đánh giá nhỉnh hơn trong tác vụ có thị trường lớn nhất là code) là một mức giá tốt nhưng không cách mạng. Con thực sự rẻ tiền là con Deepseek v3 thì hiệu năng cũng không quá vượt trội, chỉ nhỉnh hơn con Qwen 2.5 Coder một chút.
Như vậy truyền thông đang nhập nhằng gắn 2 thằng vào 1. Họ cố ý gắn cả ưu điểm giá rẻ của Deepseek v3 và ưu điểm hiệu năng cao của Deepseek R1 vào để tạo ra ảo giác là có một thứ mang đầy đủ đặc điểm "ngon, bổ, rẻ".

Hiện nay về AI của TQ thì team Alibaba (Qwen) và Bytedance (Doubao) là 2 team mạnh có thể đấu các team Mỹ. Các team khác (kể cả team Deepseek, theo em nghĩ) chưa đáng kể. Cái hay và đột phá của Deepseek là họ open model để mọi người tải về. Đây là nước đi rất hay để gây chú ý và gọi vốn. Bởi nếu không có thêm vốn để đua phần cứng thì hệ thống của họ sẽ sớm bị vỡ (như đã thấy hôm nay). Đây là nước đi "đập nồi dìm thuyền" vì các tay to hoặc sẽ bơm tiền đầu tư cho họ, hoặc sẽ bơm tiền để kéo người đi xé nát team.
Em hỏi ngu chút là 1 người dùng sao lại cần đến 50 tps (transactions per second) nhỉ?
 

.Bo My

Xe lăn
Biển số
OF-795404
Ngày cấp bằng
1/11/21
Số km
10,834
Động cơ
274,306 Mã lực
Em hỏi ngu chút là 1 người dùng sao lại cần đến 50 tps (transactions per second) nhỉ?
Các cty khác đem Deepseek về phục vụ chuyên ngành, ví dụ như Deepseek cty luật, Deepseek môi trường, Deepseek điện hạt nhân... Các cháu học sinh đem về làm Deepseek Tiểu học. Ví dụ trả lời trường ta ai học giỏi nhất, xinh nhất... cái này thì cty lớn cũng bó tay.
 

songoku2204

Xe buýt
Biển số
OF-825258
Ngày cấp bằng
17/1/23
Số km
595
Động cơ
572,297 Mã lực
Nơi ở
Bắc Kạn
Tóm lại hay bắt lại thì AI giờ cũng chỉ như thư viện tổng hợp kiến thức của loài người thôi. Viễn cảnh Skynet vẫn là quá xa vời, chưa thể có khả năng vận hành độc lập
 

formen

Xe lăn
Biển số
OF-485699
Ngày cấp bằng
27/1/17
Số km
13,605
Động cơ
366,245 Mã lực
Tóm lại hay bắt lại thì AI giờ cũng chỉ như thư viện tổng hợp kiến thức của loài người thôi. Viễn cảnh Skynet vẫn là quá xa vời, chưa thể có khả năng vận hành độc lập
Mấy ông khoa học ai thử con có nhiệm vụ sinh tồn, tự nhân bản r đó cụ - tất nhiên trong tầm kiểm soát, bỏn nhân bản sinh tồn trên mạng cái rẹt đó cụ. Nếu đúng thả nó ra môi trường internet thế giới thì nó k bao giờ tạch luôn đó ợ.
 

intl

Xe tải
Biển số
OF-321902
Ngày cấp bằng
2/6/14
Số km
475
Động cơ
372,936 Mã lực
Có suy luận rồi chứ không chỉ là tổng hợp kiến thức. Với đà này thì cỡ thế kỷ 22 ra được Doraemon thật.

Tóm lại hay bắt lại thì AI giờ cũng chỉ như thư viện tổng hợp kiến thức của loài người thôi. Viễn cảnh Skynet vẫn là quá xa vời, chưa thể có khả năng vận hành độc lập
 

Jamebonds

Xe container
Biển số
OF-19789
Ngày cấp bằng
11/8/08
Số km
9,683
Động cơ
564,409 Mã lực
Cụ tin vào mấy cái báo lá cải đấy để cười người à? Cụ có phải dân công nghệ ko thế?
E nghĩ ít nhất họ cũng hơn các cụ và e ở đây😅
 
Thông tin thớt
Đang tải

Bài viết mới

Top