[Funland] Chào mừng DeepSeek R1!

3005

Xe tăng
Biển số
OF-425991
Ngày cấp bằng
30/5/16
Số km
1,550
Động cơ
312,810 Mã lực
Tuổi
40
Cái đột phá của deep seek là tìm ra cách training tiết kiệm chi phí thôi chứ ko phải là tốt nhất và đặc biệt là opensource , mọi người trên thế giới có thể lấy về và phát triển 1 cách dễ dàng . Thực tế là deep seek chỉ là 1 lab nhỏ với thành viên mới ra trường và chi phí đầu tư rất thấp nên có nhiều sai sót . Tuy nhiên nó lại viral, và cp của mấy thằng như Nvidia vẫn giảm ko phải là fud để gom hàng
Em vẫn cho là bơm tin bẩn để gom hàng thôi. Em không vào được cổ Mỹ nhưng cũng sẵn tay nhận cược kèo nvda trong vòng 1 tháng tới hồi trên 135. Như em đã nói, con r1 tuy open nhưng chi phí triển khai cho doanh nghiệp nhỏ rất đắt đỏ và hiệu quả kinh tế không cao. Vì vậy chỉ có các tay chơi lớn như aws đủ nguồn lực triển khai và bán dịch vụ cloud cho khách có nhu cầu. Và như thế thì lại thành bình thường, sự đột phá rất hạn chế.
 

Haiau69

Xe buýt
Biển số
OF-593147
Ngày cấp bằng
3/10/18
Số km
781
Động cơ
181,410 Mã lực
Nơi ở
Hà Nội
“Tuần này, các báo cáo phương tiện truyền thông cho rằng OpenAI đang xem xét các khiếu nại rằng DeepSeek đã đào tạo mô hình của mình bằng cách sử dụng kết quả từ các mô hình OpenAI. (OpenAI đang bị các tổ chức tin tức kiện vì vi phạm quyền sở hữu trí tuệ). DeepSeek vẫn chưa phản hồi các khiếu nại. Ngay cả khi đúng, điều đó cũng "không làm giảm" thành tựu của DeepSeek trong việc tạo ra R1, Lewis Tunstall, một nhà nghiên cứu tại nền tảng khoa học mở Hugging Face có trụ sở tại Bern, Thụy Sĩ, cho biết. Ông cho biết bước tiến của họ là sử dụng phương pháp học tập để truyền khả năng "lý luận" vào LLM, mà các thí nghiệm đã tái tạo được. Hugging Face đang dẫn đầu một dự án nhằm cố gắng tái tạo R1 từ đầu. Ông nói rằng "Tôi hy vọng chúng ta sẽ nhanh chóng biết được liệu dữ liệu tổng hợp từ OpenAI có thực sự cần thiết hay không".” Theo tạp chí khoa học Nature
 

hoviethung

Xe lăn
Biển số
OF-98736
Ngày cấp bằng
5/6/11
Số km
12,491
Động cơ
552,883 Mã lực
Tuỳ theo định nghĩa thế nào là AI cho riêng mình cụ ạ. Lấy mã nguồn của mấy con mã nguồn mở rồi cải biên đi cũng được mà.

Em thấy một số công ty nhỏ nhỏ cũng đã có app AI riêng rồi nhưng họ thường mua license về rồi nạp dữ liệu của mình vào thôi. Ví dụ nạp hết dữ liệu về luật Việt Nam vào là có con AI chuyên về luật. Hỏi là nó trả lời vanh vách từng điều khoản.

Vinbrain nghe nói cũng làm một con chuyên về chuẩn đoán hình ảnh rồi thì phải.
Làm vậy cũng quá ngon rồi.
 

hoviethung

Xe lăn
Biển số
OF-98736
Ngày cấp bằng
5/6/11
Số km
12,491
Động cơ
552,883 Mã lực
Chủ đề 18 hình như bị kiểm duyệt, em hỏi deepseek cô giáo thảo là ai nó trả lời lung tung, em thêm vào truyện cô giáo thảo 18+ nó rẹp:
Tôi không thể cung cấp thông tin hoặc nội dung liên quan đến các tài liệu 18+. Nếu bạn có bất kỳ câu hỏi hoặc yêu cầu nào khác, tôi rất sẵn lòng hỗ trợ bạn!
Vậy nên chắc k phải tụi AI ngu mà vì tụi nó sợ bị kiện những chủ đề nhạy cảm nên lọc ra chăng
Cụ nói đúng. Qua cách phản hồi thì nó biết cả. Chỉ có điều sợ gặp rắc rối về pháp lý, văn hoá nên nó không trả lời thôi.
 

.Bo My

Xe lăn
Biển số
OF-795404
Ngày cấp bằng
1/11/21
Số km
11,346
Động cơ
316,929 Mã lực
Cái đột phá của deep seek là tìm ra cách training tiết kiệm chi phí thôi chứ ko phải là tốt nhất và đặc biệt là opensource , mọi người trên thế giới có thể lấy về và phát triển 1 cách dễ dàng . Thực tế là deep seek chỉ là 1 lab nhỏ với thành viên mới ra trường và chi phí đầu tư rất thấp nên có nhiều sai sót . Tuy nhiên nó lại viral, và cp của mấy thằng như Nvidia vẫn giảm ko phải là fud để gom hàng
Tiết kiệm chi phí là 1 cách để tăng công suất đấy, ví dụ 1 con card AI giá bằng 80 con card game, nhưng mua 80 con card game thì có thể tốc độ gấp 10 lần 1 con card AI kia.

Ngoài ra con R1 biết lý luận, và thể hiện rõ ra nó lý luận như thế nào. Khi dùng Deepseek thử click vào R1 rồi nghiên cứu phần diễn giải lý luận.
 

Vongai

Xe buýt
Biển số
OF-45835
Ngày cấp bằng
8/9/09
Số km
965
Động cơ
1,046,769 Mã lực
https://genk.vn/openai-tuyen-bo-tim-thay-bang-chung-cho-thay-deepseek-dung-mo-hinh-cua-ho-de-dao-tao-ai-20250130152705297.chn Như này thì sớm muộn sẽ có 1 AI siêu thông minh, chả cần phần cứng cao cấp hay thư viện khổng lồ, chỉ cần điều khiển hoặc sử dụng dữ liệu của các AI khác theo ý của mình giống kiểu mô hình người tí hon trên đầu kẻ khổng lồ vậy. Tất nhiên nó sẽ thừa thông minh để lách luật về bản quyền, pháp lý.
Như vậy có một thuật toán kiểu ví dụ sau ko bác nhỉ: Một kẻ có khả năng học hỏi tốt, thay vì tự đi thu lượm, tổng hợp kiến thức thì nó đi hỏi những người có kiến thức tốt, đã được công nhận trước đó, rồi biến nó thành kiến thức của mình.
Như vậy, chỉ cần tạo ra một mô hình AI vừa đủ tốt, có khả năng tự học, rồi học tập, học hỏi lấy dữ liệu, kiến thứ từ các Mô hình AI khác như Open AI, ...vv
Với tốc độ giao tiếp mạng đủ lớn như giờ, khả năng ấy liệu có xảy ra ko nhỉ?
 

detector

Xe tăng
Biển số
OF-318852
Ngày cấp bằng
8/5/14
Số km
1,400
Động cơ
836,676 Mã lực
Website
woodsoft.vn
Team Alibaba mạnh hơn team Deepseek nhiều. Con Qwen của Alibaba hiệu năng tốt, giá rẻ hơn cả Deepseek và khả năng chịu tải cũng như độ ổn định tốt. Con Deepseek từ trước khi viral thì chạy ứng dụng qua API đã chập chờn rồi. Hoặc là hạ tầng phần cứng của team chưa đủ hoặc là đua tốc độ nên bỏ qua nhiều cấu trúc tạo sự ổn định cho ứng dụng. Em nghiêng về phần làm vội nên bỏ qua nhiều phần cơ bản. Ví dụ như phần bảo mật của Deepseek cũng đang có phốt rất lớn. Team đã có 24h im lặng, cơ bản là coi như đã xác nhận phốt.
Con Deepseek R1 thì tải về máy chạy offline thì cần phải 16 con chip A100 mới đủ tải 1 người dùng (~50 tps). Một hệ thống như vậy giá trên 6 tỷ đồng đầu tư và vài triệu đồng tiền điện mỗi ngày mà chỉ phục vụ được 1 người dùng. Với hệ thống rẻ tiền (60-70 triệu đồng) thì chỉ chạy được bản rút gọn bé tí, kết quả đầu ra sánh ngang rác, không sử dụng được. Như vậy tính kinh tế, hiệu quả hoặc khả năng triển khai cho người dùng cá nhân, doanh nghiệp nhỏ là không khả thi như thông tin sai trên truyền thông mấy ngày nay.
Giá Deepseek R1 API trên OR đang là $8 so sánh với giá $15 của mô hình Claude 3.5 Sonnet (đang được đánh giá nhỉnh hơn trong tác vụ có thị trường lớn nhất là code) là một mức giá tốt nhưng không cách mạng. Con thực sự rẻ tiền là con Deepseek v3 thì hiệu năng cũng không quá vượt trội, chỉ nhỉnh hơn con Qwen 2.5 Coder một chút.
Như vậy truyền thông đang nhập nhằng gắn 2 thằng vào 1. Họ cố ý gắn cả ưu điểm giá rẻ của Deepseek v3 và ưu điểm hiệu năng cao của Deepseek R1 vào để tạo ra ảo giác là có một thứ mang đầy đủ đặc điểm "ngon, bổ, rẻ".

Hiện nay về AI của TQ thì team Alibaba (Qwen) và Bytedance (Doubao) là 2 team mạnh có thể đấu các team Mỹ. Các team khác (kể cả team Deepseek, theo em nghĩ) chưa đáng kể. Cái hay và đột phá của Deepseek là họ open model để mọi người tải về. Đây là nước đi rất hay để gây chú ý và gọi vốn. Bởi nếu không có thêm vốn để đua phần cứng thì hệ thống của họ sẽ sớm bị vỡ (như đã thấy hôm nay). Đây là nước đi "đập nồi dìm thuyền" vì các tay to hoặc sẽ bơm tiền đầu tư cho họ, hoặc sẽ bơm tiền để kéo người đi xé nát team.
Em hỏi ngu chút là 1 người dùng sao lại cần đến 50 tps (transactions per second) nhỉ?
 

.Bo My

Xe lăn
Biển số
OF-795404
Ngày cấp bằng
1/11/21
Số km
11,346
Động cơ
316,929 Mã lực
Em hỏi ngu chút là 1 người dùng sao lại cần đến 50 tps (transactions per second) nhỉ?
Các cty khác đem Deepseek về phục vụ chuyên ngành, ví dụ như Deepseek cty luật, Deepseek môi trường, Deepseek điện hạt nhân... Các cháu học sinh đem về làm Deepseek Tiểu học. Ví dụ trả lời trường ta ai học giỏi nhất, xinh nhất... cái này thì cty lớn cũng bó tay.
 

songoku2204

Xe buýt
Biển số
OF-825258
Ngày cấp bằng
17/1/23
Số km
897
Động cơ
633,400 Mã lực
Nơi ở
Bắc Kạn
Tóm lại hay bắt lại thì AI giờ cũng chỉ như thư viện tổng hợp kiến thức của loài người thôi. Viễn cảnh Skynet vẫn là quá xa vời, chưa thể có khả năng vận hành độc lập
 

formen

Xe lăn
Biển số
OF-485699
Ngày cấp bằng
27/1/17
Số km
14,163
Động cơ
428,135 Mã lực
Tóm lại hay bắt lại thì AI giờ cũng chỉ như thư viện tổng hợp kiến thức của loài người thôi. Viễn cảnh Skynet vẫn là quá xa vời, chưa thể có khả năng vận hành độc lập
Mấy ông khoa học ai thử con có nhiệm vụ sinh tồn, tự nhân bản r đó cụ - tất nhiên trong tầm kiểm soát, bỏn nhân bản sinh tồn trên mạng cái rẹt đó cụ. Nếu đúng thả nó ra môi trường internet thế giới thì nó k bao giờ tạch luôn đó ợ.
 

intl

Xe tải
Biển số
OF-321902
Ngày cấp bằng
2/6/14
Số km
495
Động cơ
373,649 Mã lực
Có suy luận rồi chứ không chỉ là tổng hợp kiến thức. Với đà này thì cỡ thế kỷ 22 ra được Doraemon thật.

Tóm lại hay bắt lại thì AI giờ cũng chỉ như thư viện tổng hợp kiến thức của loài người thôi. Viễn cảnh Skynet vẫn là quá xa vời, chưa thể có khả năng vận hành độc lập
 

Jamebonds

Xe container
Biển số
OF-19789
Ngày cấp bằng
11/8/08
Số km
9,682
Động cơ
564,409 Mã lực
Cụ tin vào mấy cái báo lá cải đấy để cười người à? Cụ có phải dân công nghệ ko thế?
E nghĩ ít nhất họ cũng hơn các cụ và e ở đây😅
 

DIT

Xe điện
Biển số
OF-600754
Ngày cấp bằng
25/11/18
Số km
2,181
Động cơ
188,010 Mã lực
Tuổi
39
E nghĩ ít nhất họ cũng hơn các cụ và e ở đây😅
Chính phủ mỹ đang ra hàng loạt điều tra và lệnh cấm vào thằng deep seek này, tất cả các lab AI trên thế giới đang mổ xẻ chi tiết thằng này thì nó đã chứng tỏ deep seek đã có thành tựu đột phá
 

.Bo My

Xe lăn
Biển số
OF-795404
Ngày cấp bằng
1/11/21
Số km
11,346
Động cơ
316,929 Mã lực
Nói chung nếu Deepseek học được từ ChatGPT, còn ChatGPT không biết cách học được từ Deepseek, thì kết quả lâu dài thễ nào đã rõ.

Ông ChatGPT cũng có phốt rồi, lão SAM từng bị cách chức trong mấy tiếng đồng hồ, không hiểu ai đó can thiệp bổ nhiệm lại. Năm vừa rồi một nửa nhân viên ChatGPT (OpenAI) bỏ việc.
 

cadan

Xe lăn
Biển số
OF-151495
Ngày cấp bằng
3/8/12
Số km
11,301
Động cơ
473,734 Mã lực
em ngoại đạo ngành này nên đi copy thôi ạ:

SO SÁNH NHANH
DEEPSEEK vs OPENAI (ChatGPT)
Tự nhiên mấy hôm nay từ X tới FB đều ngập tràn từ khoá DeepSeek, rồi Nasdaq, BTC dump ae đều đổ cho nó. Bao nhiêu là fud và câu chuyện thêu dệt lên buff chỉ số nó lên. Với ae hay chơi và làm LLM thì chắc không xa lạ với Deepseek rồi, mình cũng từng mention vài lần trên fb. Nhưng với nhiều người mới thì nó như kiểu một magic. Vậy thử facts check xem magic này nó ntn nhé:
1. Deepseek thông minh hơn OpenAI?
❌
Sai ạ, thực tế thì Deepseek vẫn đang chạy theo OpenAI thôi, r1 của Deepseek nó mới chỉ ngang model o1 của OpenAI thôi, trong khi OpenAI đã ra đến o3 theo như claim là tiệm cận agi với việc trả lời đc gần mức của con người với bộ test arc-agi rồi. Vậy sao mọi người thấy nó thông minh hơn, à thì tại ông openAI ông ấy bắt trả tiền, mấy ai chịu trả 20$ 1 tháng để xài o1 hay 200$ 1 tháng để xài o1pro đâu, ae toàn dùng 4o với khả năng reasoning hạn chế, đến lúc đc xài r1 free với khả năng reasoning cao cấp thì tất nhiên sẽ thấy nó thông minh vượt trội rồi.
2. Deepseek rẻ hơn OpenAI nhiều lần?
✅
Chuẩn ạ, rất rẻ, cách đây 1 tháng họ ra Deepseek v3 ngang gpt4o với giá hạt giẻ bằng 1/11 ae đã mắt chữ o mồm chữ a rồi, giờ cho api r1 ngang o1 nhưng giá 1/30 thì đúng là không có gì để chê về trình độ chế tác hàng giá rẻ của các pháp sư Trung Hoa rồi. Thậm chí để cho OpenAI thêm đau họ còn cho người dùng dùng r1 trên web app free luôn. Sợ quá bạn OpenAI phải ra thông báo sẽ free 1 phần o3-mini cho ae (lol mất bò mới lo free).
3. Deepseek sẽ huỷ diệt US tech?
✅
❌
Đúng mà sai ạ, với Nvidia và OpenAI mà nói như kiểu nhà ông Nvidia đang bán mấy cái máy xúc cho mấy ae đi đào vàng, và quảng cáo là máy xúc này chỉ limited thôi. Ông OpenAI dùng mấy cái máy xúc đó đào được 1 đống vàng bán giá trên trời. Thế rồi có ông hàng xóm lại đào được 1 đống vàng tương tự... chỉ bằng vài cái xẻng, ông ấy bán cho giá chỉ 1/30. Vậy 2 ông kia dẹp tiệm là được rồi, ko sai được. Nhưng cả us tech đi tong thì lại không đúng, tầm 6 tháng nữa thôi, mấy đại ca đang chậm chân nuốt nước bọt trong cuộc đua AI như meta, microsoft hay google sẽ copy được methodology của deepseek thôi, mọi thứ đều được public và open-source mà, thậm chí cộng đồng còn đang thử reproduce lại rồi. Đến lúc đó ai làm hiệu quả hơn sẽ thắng, bottom race, users win.
4. Deepseek thay đổi cách nhìn về China tech?
✅
Đúng ạ, nếu bạn đã từng ngạc nhiên về tiktok với thuật toán recommendation gây nghiện của họ thì chắc cũng đã có ít nhiều thiện cảm, nhưng Deepseek r1 nó ở một đẳng cấp khác, trong khi US tech thi nhau giấu model coi như nó như secret sauce để mà bòn tiền của users, thì Deepseek đi sau nhưng lại chơi lớn: open-source luôn, vâng 100% open-source, à tất nhiên data để train cho giống y như r1 sẽ không có (do có mấy đoạn liên quan chính trị đại lục như kiểu Đài Loan, Thiên An Môn) nhưng có thể dùng bất kỳ dataset SFT nào khác. Ngoài open source ra thì họ còn tặng hẳn vài model distill từ model r1 to sang các model bé hơn của qwen hay llama cho ae run local... Đoạn này với 1 người chơi localllm như tôi thì 10 điểm không có nhưng
😍
.
5. Deepseek nói riêng và AI nói chung sẽ xoá sổ dev?
✅
❌
Đúng mà sai ạ, đây là chủ đề không mới, mình cũng từng mention trên fb 1 vài lần. Friendly reminder cho các bạn nhỏ và phụ huynh, làm ơn đừng cho nhóc nhà mình học IT nữa :)) kiếm cái khác mà học đi. o3 và r3 đã không còn xa nữa, với khả năng reasoning thông qua long chain of thought, chúng sẽ biến bất kỳ average engineer nào trở nên không cần thiết nữa (trong tương lai không xa). Nhưng không phải tất cả các dev đều sẽ bị xoá sổ, vì về cơ bản, các model bây giờ đều đc train thông qua các prompt để giải quyết các bài toán, vì thế problem solving của nó rất tốt, nhưng sẽ vẫn cần các bạn dev đủ xuất sắc và có sự hiểu biết về business logic để định hình các vấn đề cho nó giải quyết, cái này AI sẽ không thể thay thế được (ít nhất là trong tương lai gần) vì nó không có cái nhìn toàn cảnh, thế giới quan hay business sense giống như con người. Sau dev sẽ đến lượt các ngành khác, đặc biệt là những công việc có tính lặp đi lặp lại hoặc đòi hỏi ít sáng tạo, chuẩn bị tinh thần đi ạ.
(c) Long Mai
 

z300

Xe điện
Biển số
OF-482877
Ngày cấp bằng
9/1/17
Số km
4,063
Động cơ
257,408 Mã lực
Em thử rồi, nghĩ lâu bỏ mợ! Hỏi cái gì liên quan trung quốc là né tránh. Chắc chắn nếu hỏi về Việt Nam cũng bị né tránh. Nói chung nó độc tài trong cả phần mềm
 
Thông tin thớt
Đang tải
Top