[Funland] Chào mừng DeepSeek R1!

congthuong

Xe điện
Biển số
OF-387066
Ngày cấp bằng
14/10/15
Số km
2,855
Động cơ
282,965 Mã lực
Bản chất của việc Deepseek bị lag là giá nó đang bán API là giá lỗ. Người dùng đông lên nó cháy cmn nó túi không có tiền để đốt tiếp. Mà cũng chưa có nhà đầu tư nào tin tưởng bơm tiền cho nó đốt. Nên cụ nào vẫn thích dùng Deepseek R1 mà không bị lag thì chỉ có dùng qua mấy thằng Mỹ nó đang host thôi (ví dụ Perplexity). Perplexity chuyến này lại kiếm đẫm vì chạy R1 vẫn rẻ hơn chạy o1. Mà giá của Perplexity nó thu đến $15/M tokens xài còn đốt tiền hơn mua ChatGPTplus.
Mà vẫn phải chấp nhận con R1 chạy qua host Mỹ thì ngu hơn chạy chính chủ trên web của Deepseek nhé. Vì mã nguồn mở, không độc quyền nên không thằng nào đầu tư tinh chỉnh tiếp. Có thế nào thì nó bào thế thôi.
Tự tải nó về chạy local được mà cụ.
 

3005

Xe tăng
Biển số
OF-425991
Ngày cấp bằng
30/5/16
Số km
1,550
Động cơ
312,810 Mã lực
Tuổi
40
Tự tải nó về chạy local được mà cụ.
Cụ tải về mà chạy. Chạy được bản R1 full thì phải 1 cái máy 16 con card A100, giẻ rách cũng tốn cho cái máy khoảng 6 tỷ mới chạy nổi cho 1 người dùng.
Còn nếu dùng máy lởm 60-70 triệu thì phải chấp nhận dùng bản rút gọn chạy ngu hơn con bò hoặc chạy bản full nhưng với tốc độ 60-120 phút ra 1 câu trả lời.
 
Chỉnh sửa cuối:

Dân miền núi TM

Xe điện
Biển số
OF-755060
Ngày cấp bằng
29/12/20
Số km
2,513
Động cơ
1,836,495 Mã lực
Các cụ đã đủ thông tin để đánh giá con AI Tàu như này chưa?
1000034121.jpg
 

congthuong

Xe điện
Biển số
OF-387066
Ngày cấp bằng
14/10/15
Số km
2,855
Động cơ
282,965 Mã lực
Cụ tải về mà chạy. Chạy được bản R1 full thì phải 1 cái máy 16 con card A100, giẻ rách cũng tốn cho cái máy khoảng 6 tỷ mới chạy nổi cho 1 người dùng.
Còn nếu dùng máy lởm 60-70 triệu thì phải chấp nhận dùng bản rút gọn chạy ngu hơn con bò hoặc chạy bản full nhưng với tốc độ 60-120 phút ra 1 câu trả lời.
Thấy bảo không tới mức đó đâu cụ.


Để vài bữa rảnh em thử dựng lên xem sao.
 

3005

Xe tăng
Biển số
OF-425991
Ngày cấp bằng
30/5/16
Số km
1,550
Động cơ
312,810 Mã lực
Tuổi
40
Thấy bảo không tới mức đó đâu cụ.


Để vài bữa rảnh em thử dựng lên xem sao.
Bài của cụ dẫn chính là kiểu chạy khổ dâm với máy ghẻ mà em nói đấy. Chạy bằng SSD để thay RAM. Nhả 1 câu trả lời dài 8000 token mất 120 phút. Vừa khổ dâm vừa nhanh hỏng máy. Chạy kiểu này vừa chậm vừa lag tung đít. Đây là chạy kiểu nghịch ngợm thôi chứ không có giá trị thực tiễn.
 

phohien035

Xe buýt
Biển số
OF-773528
Ngày cấp bằng
6/4/21
Số km
941
Động cơ
66,651 Mã lực
Tuổi
36
Các cụ cho em hỏi ngu ngơ 1 chút: Kể cả Chat GPT, hay DeepSeek hoặc bất kỳ con AI của ông nào ra đời thì dữ liệu nó lấy ở đâu ra mà nhiều như vậy ? Liệu các dữ liệu đó nó dùng thuật toán thế nào để loại bớt cái linh tinh ko có ý nghĩa, có phải xin phép các nơi cung cấp nguồn DL không ? Sau khi có dữ liệu (được lọc rồi) thì nó huấn luyện máy thế nào để khi có người hỏi bất cứ vấn đề gì là nó trả lời ngay tắp lự (chưa nói đến KQ trả lời có chính xác hay không) ?
 

.Bo My

Xe lăn
Biển số
OF-795404
Ngày cấp bằng
1/11/21
Số km
11,351
Động cơ
316,929 Mã lực
Liệu các dữ liệu đó nó dùng thuật toán thế nào để loại bớt cái linh tinh ko có ý nghĩa, có phải xin phép các nơi cung cấp nguồn DL không ? Sau khi có dữ liệu (được lọc rồi) thì nó huấn luyện máy thế nào để khi có người hỏi bất cứ vấn đề gì là nó trả lời ngay tắp lự (chưa nói đến KQ trả lời có chính xác hay không) ?
Cứ đánh dấu nguồn, ví dụ đây là website viện hàn lâm, cho điểm cao. Không xin phép đâu vì nó không trình bày rõ ràng là nó copy. Hiện có 1 số website báo chí đòi Google trả tiền thôi.
Việc đào tạo là bí quyết mà.
 

XSim

Xe container
Biển số
OF-698009
Ngày cấp bằng
8/9/19
Số km
9,931
Động cơ
909,338 Mã lực
Các cụ cho em hỏi ngu ngơ 1 chút: Kể cả Chat GPT, hay DeepSeek hoặc bất kỳ con AI của ông nào ra đời thì dữ liệu nó lấy ở đâu ra mà nhiều như vậy ? Liệu các dữ liệu đó nó dùng thuật toán thế nào để loại bớt cái linh tinh ko có ý nghĩa, có phải xin phép các nơi cung cấp nguồn DL không ? Sau khi có dữ liệu (được lọc rồi) thì nó huấn luyện máy thế nào để khi có người hỏi bất cứ vấn đề gì là nó trả lời ngay tắp lự (chưa nói đến KQ trả lời có chính xác hay không) ?
Về dữ liệu nguồn, với kiến thức phổ thông thì vào các trang miễn phí như wikipedia là có gần hết, thêm vài trang tin tức public nữa là cơ bản đủ để trả lời hầu hết các câu hỏi cần dữ liệu cập nhật. Đấy là về lý thuyết để trả lời trước tòa cho nó thuyết phục, còn thực tế chắc các công ty AI cũng phải đọc lậu khá nhiều :D
 

songoku2204

Xe buýt
Biển số
OF-825258
Ngày cấp bằng
17/1/23
Số km
900
Động cơ
633,467 Mã lực
Nơi ở
Bắc Kạn
Về dữ liệu nguồn, với kiến thức phổ thông thì vào các trang miễn phí như wikipedia là có gần hết, thêm vài trang tin tức public nữa là cơ bản đủ để trả lời hầu hết các câu hỏi cần dữ liệu cập nhật. Đấy là về lý thuyết để trả lời trước tòa cho nó thuyết phục, còn thực tế chắc các công ty AI cũng phải đọc lậu khá nhiều :D
và nói thêm với tòa là tôi thông minh nên sẽ tự nội suy được nhiều vấn đề :))
 

langtoilangtoi

Xe điện
Biển số
OF-520012
Ngày cấp bằng
6/7/17
Số km
4,338
Động cơ
98,415 Mã lực
Tuổi
49
Các cụ cho em hỏi ngu ngơ 1 chút: Kể cả Chat GPT, hay DeepSeek hoặc bất kỳ con AI của ông nào ra đời thì dữ liệu nó lấy ở đâu ra mà nhiều như vậy ? Liệu các dữ liệu đó nó dùng thuật toán thế nào để loại bớt cái linh tinh ko có ý nghĩa, có phải xin phép các nơi cung cấp nguồn DL không ? Sau khi có dữ liệu (được lọc rồi) thì nó huấn luyện máy thế nào để khi có người hỏi bất cứ vấn đề gì là nó trả lời ngay tắp lự (chưa nói đến KQ trả lời có chính xác hay không) ?
Phương pháp nó lấy dữ liệu thô thì tương tự SE (Gọi là Crawl - cào dữ liệu). Còn việc loại bỏ các linh tinh đi thì là công việc bắt buộc rồi cụ - Cái này dựa trên Định luật Zipf (Ông Zipf đưa ra vào năm 1949, cũng khá lâu rồi). Nó là 1 trong những khâu của chuẩn hóa dữ liệu. Dữ liệu chuẩn hóa sẽ đưa vào training. Dữ liệu càng sạch thì độ chính xác càng cao.
Sau khi training xong kết quả là 1 model và được test thử để hiệu chỉnh, cứ lặp đi lặp lại như vậy....
Còn việc xin phép nơi cung cấp nguồn em cũng ko rõ dư lào

Túm lại AI là món khó và dài loằng ngoằng vì rất nhiều thuật toán, phương pháp xử lý số liệu...
 

ttvnol.com

Xe tăng
Biển số
OF-323241
Ngày cấp bằng
11/6/14
Số km
1,787
Động cơ
324,169 Mã lực
Bản chất của việc Deepseek bị lag là giá nó đang bán API là giá lỗ. Người dùng đông lên nó cháy cmn nó túi không có tiền để đốt tiếp. Mà cũng chưa có nhà đầu tư nào tin tưởng bơm tiền cho nó đốt. Nên cụ nào vẫn thích dùng Deepseek R1 mà không bị lag thì chỉ có dùng qua mấy thằng Mỹ nó đang host thôi (ví dụ Perplexity). Perplexity chuyến này lại kiếm đẫm vì chạy R1 vẫn rẻ hơn chạy o1. Mà giá của Perplexity nó thu đến $15/M tokens xài còn đốt tiền hơn mua ChatGPTplus.
Mà vẫn phải chấp nhận con R1 chạy qua host Mỹ thì ngu hơn chạy chính chủ trên web của Deepseek nhé. Vì mã nguồn mở, không độc quyền nên không thằng nào đầu tư tinh chỉnh tiếp. Có thế nào thì nó bào thế thôi.
Mới ra mắt trước tết nên em tin deepseek sẽ còn tiềm năng phát triển . Anyway đúng như cụ nhận xét là con R1 chạy trên host bên US ngu hơn con R1 chạy trên web , em đang phải tìm phương án mua premium để nó đỡ lag .
 

Ac080

Xe điện
Biển số
OF-166991
Ngày cấp bằng
15/11/12
Số km
2,340
Động cơ
927,699 Mã lực
em vấn chưa vào đước đip sic- không hiểu tại sao- Lúc nào cũng nhận được thông báo đang bảo trì??
 

langtoilangtoi

Xe điện
Biển số
OF-520012
Ngày cấp bằng
6/7/17
Số km
4,338
Động cơ
98,415 Mã lực
Tuổi
49

ttvnol.com

Xe tăng
Biển số
OF-323241
Ngày cấp bằng
11/6/14
Số km
1,787
Động cơ
324,169 Mã lực
Cụ nào đang xài bản R1 trả phí cho em xin ít thông tin với . Em chịu không xài nổi bản free .
 

Chuột bạch

Xe container
Biển số
OF-26176
Ngày cấp bằng
21/12/08
Số km
6,363
Động cơ
1,188,804 Mã lực
Có vẻ DS trả lời dễ hiểu hơn

1738720382986.png
 

poiuy

Xe ba gác
Biển số
OF-198769
Ngày cấp bằng
17/6/13
Số km
23,815
Động cơ
697,244 Mã lực
View attachment 8959874

E vừa thử thì ChatGPT sai, còn Gemini cho kết quả đúng như trên.
Sao nó vẫn sai được nhỉ? Hồi trước đã có cụ chỉ ra là nó sai nên nó tự nhận rồi. Nhưng giờ khi người khác hỏi nó lại sai tiếp, chẳng lẽ nó không nhận thức được cũng 1 vấn đề mà nhiều người hỏi khác nhau hay sao?
 

XSim

Xe container
Biển số
OF-698009
Ngày cấp bằng
8/9/19
Số km
9,931
Động cơ
909,338 Mã lực
Sao nó vẫn sai được nhỉ? Hồi trước đã có cụ chỉ ra là nó sai nên nó tự nhận rồi. Nhưng giờ khi người khác hỏi nó lại sai tiếp, chẳng lẽ nó không nhận thức được cũng 1 vấn đề mà nhiều người hỏi khác nhau hay sao?
Cái này là đặc điểm của mô hình kiến trúc LLM (hay tương tự) mà các con AI này được tạo ra, bản chất của các mô hình LLM này là từ một tiêu đề ban đầu nó cứ thế sinh ra tiếp đoạn văn bản tiếp theo chứ không hẳn là nó biết tư duy.

Con nào trả lời được 9.9 > 9.11 từ đầu là do nó được train trên dữ liệu mà có đa số theo hướng đó, con nào trả lời sai do nó được train bằng dữ liệu có xu thế ngược lại. Hoặc công ty AI phát triển phải cài thêm các plug-in để nó giải riêng cho các bài toàn kiểu này.
 
Thông tin thớt
Đang tải

Bài viết mới

Top