[Funland] Chào mừng DeepSeek R1!

koala2023

Xe buýt
Biển số
OF-830771
Ngày cấp bằng
16/3/23
Số km
611
Động cơ
27,522 Mã lực
Tuổi
40
Cụ cứ stop các search engine xem rồi nó ra sao rồi chém tiếp ạ.Các AI lấy dữ liệu ở đâu. Xin lỗi chứ máy học với máy hành gì cụ. Ko có dữ liệu thì khóc thét.
Cụ cứ làm như nó dốt như cụ ý mà cần Google (hay các SE khác) để lấy data 😆😆😆😆. Data nó có sẵn trên Internet thưa cụ, Google nó giúp cụ tìm kiếm nhanh thông tin cụ cần thôi. Ko có google thì vẫn truy cập data như thường!!!!
 

firstXpan

Xe buýt
Biển số
OF-813757
Ngày cấp bằng
7/6/22
Số km
915
Động cơ
203,606 Mã lực
Cụ lấy ví dụ nực cười, ai có thể stop các SE cho cụ xem được?

Data của các SE cũng từ crawl các trang web mà có, các công ty AI chẳng lẽ nó không biết crawl về chắc?
Nó biết nhưng nó crawl ko tối ưu và ko nhanh bằng thằng cha đẻ của nó là gg search. Vì sao gg search vẫn bá đạo thế giới, trong khi nước ta cũng đẻ ra nhiều công cụ seach như cốc cốc đó.Và vì thế khi động đến search hay dữ liệu thì tội gì ko sử dụng sẵn mấy ông đã có như gg search làm đầu vào.Cũng giống như cụ sx eto thôi, cụ có đi từ luyện kim ốc vít rồi chip chiếc ko, hay cụ dùng những thứ có sẵn.
 

firstXpan

Xe buýt
Biển số
OF-813757
Ngày cấp bằng
7/6/22
Số km
915
Động cơ
203,606 Mã lực
Cụ cứ làm như nó dốt như cụ ý mà cần Google (hay các SE khác) để lấy data 😆😆😆😆. Data nó có sẵn trên Internet thưa cụ, Google nó giúp cụ tìm kiếm nhanh thông tin cụ cần thôi. Ko có google thì vẫn truy cập data như thường!!!!
Mời cụ đọc tiếp còm dưới
 

langtoilangtoi

Xe điện
Biển số
OF-520012
Ngày cấp bằng
6/7/17
Số km
3,932
Động cơ
72,122 Mã lực
Tuổi
48
Cụ chém lung tung quá.

DS, ChatGPT hay các mô hình AI hiện nay khác hoàn toàn search engine (SE), nó cũng chả phụ thuộc SE nào cả. Cái giống nhau với SE có chăng là nó cùng lấy data từ các trang web trên internet thôi, thông qua các công cụ crawling.

DS hay ChatGPT có thể dùng model tương tự nhau nhưng chi tiết triển khai có thể dẫn đến kết quả khác nhau xa. Cái model chung thì search open source thì ra đầy chứ có gì bí mật đâu.

Với các hệ thống AI thì ngoài model còn có một phần rất khó và tốn kém nữa là đào tạo (training). Bước này có thể rút ngắn đi nhiều nếu biết "học hỏi" từ các mô hình sẵn có, người ta đang nghi ngờ DS ở chính bước này, có thể DS đã học hỏi ít nhiều từ OpenAI. Tất nhiên việc học hỏi nhau là bình thường, vấn đề là "học hỏi" đến mức nào thì mới bị coi là vi phạm bản quyền. Nói chung trong kỹ thuật học hỏi nhau là phổ biến và bắt buộc nhưng đâu có dễ thế, đến sản phẩm đóng gói sờ sờ ra như ô tô, điện thoại mà còn đâu có dễ bắt chước chất lượng của nhau huống chi là cái sản phẩm chỉ dùng trên web, chỉ được xem kết quả chứ có lôi về chạy đâu mà copy được.
Chính xác cụ. Tuy nhiên chỗ model của cụ hơi rối tí. Model là kết quả của training, nó đc coi như kiến thức của AI. Mỹ cũng đang điều tra xem Deepseek có dùng cạc Nvidia bị cấm xuất chp TQ để training ko.
Training là khâu tốn kém nhất vì nó phải đảm bảo độ chính xác mong muốn và dữ liệu chuẩn khóa khổng lồ.
 

koala2023

Xe buýt
Biển số
OF-830771
Ngày cấp bằng
16/3/23
Số km
611
Động cơ
27,522 Mã lực
Tuổi
40
Nó biết nhưng nó crawl ko tối ưu và ko nhanh bằng thằng cha đẻ của nó là gg search. Vì sao gg search vẫn bá đạo thế giới, trong khi nước ta cũng đẻ ra nhiều công cụ seach như cốc cốc đó.Và vì thế khi động đến search hay dữ liệu thì tội gì ko sử dụng sẵn mấy ông đã có như gg search làm đầu vào.Cũng giống như cụ sx eto thôi, cụ có đi từ luyện kim ốc vít rồi chip chiếc ko, hay cụ dùng những thứ có sẵn.
Cụ đừng luyên thuyên chống chế vớ vẩn nữa đi. Theo ý cụ ban đầu thì là google cấm DS thì DS chết, nhưng em khẳng định là DS ko chết vì nó tự crawl data được mà ko cần dùng google crawling API!!!
 

XSim

Xe container
Biển số
OF-698009
Ngày cấp bằng
8/9/19
Số km
9,758
Động cơ
883,507 Mã lực
Chính xác cụ. Tuy nhiên chỗ model của cụ hơi rối tí. Model là kết quả của training, nó đc coi như kiến thức của AI. Mỹ cũng đang điều tra xem Deepseek có dùng cạc Nvidia bị cấm xuất chp TQ để training ko.
Training là khâu tốn kém nhất vì nó phải đảm bảo độ chính xác mong muốn và dữ liệu chuẩn khóa khổng lồ.
Hiểu nôm na là model là thuật toán, là kiến trúc tư duy của AI, có thể là một neural network đơn giản hay một deep neural network hay một LLM gì đó, đại khái thế.

Còn kiến thức là các weights được tính ra sau khi training model trên một tập dữ liệu.

Cơ bản thì model có thể na ná nhau, dữ liệu đều là public cũng như nhau nhưng mỗi công ty lại có rất nhiều bí quyết nhỏ trong việc tối ưu model lẫn quá trình training.

Việc DS có dùng chip NVIDIA bị cấm không thì chắc chả quan trọng lắm, không chạy ở TQ thì DS có thể chạy nhờ cloud của đối tác bên Mỹ để train cũng được mà. Giờ nó train xong rồi mới đi tìm xem nó có dùng data hay chip cấm không thì cũng giống như gặp thằng giỏi quá không thắng được nên đi điều tra xem nó có đọc sách lậu không mà giỏi thế :))
 
Chỉnh sửa cuối:

XSim

Xe container
Biển số
OF-698009
Ngày cấp bằng
8/9/19
Số km
9,758
Động cơ
883,507 Mã lực
Nó biết nhưng nó crawl ko tối ưu và ko nhanh bằng thằng cha đẻ của nó là gg search. Vì sao gg search vẫn bá đạo thế giới, trong khi nước ta cũng đẻ ra nhiều công cụ seach như cốc cốc đó.Và vì thế khi động đến search hay dữ liệu thì tội gì ko sử dụng sẵn mấy ông đã có như gg search làm đầu vào.Cũng giống như cụ sx eto thôi, cụ có đi từ luyện kim ốc vít rồi chip chiếc ko, hay cụ dùng những thứ có sẵn.
Thế gg nó cho các cty AI mượn data của nó để train hay cho mượn công cụ để crawl web à?
 

404

Đi bộ
Biển số
OF-342784
Ngày cấp bằng
14/11/14
Số km
1
Động cơ
272,327 Mã lực
Em thấy người ta dùng nó để code hay giải toán chẳng hạn (2 món này thì AI là trùm), ví dụ em có cái đề toán lớp 12 như sau:
ds.png

Em lấy tấm hình đó send lên cho DS và nói nó giải toán, sau 1 hồi giải thích từ A tới Z các thứ, nó sẽ tóm tắt cho em câu trả lời.
ds2.png
Sai r bác ơi. Khoảng đồng biến, nghịch biến bị sai, khả năng do nó nhầm -2 thành 2
 

firstXpan

Xe buýt
Biển số
OF-813757
Ngày cấp bằng
7/6/22
Số km
915
Động cơ
203,606 Mã lực
Thế gg nó cho các cty AI mượn data của nó để train hay cho mượn công cụ để crawl web à?
Cụ hiểu thế nào cũng được.Theo em là thế này: các cty AI call các API của gg để search ra dữ liệu, sau đó cào trên đống dữ liệu đó. Tiếp đó training, máy học gì gì đó, tập hợp lại, đưa ra đáp án cho mềm dẻo nhất, thằng nào mềm dẻo và dễ thương nhất sẽ có nhiều người iu.Em hiểu đơn giản vậy, cụ có cách hiểu khác thì cứ mở mang rồi ta lại bàn tiếp.
 

tratida2019

Xe buýt
Biển số
OF-826714
Ngày cấp bằng
21/2/23
Số km
526
Động cơ
5,166 Mã lực
Tuổi
43
Cụ chuẩn ạ. Thằng google nó cấm tiệt không cho tìm kiếm thì thằng DeepSeek ăn cám ngay.

Mà bọn Mỹ với châu Âu đã chơi trò bẩn rồi đấy, cấm nhân viên của họ dùng DeepSeek, có nơi chặn luôn :D
Thế thằng nào cho google dữ kiện :)). Ko có google thì có bing, có các thứ khác.

Sent from Other Universe via OTOFUN
 

Linhmkt

Xe tăng
Biển số
OF-535011
Ngày cấp bằng
1/10/17
Số km
1,083
Động cơ
192,058 Mã lực
Tuổi
38
AI là để tăng năng suất lao động, nên em cứ tà tà đợi hết sóng truyền thông, xem con nào ổn định phù hợp với cv thì dùng. Còn đem mấy con AI ra hỏi về fact chính trị xã hội thì có khác gì làm luận văn mà trích dẫn wikipedia.
Em đam mê viết lách, từ giờ em sẽ kiếm con AI viết cùng em :D ý tưởng em có nhiều rồi , tất nhien yêu cầu của em đơn giản nên cứ rẻ mà dùng, để đảm bảo tính độc nhất em sẽ thêm chữ ký riêng của em ở khâu cuối cùng.
Cụ bảo đợi, đợi đến bao giờ, rồi nó cũng ra thêm vài chục đởi nữa như Iphone mà thôi, chứ em thấy dân IT họ ném cả dự án cho AI rồi đấy. Cụ thử hỏi deepseek hay GPT xem có nên đợi không :P xem cháu nó trả lời thế nào
 

losedow

Xe tải
Biển số
OF-822088
Ngày cấp bằng
6/11/22
Số km
468
Động cơ
762,681 Mã lực
Cụ hiểu thế nào cũng được.Theo em là thế này: các cty AI call các API của gg để search ra dữ liệu, sau đó cào trên đống dữ liệu đó. Tiếp đó training, máy học gì gì đó, tập hợp lại, đưa ra đáp án cho mềm dẻo nhất, thằng nào mềm dẻo và dễ thương nhất sẽ có nhiều người iu.Em hiểu đơn giản vậy, cụ có cách hiểu khác thì cứ mở mang rồi ta lại bàn tiếp.
Có vẻ cụ vẫn cho rằng mấy con ai bot này nó là một dạng máy tìm kiếm nhỉ. Chắc cụ dùng nó chủ yếu để hỏi hôm nay là ngày mấy, với tổng thống mỹ hiện tại là ai.
 

songoku2204

Xe buýt
Biển số
OF-825258
Ngày cấp bằng
17/1/23
Số km
704
Động cơ
601,616 Mã lực
Nơi ở
Bắc Kạn
Có vẻ cụ vẫn cho rằng mấy con ai bot này nó là một dạng máy tìm kiếm nhỉ. Chắc cụ dùng nó chủ yếu để hỏi hôm nay là ngày mấy, với tổng thống mỹ hiện tại là ai.
"Trí tuệ nhân tạo (AI – Artificial Intelligence) là một lĩnh vực của khoa học máy tính tập trung vào việc tạo ra các hệ thống, chương trình hoặc máy móc có khả năng thực hiện các nhiệm vụ mà thông thường đòi hỏi trí thông minh của con người. Các hệ thống này có thể được thiết kế để học hỏi, suy nghĩ, phân tích, ra quyết định, nhận diện mẫu, hiểu ngôn ngữ tự nhiên, hoặc thậm chí tương tác một cách sáng tạo." Như vậy AI không phải máy tìm kiếm.
 

Leu leu

Xe điện
Biển số
OF-34470
Ngày cấp bằng
2/5/09
Số km
2,313
Động cơ
528,870 Mã lực
Thằng DS này nó tìm kiếm thượng hạng đấy.
Em copy paste câu hỏi: Tìm kiếm bài hát không lời trình diễn bởi 2 đứa bé (1 nam 1 nữ) mà chỉ hát "ah".

Chỉ có thằng DS kiếm ra, còn 2 thằng Grok, Gemini bó tay.
 

Vinsa35

Xe tải
Biển số
OF-857902
Ngày cấp bằng
24/4/24
Số km
381
Động cơ
13,927 Mã lực
Trung quốc thì giỏi rồi, nhưng cuối cùng xem thằng nào chiến thắng trong cuộc đua này.
Nhìn Tiktok là biết, có thực lực thì sẽ phát triển dc ngay
 

XSim

Xe container
Biển số
OF-698009
Ngày cấp bằng
8/9/19
Số km
9,758
Động cơ
883,507 Mã lực
Sai r bác ơi. Khoảng đồng biến, nghịch biến bị sai, khả năng do nó nhầm -2 thành 2
Đọc cụ em mới biết nó bị sai cơ bản đồng biến nghịch biến, dù nhìn qua thì tưởng nó biết giải :D

Thế nên các cụ dùng AI vào công việc thực tế phải hết sức cẩn thận, nhất là một quyết định sai lầm có thể dẫn đến cháy nhà phá sản luôn.
 

doctor76

Xe ngựa
Người OF
Biển số
OF-81790
Ngày cấp bằng
3/1/11
Số km
26,276
Động cơ
702,660 Mã lực
Nơi ở
Sơn La
Deepseek hiện thường xuyên quá tải không phản hồi do quá nhiều người đặt câu hỏi, và Chat GPT xem ra cũng bắt đầu rút kinh nghiệm-bắt chước DS rồi.
 

firstXpan

Xe buýt
Biển số
OF-813757
Ngày cấp bằng
7/6/22
Số km
915
Động cơ
203,606 Mã lực
Có vẻ cụ vẫn cho rằng mấy con ai bot này nó là một dạng máy tìm kiếm nhỉ. Chắc cụ dùng nó chủ yếu để hỏi hôm nay là ngày mấy, với tổng thống mỹ hiện tại là ai.
Oh.Thế e đang tưởng thớt bàn về máy móc làm thơ, văn, trả lời content biển đảo, chính trị trong đó dính dáng tẹo đến AI thôi.Vậy hóa ra bàn rộng hơn và toàn bộ tất cả các lĩnh vực có dính đến AI à, thế thì theo em nên mở thớt khác ạ.
 

Driverto

Xe tải
Biển số
OF-777926
Ngày cấp bằng
20/5/21
Số km
206
Động cơ
38,494 Mã lực
Em vừa hỏi deepseek về chủ quyền của Hoàng Sa và đường 9 đoạn. Câu trả lời làm em lo lắng hơn về người TQ.
 
Thông tin thớt
Đang tải

Bài viết mới

Top