Muốn có con AI chuyên về mảng này cũng không quá khó đâu cụ ơi. Thích cô giáo T với chú K thì nạp vào là có ngay.Em thấy cũng còn hạn chế lắm
![]()
![]()
![]()
![]()
![]()
Muốn có con AI chuyên về mảng này cũng không quá khó đâu cụ ơi. Thích cô giáo T với chú K thì nạp vào là có ngay.Em thấy cũng còn hạn chế lắm
![]()
![]()
![]()
![]()
![]()
Nhúng mã bí mật là vi phạm khủng, tàn đời Nvidia nhé. Còn card thì cần gì đi mua khi Mỹ cho thuê máy để chạy đầy, không nhất thiết phải mang card về TQ mới chạy được.Nếu Nvidia nhúng 1 đoạn lệnh vào trong card của họ để gửi report về máy chủ thì có thể biết được, nếu không thì khó đấy cụ.
Chủ đề 18 hình như bị kiểm duyệt, em hỏi deepseek cô giáo thảo là ai nó trả lời lung tung, em thêm vào truyện cô giáo thảo 18+ nó rẹp:
Tôi không thể cung cấp thông tin hoặc nội dung liên quan đến các tài liệu 18+. Nếu bạn có bất kỳ câu hỏi hoặc yêu cầu nào khác, tôi rất sẵn lòng hỗ trợ bạn!
Vậy nên chắc k phải tụi AI ngu mà vì tụi nó sợ bị kiện những chủ đề nhạy cảm nên lọc ra chăng
Chủ đề 18 hình như bị kiểm duyệt, em hỏi deepseek cô giáo thảo là ai nó trả lời lung tung, em thêm vào truyện cô giáo thảo 18+ nó rẹp:
Tôi không thể cung cấp thông tin hoặc nội dung liên quan đến các tài liệu 18+. Nếu bạn có bất kỳ câu hỏi hoặc yêu cầu nào khác, tôi rất sẵn lòng hỗ trợ bạn!
Vậy nên chắc k phải tụi AI ngu mà vì tụi nó sợ bị kiện những chủ đề nhạy cảm nên lọc ra chăng
Tại sao cụ lại hỏi ai về ai là ai của ai?, thay vì lên gg cho nhanh?Em đã từng hỏi " ai là tác giả bài Chiêu hồn tử sĩ" và Chat GPT trả lời có 2 bài của 2 tác giả. Tức các AI phải thuê đội ngũ đủ các lĩnh vực thơ ca nhạc họa lịch sử ở từng quốc gia để dạy AI. Do đó chi phí phát triển cao ngất ngưỡng.
Còn DeepSeek làm kiểu trộn bê tông nên không tách nổi xi măng cát sỏi nữa. Tức DeepSeek trộn nhiều AI của thiên hạ thành mớ hổ lốn của mình nên giá thành rất rẻ. Cái giỏi của DeepSeek là họ trộn xong thì không ai truy ra bản gốc nữa, giới chuyên môn gọi đây là phương pháp sàng sảy hay rây bột gì đó
Túm váy lại: vì không nghĩ có kiểu chơi bẩn như vậy nên các hãng chưa kịp chống. Chắc chắn sau này họ sẽ gài bẫy bóc trần kiểu khôn lỏi như vậy và DeepSeek sẽ bị cấm
Ối giồi ôiNếu Nvidia nhúng 1 đoạn lệnh vào trong card của họ để gửi report về máy chủ thì có thể biết được, nếu không thì khó đấy cụ.
Nếu ngu đi thì họ thay đổi cách nó hoạt động chứ cụDạ
Giao tiếp theo kiểu hỏi hôm nay là ngày gì thì tôi lại sợ là nó học sẽ bị ngu đi theo thầy dạy ạ
Team Alibaba mạnh hơn team Deepseek nhiều. Con Qwen của Alibaba hiệu năng tốt, giá rẻ hơn cả Deepseek và khả năng chịu tải cũng như độ ổn định tốt. Con Deepseek từ trước khi viral thì chạy ứng dụng qua API đã chập chờn rồi. Hoặc là hạ tầng phần cứng của team chưa đủ hoặc là đua tốc độ nên bỏ qua nhiều cấu trúc tạo sự ổn định cho ứng dụng. Em nghiêng về phần làm vội nên bỏ qua nhiều phần cơ bản. Ví dụ như phần bảo mật của Deepseek cũng đang có phốt rất lớn. Team đã có 24h im lặng, cơ bản là coi như đã xác nhận phốt.Alibaba cũng cay lắm, đường ông lớn bỏ cả đống tiền mà ko nổi bằng thằng vô danh
Nếu TQ thuê hệ thống của FPT thì Mẽo kiểm soát kiểu gì nhỉ ?Nghe nói Mẽo nó đang điều tra TQ gom tầm 3 tỏi $ mua H100 từ các bên thứ 3, để ngầm làm con DS này dù TQ tuyên bố chỉ dùng H800 theo đúng lệnh hạn chế.
E ngoại đạo ko biết Nvidia có thể kiểm soát lượng chip của mình đi đâu về đâu ko?
Nếu vậy thì nó sẽ không giỏi hơn các AI khác được.https://genk.vn/openai-tuyen-bo-tim-thay-bang-chung-cho-thay-deepseek-dung-mo-hinh-cua-ho-de-dao-tao-ai-20250130152705297.chn Như này thì sớm muộn sẽ có 1 AI siêu thông minh, chả cần phần cứng cao cấp hay thư viện khổng lồ, chỉ cần điều khiển hoặc sử dụng dữ liệu của các AI khác theo ý của mình giống kiểu mô hình người tí hon trên đầu kẻ khổng lồ vậy. Tất nhiên nó sẽ thừa thông minh để lách luật về bản quyền, pháp lý.
Hị, hị.... Nhưng đám mây không nằm ở nhà mình thì bao nhiêu tài nguyên đem gom góp cho cọp nó xơi mất rầu!Nhúng mã bí mật là vi phạm khủng, tàn đời Nvidia nhé. Còn card thì cần gì đi mua khi Mỹ cho thuê máy để chạy đầy, không nhất thiết phải mang card về TQ mới chạy được.
Cái đột phá của deep seek là tìm ra cách training tiết kiệm chi phí thôi chứ ko phải là tốt nhất và đặc biệt là opensource , mọi người trên thế giới có thể lấy về và phát triển 1 cách dễ dàng . Thực tế là deep seek chỉ là 1 lab nhỏ với thành viên mới ra trường và chi phí đầu tư rất thấp nên có nhiều sai sót . Tuy nhiên nó lại viral, và cp của mấy thằng như Nvidia vẫn giảm ko phải là fud để gom hàngTeam Alibaba mạnh hơn team Deepseek nhiều. Con Qwen của Alibaba hiệu năng tốt, giá rẻ hơn cả Deepseek và khả năng chịu tải cũng như độ ổn định tốt. Con Deepseek từ trước khi viral thì chạy ứng dụng qua API đã chập chờn rồi. Hoặc là hạ tầng phần cứng của team chưa đủ hoặc là đua tốc độ nên bỏ qua nhiều cấu trúc tạo sự ổn định cho ứng dụng. Em nghiêng về phần làm vội nên bỏ qua nhiều phần cơ bản. Ví dụ như phần bảo mật của Deepseek cũng đang có phốt rất lớn. Team đã có 24h im lặng, cơ bản là coi như đã xác nhận phốt.
Con Deepseek R1 thì tải về máy chạy offline thì cần phải 16 con chip A100 mới đủ tải 1 người dùng (~50 tps). Một hệ thống như vậy giá trên 6 tỷ đồng đầu tư và vài triệu đồng tiền điện mỗi ngày mà chỉ phục vụ được 1 người dùng. Với hệ thống rẻ tiền (60-70 triệu đồng) thì chỉ chạy được bản rút gọn bé tí, kết quả đầu ra sánh ngang rác, không sử dụng được. Như vậy tính kinh tế, hiệu quả hoặc khả năng triển khai cho người dùng cá nhân, doanh nghiệp nhỏ là không khả thi như thông tin sai trên truyền thông mấy ngày nay.
Giá Deepseek R1 API trên OR đang là $8 so sánh với giá $15 của mô hình Claude 3.5 Sonnet (đang được đánh giá nhỉnh hơn trong tác vụ có thị trường lớn nhất là code) là một mức giá tốt nhưng không cách mạng. Con thực sự rẻ tiền là con Deepseek v3 thì hiệu năng cũng không quá vượt trội, chỉ nhỉnh hơn con Qwen 2.5 Coder một chút.
Như vậy truyền thông đang nhập nhằng gắn 2 thằng vào 1. Họ cố ý gắn cả ưu điểm giá rẻ của Deepseek v3 và ưu điểm hiệu năng cao của Deepseek R1 vào để tạo ra ảo giác là có một thứ mang đầy đủ đặc điểm "ngon, bổ, rẻ".
Hiện nay về AI của TQ thì team Alibaba (Qwen) và Bytedance (Doubao) là 2 team mạnh có thể đấu các team Mỹ. Các team khác (kể cả team Deepseek, theo em nghĩ) chưa đáng kể. Cái hay và đột phá của Deepseek là họ open model để mọi người tải về. Đây là nước đi rất hay để gây chú ý và gọi vốn. Bởi nếu không có thêm vốn để đua phần cứng thì hệ thống của họ sẽ sớm bị vỡ (như đã thấy hôm nay). Đây là nước đi "đập nồi dìm thuyền" vì các tay to hoặc sẽ bơm tiền đầu tư cho họ, hoặc sẽ bơm tiền để kéo người đi xé nát team.