- Biển số
- OF-756201
- Ngày cấp bằng
- 3/1/21
- Số km
- 543
- Động cơ
- 55,257 Mã lực
- Tuổi
- 45
- Nơi ở
- Thanh Xuân, Hà Nội
Nó có tỉ lệ chung rồi. Cụ hỏi mấy ông kiến trúc sư ấyNếu em có được thông tin đầy đủ diện tích toàn bộ dự án cả nước thì dạy máy được cụ ạ
Nó có tỉ lệ chung rồi. Cụ hỏi mấy ông kiến trúc sư ấyNếu em có được thông tin đầy đủ diện tích toàn bộ dự án cả nước thì dạy máy được cụ ạ
Cụ bán em báo cáo lấy tiền đấy thuê em viết bài quảng cáo cho AI của cụ nhéCác cụ thấy thế nào nếu em sẽ tổng hợp báo cáo xu hướng và phát hiện điểm nóng thường xuyên. Có cụ nào đặt hàng báo cáo ko?
bản chất là có dữ liệu tầng nhưng nếu xét trong 1 khu vực địa lý thì thông thường mặt bằng điều kiện nhà cửa ko chênh lệch nhau là mấy nên khi cần định giá chi tiết sẽ có 1 công đoạn khảo sát nhanh thực tế bằng bản đồ vệ tinh, thực địa hoặc flycam cụ ạÀ mà em hỏi chút là data nhà riêng cụ có normalize dữ liệu không? Nhà riêng thì không có quy chuẩn, nhà thì 3 tầng, nhà thì 5 tầng... Giá nhà riêng cụ chỉ tính trên m2 đất hay sao?
Quan trọng là thu thập tự động đc mới làm cụ ạ, chứ bảo chạy bằng cơm bao nhiêu người cho đủ cả nướcNó có tỉ lệ chung rồi. Cụ hỏi mấy ông kiến trúc sư ấy
Cụ ko phải lo, phần lớn bọn em cung cấp free cho người dùng cuối, gái có công chồng chẳng phụ phải không cụCụ bán em báo cáo lấy tiền đấy thuê em viết bài quảng cáo cho AI của cụ nhé
Cụ lấy dữ liệu với tỉ lệ chung rồi nhúng vào phần mềm để nó tự chuyển đổi giữa các diện tích.Quan trọng là thu thập tự động đc mới làm cụ ạ, chứ bảo chạy bằng cơm bao nhiêu người cho đủ cả nước
Em đùa vậy thôi chứ theo em tim tường với thông thủy ko quá quan trọng cụ ạ, quan trọng loại hình nhà và căn hộ cá thể mới khó. Cụ nhắn vụ hợp tác vào chỗ kín giúp em, welcome cụCụ lấy dữ liệu với tỉ lệ chung rồi nhúng vào phần mềm để nó tự chuyển đổi giữa các diện tích.
Em rất thích ý tưởng dữ liệu của cụ và muốn hợp tác.
Em đã thư riêng cho cụ nhéEm đùa vậy thôi chứ theo em tim tường với thông thủy ko quá quan trọng cụ ạ, quan trọng loại hình nhà và căn hộ cá thể mới khó. Cụ nhắn vụ hợp tác vào chỗ kín giúp em, welcome cụ
Đã giao thông với cụ rồi nhé, cafe thuiEm đã thư riêng cho cụ nhé
căm minh sun cụ nhé! hiện nay mới cho tìm theo giá m2Giá có modul 2 tỷ/ 3 tỷ lọc đc nhà thì ngon
Có cả cụ ạ, bên em đang thu thập dữ liệu những người vô gia cư với member cái bang, cụ chờ vài năm nhéKể ra có bigdata vietlott thì tốt quá
AI của cụ có lọc đc giá thông thủy và giá tim tường ko?
Hahaha, nhóm cụ ấy tự động thu thập thông tin free trên mạng là chính, cả thông tin thật lẫn thông tin giả, rồi dùng thuật toán đơn giản lọc bớt những thông tin quá bất thường (đó chính là các thông tin giả), chẳng hạn thông tin đó khác quá nhiều với trung bình của nhóm, nhưng vẫn còn lại rất nhiều thông tin giả và những thông tin vớ vẩn ko chính xác. Sai số cứ xác định là cỡ 10% nên tim tường với thông thủy thì ko phân biệt được. Chẳng hạn có 2 tin bán căn hộ ở cùng dự án CC, một tin rao bán 30T/m2, một tin rao bán 33T/m2, cả hai tin đều đúng nhưng khác nhau chỉ vì môi giới 1 ng đưa giá bán theo tim tường cho nó rẻ, 1 người đưa tin chính xác theo giá thông thủy. Hệ thống ghi nhận cả 2 giá và lấy TB là 31.5T/m2.Trừ hao đi cụ ơi, chủ yếu có cái nền tham khảo. Em cũng hay xem của cụ taao nhưng nói thật là em chả tin tưởng hệ thống nào tuyệt đối cả. Tập data chắc chắn không thể chuẩn 100% được, nguồn public thì bị các anh môi giới làm giá, nguồn khác thì em không rõ.
Cụ ơi, thuật toán nó thông minh hơn cụ nói đó. Cụ nói thô sơ là vì cụ chỉ biết có từng đó, nên suy ra máy làm được có từng đó. Ví dụ như cái bôi đậm của cụ, ai chả biết, và vì vậy mới có giá trung hạn, dài hạn để xác định xu hướng. Chứ ai nhìn vào giá 1 tháng rồi kết luận giá lên xuống đâu.Hahaha, nhóm cụ ấy tự động thu thập thông tin free trên mạng là chính, cả thông tin thật lẫn thông tin giả, rồi dùng thuật toán đơn giản lọc bớt những thông tin quá bất thường (đó chính là các thông tin giả), chẳng hạn thông tin đó khác quá nhiều với trung bình của nhóm, nhưng vẫn còn lại rất nhiều thông tin giả và những thông tin vớ vẩn ko chính xác. Sai số cứ xác định là cỡ 10% nên tim tường với thông thủy thì ko phân biệt được. Chẳng hạn có 2 tin bán căn hộ ở cùng dự án CC, một tin rao bán 30T/m2, một tin rao bán 33T/m2, cả hai tin đều đúng nhưng khác nhau chỉ vì môi giới 1 ng đưa giá bán theo tim tường cho nó rẻ, 1 người đưa tin chính xác theo giá thông thủy. Hệ thống ghi nhận cả 2 giá và lấy TB là 31.5T/m2.
Muốn dùng AI thì phải có ACCURATE BIG DATA thì mới phân tích, suy luận và huấn luyện "học máy" hay "học sâu" được.
Kiểu làm thô sơ như hiện có thì chỉ có thể làm tốt cho các dự án KĐT mới, các dự án chung cư mới; còn mảng nhà đất thổ cư, nhà CC cũ thứ cấp, các dự án KĐT đã cũ (mua bán thứ cấp, hoặc ít mua bán) thì vì độ chính xác kém, sai số cao, nên suy luận xu hướng cũng sai bét. Chẳng hạn sai số dữ liệu 10% thì làm sao đánh giá phân tích là xu hướng tăng hay giảm 0.5% hay 1% được.
Ngay căn hộ CC ở cùng 1 tòa nhà, giá cũng có thể khác nhau 25% hoặc hơn, có căn 35T/m2 nhưng có căn 45T/m2. Hệ thống ghi nhận tất, nhưng vì hệ thống "còn ngu" nên ko phân biệt tại sao lại như vậy. Đến tháng X khu đó có 5 căn loại 33-35T/m2 giao dịch, 3 tháng sau 2 căn loại 43-46T/m2 giao dịch. Và nó phân tích báo là giá CC khu đó tăng. Đây là kết luận sai. Tương tự với kết luận giá giảm hay đứng yên.
Tương tự cho LK, BT trong 1 dự án cũng vậy. Cùng dự án, có căn nhà 100T/m2 nhưng có căn 150T/m2. Vị trí nó khác nhau. Hệ thống không phân biệt được.
Đối với nhà đất thổ cư thì còn phức tạp hơn rất nhiều nữa. Cùng 1 phường nhưng 2 ngõ khác nhau rất khác nhau, mà ngay trong 1 ngõ, cách nhau 1 đoạn hay thêm 1 khúc cua là giá đã khác. Tham khảo cho vui thì được, chứ đầu tư cần nhiều chất xám hơn rất nhiều.
Cụ ko đọc kỹ đoạn tôi viết rồi. Giờ tôi viết thêm ví dụ cho cụ dễ hiểu. Giả sử từ data có đc là tháng 1 giá nhà cc quận CG tăng 0.5%. Tiếp theo tương tự, tháng 2 tăng 0.3%, tháng 3 tăng 0.5%, tháng 4-5-6-7-8 tăng lần lượt là 0.6%, 0.4%, 0.5%, 0.6%, 0.6%. Hệ thống sẽ vẽ đồ thị và tự động ngoại suy là xu hướng giá đang tăng và tiếp tục tăng trong ngắn hạn. Kết luận đó là ko đúng dựa trên data ban đau sai. Do thông tin thu đc sai và ko đầy đủ, những con số ở trên là sai hết, ko phải tăng 0.5% mà lúc là giảm 0.3%, lúc tăng 0.2%. Vai trò accurate data quan trọng hơn AI. AI chỉ giúp ko phải can thiệp thủ công, vẽ đồ thị và phân tích, dự báo xu hướng. Nhưng data sai nên vứt đi hết.Cụ ơi, thuật toán nó thông minh hơn cụ nói đó. Cụ nói thô sơ là vì cụ chỉ biết có từng đó, nên suy ra máy làm được có từng đó. Ví dụ như cái bôi đậm của cụ, ai chả biết, và vì vậy mới có giá trung hạn, dài hạn để xác định xu hướng. Chứ ai nhìn vào giá 1 tháng rồi kết luận giá lên xuống đâu.
Cái "validation" cho dữ liệu rất quan trọng. Nhưng có cách để AI nó học và làm công việc này. Em thấy nhiều trang của nước ngoài nó đã làm được, tất nhiên là cho bộ dữ liệu khácCụ ko đọc kỹ đoạn tôi viết rồi. Giờ tôi viết thêm ví dụ cho cụ dễ hiểu. Giả sử từ data có đc là tháng 1 giá nhà cc quận CG tăng 0.5%. Tiếp theo tương tự, tháng 2 tăng 0.3%, tháng 3 tăng 0.5%, tháng 4-5-6-7-8 tăng lần lượt là 0.6%, 0.4%, 0.5%, 0.6%, 0.6%. Hệ thống sẽ vẽ đồ thị và tự động ngoại suy là xu hướng giá đang tăng và tiếp tục tăng trong ngắn hạn. Kết luận đó là ko đúng dựa trên data ban đau sai. Do thông tin thu đc sai và ko đầy đủ, những con số ở trên là sai hết, ko phải tăng 0.5% mà lúc là giảm 0.3%, lúc tăng 0.2%. Vai trò accurate data quan trọng hơn AI. AI chỉ giúp ko phải can thiệp thủ công, vẽ đồ thị và phân tích, dự báo xu hướng. Nhưng data sai nên vứt đi hết.
Ở Mỹ thì có data giá từng căn nhà khi mua bán, lịch sử mua bán căn nhà đó trong 1 thời gian dài, và vì đều là khu quy hoạch ô bàn cờ tương tự nhau, nên giá trong từng ô tương đồng, chỉ khác nhau giá trị nội thất căn nhà. DATA đúng và đầy đủ. "Machine learning" được huấn luyện trên tập hợp DATA đúng để ra được bộ chỉ số tốt để suy diễn về biến động tương lai.Cái validation cho dư
Cái "validation" cho dữ liệu rất quan trọng. Nhưng có cách để AI nó học và làm công việc này. Em thấy nhiều trang của nước ngoài nó đã làm được, tất nhiên là cho bộ dữ liệu khác
Ở một số nước phát triển, việc cụ thay vị trí cái ổ cắm điện trong phòng, chặt 1 cái cây trong vườn đều phải được thực hiện bởi người có chứng chỉ hành nghề và được ghi lại, nói gì đến lịch sử mua bán. Những thông tin ấy cũng dễ dàng tiếp cận và người mua thông tin có thể yên tâm tin tưởng. Ở Việt Nam hay các nước đang phát triển thì CCCM vẫn phải sống vào niềm tin của bản thân thôi. Nhưng theo em thì toán học Thống kê nó cũng có cách để khử được nhiễu chứ, CCCM có niềm tin cũng phải dựa trên 1 dự cảm nào đó mà, chỉ là chưa biết cách làm rõ các yếu tố tham chiếu thôi.Ở Mỹ thì có data giá từng căn nhà khi mua bán, lịch sử mua bán căn nhà đó trong 1 thời gian dài, và vì đều là khu quy hoạch ô bàn cờ tương tự nhau, nên giá trong từng ô tương đồng, chỉ khác nhau giá trị nội thất căn nhà. DATA đúng và đầy đủ. "Machine learning" được huấn luyện trên tập hợp DATA đúng để ra được bộ chỉ số tốt để suy diễn về biến động tương lai.
Ở VN vì DATA có sai số cao, tôi ước tính sai 10%, nên khi huấn luyện "máy học" (machine learning) nó sẽ cho ra bộ chỉ số "kém tin cậy" và dùng bộ chỉ số đó để phân tích dự đoán biến động tương lai thì càng kém tin cậy.
Tôi hiểu về giải thuật, machine learning, deep learning, processing big data, programming, vv nên dù không biết nhóm của Taao, nhưng tôi hiểu và hình dung được khó khăn của tất cả những nhóm đang và muốn làm các dự án tương tự.
Cụ phân tích hay quá. Em cũng tin những con số cụa cụ taao đưa ra chỉ mang tính tham khảo vì dữ liệu public mà môi giới đăng lên có sự làm giá (kiểm chứng khá dễ dàng bằng cách gọi thử cho chính người đăng tin). Còn nguồn nào nữa mà cụ taao có thể lấy được hay không thì em không dám nói. Nhưng xét trên tập mẫu lớn thì có thể tham khảo được vì nó thể hiện cách mà thị trường thể hiện (dù có thể không chính xác, như cụ ước tính là khoảng 10%).Ở Mỹ thì có data giá từng căn nhà khi mua bán, lịch sử mua bán căn nhà đó trong 1 thời gian dài, và vì đều là khu quy hoạch ô bàn cờ tương tự nhau, nên giá trong từng ô tương đồng, chỉ khác nhau giá trị nội thất căn nhà. DATA đúng và đầy đủ. "Machine learning" được huấn luyện trên tập hợp DATA đúng để ra được bộ chỉ số tốt để suy diễn về biến động tương lai.
Ở VN vì DATA có sai số cao, tôi ước tính sai 10%, nên khi huấn luyện "máy học" (machine learning) nó sẽ cho ra bộ chỉ số "kém tin cậy" và dùng bộ chỉ số đó để phân tích dự đoán biến động tương lai thì càng kém tin cậy.
Tôi hiểu về giải thuật, machine learning, deep learning, processing big data, programming, vv nên dù không biết nhóm của Taao, nhưng tôi hiểu và hình dung được khó khăn của tất cả những nhóm đang và muốn làm các dự án tương tự.