Thống kê bigdata các dự án mua để ở

chinhpham7983

Xe buýt
Biển số
OF-756201
Ngày cấp bằng
3/1/21
Số km
544
Động cơ
55,257 Mã lực
Tuổi
45
Nơi ở
Thanh Xuân, Hà Nội
Các cụ thấy thế nào nếu em sẽ tổng hợp báo cáo xu hướng và phát hiện điểm nóng thường xuyên. Có cụ nào đặt hàng báo cáo ko?
Cụ bán em báo cáo lấy tiền đấy thuê em viết bài quảng cáo cho AI của cụ nhé
 

taaovn

Xe hơi
Biển số
OF-749912
Ngày cấp bằng
14/11/20
Số km
122
Động cơ
55,083 Mã lực
Tuổi
41
À mà em hỏi chút là data nhà riêng cụ có normalize dữ liệu không? Nhà riêng thì không có quy chuẩn, nhà thì 3 tầng, nhà thì 5 tầng... Giá nhà riêng cụ chỉ tính trên m2 đất hay sao?
bản chất là có dữ liệu tầng nhưng nếu xét trong 1 khu vực địa lý thì thông thường mặt bằng điều kiện nhà cửa ko chênh lệch nhau là mấy nên khi cần định giá chi tiết sẽ có 1 công đoạn khảo sát nhanh thực tế bằng bản đồ vệ tinh, thực địa hoặc flycam cụ ạ
 

taaovn

Xe hơi
Biển số
OF-749912
Ngày cấp bằng
14/11/20
Số km
122
Động cơ
55,083 Mã lực
Tuổi
41

taaovn

Xe hơi
Biển số
OF-749912
Ngày cấp bằng
14/11/20
Số km
122
Động cơ
55,083 Mã lực
Tuổi
41
Cụ bán em báo cáo lấy tiền đấy thuê em viết bài quảng cáo cho AI của cụ nhé
Cụ ko phải lo, phần lớn bọn em cung cấp free cho người dùng cuối, gái có công chồng chẳng phụ phải không cụ
 

chinhpham7983

Xe buýt
Biển số
OF-756201
Ngày cấp bằng
3/1/21
Số km
544
Động cơ
55,257 Mã lực
Tuổi
45
Nơi ở
Thanh Xuân, Hà Nội
Quan trọng là thu thập tự động đc mới làm cụ ạ, chứ bảo chạy bằng cơm bao nhiêu người cho đủ cả nước
Cụ lấy dữ liệu với tỉ lệ chung rồi nhúng vào phần mềm để nó tự chuyển đổi giữa các diện tích.
Em rất thích ý tưởng dữ liệu của cụ và muốn hợp tác.
 

taaovn

Xe hơi
Biển số
OF-749912
Ngày cấp bằng
14/11/20
Số km
122
Động cơ
55,083 Mã lực
Tuổi
41
Cụ lấy dữ liệu với tỉ lệ chung rồi nhúng vào phần mềm để nó tự chuyển đổi giữa các diện tích.
Em rất thích ý tưởng dữ liệu của cụ và muốn hợp tác.
Em đùa vậy thôi chứ theo em tim tường với thông thủy ko quá quan trọng cụ ạ, quan trọng loại hình nhà và căn hộ cá thể mới khó. Cụ nhắn vụ hợp tác vào chỗ kín giúp em, welcome cụ
 

chinhpham7983

Xe buýt
Biển số
OF-756201
Ngày cấp bằng
3/1/21
Số km
544
Động cơ
55,257 Mã lực
Tuổi
45
Nơi ở
Thanh Xuân, Hà Nội
Em đùa vậy thôi chứ theo em tim tường với thông thủy ko quá quan trọng cụ ạ, quan trọng loại hình nhà và căn hộ cá thể mới khó. Cụ nhắn vụ hợp tác vào chỗ kín giúp em, welcome cụ
Em đã thư riêng cho cụ nhé
 

haiha.73

Xe tải
Biển số
OF-437839
Ngày cấp bằng
17/7/16
Số km
494
Động cơ
217,246 Mã lực
Giá có modul 2 tỷ/ 3 tỷ lọc đc nhà thì ngon
 

AMATAX

Xe điện
Biển số
OF-303978
Ngày cấp bằng
5/1/14
Số km
2,147
Động cơ
366,491 Mã lực
Nơi ở
Kể ra có bigdata vietlott thì tốt quá:o)
 

taaovn

Xe hơi
Biển số
OF-749912
Ngày cấp bằng
14/11/20
Số km
122
Động cơ
55,083 Mã lực
Tuổi
41

phihanhgia

Xe container
Biển số
OF-296491
Ngày cấp bằng
24/10/13
Số km
5,111
Động cơ
382,682 Mã lực
AI của cụ có lọc đc giá thông thủy và giá tim tường ko?
Trừ hao đi cụ ơi, chủ yếu có cái nền tham khảo. Em cũng hay xem của cụ taao nhưng nói thật là em chả tin tưởng hệ thống nào tuyệt đối cả. Tập data chắc chắn không thể chuẩn 100% được, nguồn public thì bị các anh môi giới làm giá, nguồn khác thì em không rõ.
Hahaha, nhóm cụ ấy tự động thu thập thông tin free trên mạng là chính, cả thông tin thật lẫn thông tin giả, rồi dùng thuật toán đơn giản lọc bớt những thông tin quá bất thường (đó chính là các thông tin giả), chẳng hạn thông tin đó khác quá nhiều với trung bình của nhóm, nhưng vẫn còn lại rất nhiều thông tin giả và những thông tin vớ vẩn ko chính xác. Sai số cứ xác định là cỡ 10% nên tim tường với thông thủy thì ko phân biệt được. Chẳng hạn có 2 tin bán căn hộ ở cùng dự án CC, một tin rao bán 30T/m2, một tin rao bán 33T/m2, cả hai tin đều đúng nhưng khác nhau chỉ vì môi giới 1 ng đưa giá bán theo tim tường cho nó rẻ, 1 người đưa tin chính xác theo giá thông thủy. Hệ thống ghi nhận cả 2 giá và lấy TB là 31.5T/m2.

Muốn dùng AI thì phải có ACCURATE BIG DATA thì mới phân tích, suy luận và huấn luyện "học máy" hay "học sâu" được.

Kiểu làm thô sơ như hiện có thì chỉ có thể làm tốt cho các dự án KĐT mới, các dự án chung cư mới; còn mảng nhà đất thổ cư, nhà CC cũ thứ cấp, các dự án KĐT đã cũ (mua bán thứ cấp, hoặc ít mua bán) thì vì độ chính xác kém, sai số cao, nên suy luận xu hướng cũng sai bét. Chẳng hạn sai số dữ liệu 10% thì làm sao đánh giá phân tích là xu hướng tăng hay giảm 0.5% hay 1% được.

Ngay căn hộ CC ở cùng 1 tòa nhà, giá cũng có thể khác nhau 25% hoặc hơn, có căn 35T/m2 nhưng có căn 45T/m2. Hệ thống ghi nhận tất, nhưng vì hệ thống "còn ngu" nên ko phân biệt tại sao lại như vậy. Đến tháng X khu đó có 5 căn loại 33-35T/m2 giao dịch, 3 tháng sau 2 căn loại 43-46T/m2 giao dịch. Và nó phân tích báo là giá CC khu đó tăng. Đây là kết luận sai. Tương tự với kết luận giá giảm hay đứng yên.

Tương tự cho LK, BT trong 1 dự án cũng vậy. Cùng dự án, có căn nhà 100T/m2 nhưng có căn 150T/m2. Vị trí nó khác nhau. Hệ thống không phân biệt được.

Đối với nhà đất thổ cư thì còn phức tạp hơn rất nhiều nữa. Cùng 1 phường nhưng 2 ngõ khác nhau rất khác nhau, mà ngay trong 1 ngõ, cách nhau 1 đoạn hay thêm 1 khúc cua là giá đã khác. Tham khảo cho vui thì được, chứ đầu tư cần nhiều chất xám hơn rất nhiều.
 
Chỉnh sửa cuối:

tantran2020

[Tịch thu bằng lái]
Biển số
OF-733990
Ngày cấp bằng
26/6/20
Số km
581
Động cơ
73,960 Mã lực
Tuổi
34
Hahaha, nhóm cụ ấy tự động thu thập thông tin free trên mạng là chính, cả thông tin thật lẫn thông tin giả, rồi dùng thuật toán đơn giản lọc bớt những thông tin quá bất thường (đó chính là các thông tin giả), chẳng hạn thông tin đó khác quá nhiều với trung bình của nhóm, nhưng vẫn còn lại rất nhiều thông tin giả và những thông tin vớ vẩn ko chính xác. Sai số cứ xác định là cỡ 10% nên tim tường với thông thủy thì ko phân biệt được. Chẳng hạn có 2 tin bán căn hộ ở cùng dự án CC, một tin rao bán 30T/m2, một tin rao bán 33T/m2, cả hai tin đều đúng nhưng khác nhau chỉ vì môi giới 1 ng đưa giá bán theo tim tường cho nó rẻ, 1 người đưa tin chính xác theo giá thông thủy. Hệ thống ghi nhận cả 2 giá và lấy TB là 31.5T/m2.

Muốn dùng AI thì phải có ACCURATE BIG DATA thì mới phân tích, suy luận và huấn luyện "học máy" hay "học sâu" được.

Kiểu làm thô sơ như hiện có thì chỉ có thể làm tốt cho các dự án KĐT mới, các dự án chung cư mới; còn mảng nhà đất thổ cư, nhà CC cũ thứ cấp, các dự án KĐT đã cũ (mua bán thứ cấp, hoặc ít mua bán) thì vì độ chính xác kém, sai số cao, nên suy luận xu hướng cũng sai bét. Chẳng hạn sai số dữ liệu 10% thì làm sao đánh giá phân tích là xu hướng tăng hay giảm 0.5% hay 1% được.

Ngay căn hộ CC ở cùng 1 tòa nhà, giá cũng có thể khác nhau 25% hoặc hơn, có căn 35T/m2 nhưng có căn 45T/m2. Hệ thống ghi nhận tất, nhưng vì hệ thống "còn ngu" nên ko phân biệt tại sao lại như vậy. Đến tháng X khu đó có 5 căn loại 33-35T/m2 giao dịch, 3 tháng sau 2 căn loại 43-46T/m2 giao dịch. Và nó phân tích báo là giá CC khu đó tăng. Đây là kết luận sai. Tương tự với kết luận giá giảm hay đứng yên.

Tương tự cho LK, BT trong 1 dự án cũng vậy. Cùng dự án, có căn nhà 100T/m2 nhưng có căn 150T/m2. Vị trí nó khác nhau. Hệ thống không phân biệt được.

Đối với nhà đất thổ cư thì còn phức tạp hơn rất nhiều nữa. Cùng 1 phường nhưng 2 ngõ khác nhau rất khác nhau, mà ngay trong 1 ngõ, cách nhau 1 đoạn hay thêm 1 khúc cua là giá đã khác. Tham khảo cho vui thì được, chứ đầu tư cần nhiều chất xám hơn rất nhiều.
Cụ ơi, thuật toán nó thông minh hơn cụ nói đó. Cụ nói thô sơ là vì cụ chỉ biết có từng đó, nên suy ra máy làm được có từng đó. Ví dụ như cái bôi đậm của cụ, ai chả biết, và vì vậy mới có giá trung hạn, dài hạn để xác định xu hướng. Chứ ai nhìn vào giá 1 tháng rồi kết luận giá lên xuống đâu.
 

phihanhgia

Xe container
Biển số
OF-296491
Ngày cấp bằng
24/10/13
Số km
5,111
Động cơ
382,682 Mã lực
Cụ ơi, thuật toán nó thông minh hơn cụ nói đó. Cụ nói thô sơ là vì cụ chỉ biết có từng đó, nên suy ra máy làm được có từng đó. Ví dụ như cái bôi đậm của cụ, ai chả biết, và vì vậy mới có giá trung hạn, dài hạn để xác định xu hướng. Chứ ai nhìn vào giá 1 tháng rồi kết luận giá lên xuống đâu.
Cụ ko đọc kỹ đoạn tôi viết rồi. Giờ tôi viết thêm ví dụ cho cụ dễ hiểu. Giả sử từ data có đc là tháng 1 giá nhà cc quận CG tăng 0.5%. Tiếp theo tương tự, tháng 2 tăng 0.3%, tháng 3 tăng 0.5%, tháng 4-5-6-7-8 tăng lần lượt là 0.6%, 0.4%, 0.5%, 0.6%, 0.6%. Hệ thống sẽ vẽ đồ thị và tự động ngoại suy là xu hướng giá đang tăng và tiếp tục tăng trong ngắn hạn. Kết luận đó là ko đúng dựa trên data ban đau sai. Do thông tin thu đc sai và ko đầy đủ, những con số ở trên là sai hết, ko phải tăng 0.5% mà lúc là giảm 0.3%, lúc tăng 0.2%. Vai trò accurate data quan trọng hơn AI. AI chỉ giúp ko phải can thiệp thủ công, vẽ đồ thị và phân tích, dự báo xu hướng. Nhưng data sai nên vứt đi hết.
 

chinhpham7983

Xe buýt
Biển số
OF-756201
Ngày cấp bằng
3/1/21
Số km
544
Động cơ
55,257 Mã lực
Tuổi
45
Nơi ở
Thanh Xuân, Hà Nội
Cái validation cho dư
Cụ ko đọc kỹ đoạn tôi viết rồi. Giờ tôi viết thêm ví dụ cho cụ dễ hiểu. Giả sử từ data có đc là tháng 1 giá nhà cc quận CG tăng 0.5%. Tiếp theo tương tự, tháng 2 tăng 0.3%, tháng 3 tăng 0.5%, tháng 4-5-6-7-8 tăng lần lượt là 0.6%, 0.4%, 0.5%, 0.6%, 0.6%. Hệ thống sẽ vẽ đồ thị và tự động ngoại suy là xu hướng giá đang tăng và tiếp tục tăng trong ngắn hạn. Kết luận đó là ko đúng dựa trên data ban đau sai. Do thông tin thu đc sai và ko đầy đủ, những con số ở trên là sai hết, ko phải tăng 0.5% mà lúc là giảm 0.3%, lúc tăng 0.2%. Vai trò accurate data quan trọng hơn AI. AI chỉ giúp ko phải can thiệp thủ công, vẽ đồ thị và phân tích, dự báo xu hướng. Nhưng data sai nên vứt đi hết.
Cái "validation" cho dữ liệu rất quan trọng. Nhưng có cách để AI nó học và làm công việc này. Em thấy nhiều trang của nước ngoài nó đã làm được, tất nhiên là cho bộ dữ liệu khác
 

phihanhgia

Xe container
Biển số
OF-296491
Ngày cấp bằng
24/10/13
Số km
5,111
Động cơ
382,682 Mã lực
Cái validation cho dư
Cái "validation" cho dữ liệu rất quan trọng. Nhưng có cách để AI nó học và làm công việc này. Em thấy nhiều trang của nước ngoài nó đã làm được, tất nhiên là cho bộ dữ liệu khác
Ở Mỹ thì có data giá từng căn nhà khi mua bán, lịch sử mua bán căn nhà đó trong 1 thời gian dài, và vì đều là khu quy hoạch ô bàn cờ tương tự nhau, nên giá trong từng ô tương đồng, chỉ khác nhau giá trị nội thất căn nhà. DATA đúng và đầy đủ. "Machine learning" được huấn luyện trên tập hợp DATA đúng để ra được bộ chỉ số tốt để suy diễn về biến động tương lai.
Ở VN vì DATA có sai số cao, tôi ước tính sai 10%, nên khi huấn luyện "máy học" (machine learning) nó sẽ cho ra bộ chỉ số "kém tin cậy" và dùng bộ chỉ số đó để phân tích dự đoán biến động tương lai thì càng kém tin cậy.
Tôi hiểu về giải thuật, machine learning, deep learning, processing big data, programming, vv nên dù không biết nhóm của Taao, nhưng tôi hiểu và hình dung được khó khăn của tất cả những nhóm đang và muốn làm các dự án tương tự.
 

chinhpham7983

Xe buýt
Biển số
OF-756201
Ngày cấp bằng
3/1/21
Số km
544
Động cơ
55,257 Mã lực
Tuổi
45
Nơi ở
Thanh Xuân, Hà Nội
Ở Mỹ thì có data giá từng căn nhà khi mua bán, lịch sử mua bán căn nhà đó trong 1 thời gian dài, và vì đều là khu quy hoạch ô bàn cờ tương tự nhau, nên giá trong từng ô tương đồng, chỉ khác nhau giá trị nội thất căn nhà. DATA đúng và đầy đủ. "Machine learning" được huấn luyện trên tập hợp DATA đúng để ra được bộ chỉ số tốt để suy diễn về biến động tương lai.
Ở VN vì DATA có sai số cao, tôi ước tính sai 10%, nên khi huấn luyện "máy học" (machine learning) nó sẽ cho ra bộ chỉ số "kém tin cậy" và dùng bộ chỉ số đó để phân tích dự đoán biến động tương lai thì càng kém tin cậy.
Tôi hiểu về giải thuật, machine learning, deep learning, processing big data, programming, vv nên dù không biết nhóm của Taao, nhưng tôi hiểu và hình dung được khó khăn của tất cả những nhóm đang và muốn làm các dự án tương tự.
Ở một số nước phát triển, việc cụ thay vị trí cái ổ cắm điện trong phòng, chặt 1 cái cây trong vườn đều phải được thực hiện bởi người có chứng chỉ hành nghề và được ghi lại, nói gì đến lịch sử mua bán. Những thông tin ấy cũng dễ dàng tiếp cận và người mua thông tin có thể yên tâm tin tưởng. Ở Việt Nam hay các nước đang phát triển thì CCCM vẫn phải sống vào niềm tin của bản thân thôi. Nhưng theo em thì toán học Thống kê nó cũng có cách để khử được nhiễu chứ, CCCM có niềm tin cũng phải dựa trên 1 dự cảm nào đó mà, chỉ là chưa biết cách làm rõ các yếu tố tham chiếu thôi.
 

Vuong B. Tru

Đi bộ
Biển số
OF-710779
Ngày cấp bằng
18/12/19
Số km
9
Động cơ
86,990 Mã lực
Ở Mỹ thì có data giá từng căn nhà khi mua bán, lịch sử mua bán căn nhà đó trong 1 thời gian dài, và vì đều là khu quy hoạch ô bàn cờ tương tự nhau, nên giá trong từng ô tương đồng, chỉ khác nhau giá trị nội thất căn nhà. DATA đúng và đầy đủ. "Machine learning" được huấn luyện trên tập hợp DATA đúng để ra được bộ chỉ số tốt để suy diễn về biến động tương lai.
Ở VN vì DATA có sai số cao, tôi ước tính sai 10%, nên khi huấn luyện "máy học" (machine learning) nó sẽ cho ra bộ chỉ số "kém tin cậy" và dùng bộ chỉ số đó để phân tích dự đoán biến động tương lai thì càng kém tin cậy.
Tôi hiểu về giải thuật, machine learning, deep learning, processing big data, programming, vv nên dù không biết nhóm của Taao, nhưng tôi hiểu và hình dung được khó khăn của tất cả những nhóm đang và muốn làm các dự án tương tự.
Cụ phân tích hay quá. Em cũng tin những con số cụa cụ taao đưa ra chỉ mang tính tham khảo vì dữ liệu public mà môi giới đăng lên có sự làm giá (kiểm chứng khá dễ dàng bằng cách gọi thử cho chính người đăng tin). Còn nguồn nào nữa mà cụ taao có thể lấy được hay không thì em không dám nói. Nhưng xét trên tập mẫu lớn thì có thể tham khảo được vì nó thể hiện cách mà thị trường thể hiện (dù có thể không chính xác, như cụ ước tính là khoảng 10%).

Em vẫn thi thoảng vào trang của cụ taao để xem nhưng chủ yếu xem khoảng giá dài hạn và ngắn hạn để biết tính thanh khoản của thị trường, loại căn nào đang được quan tâm ở thời điểm hiện tại. Còn vụ nhận biết xu hướng tăng giảm thì xem cho vui chứ nói thẳng là em không tin vì quan điểm trên. Một khi mà mình đã ưng khu nào thì dù giá có dự báo tăng hay giảm cũng không quan trọng nữa.
 
Thông tin thớt
Đang tải

Bài viết mới

Top