Thống kê bigdata các dự án mua để ở

chinhpham7983

Xe buýt
Biển số
OF-756201
Ngày cấp bằng
3/1/21
Số km
543
Động cơ
55,257 Mã lực
Tuổi
45
Nơi ở
Thanh Xuân, Hà Nội
Cụ phân tích hay quá. Em cũng tin những con số cụa cụ taao đưa ra chỉ mang tính tham khảo vì dữ liệu public mà môi giới đăng lên có sự làm giá (kiểm chứng khá dễ dàng bằng cách gọi thử cho chính người đăng tin). Còn nguồn nào nữa mà cụ taao có thể lấy được hay không thì em không dám nói. Nhưng xét trên tập mẫu lớn thì có thể tham khảo được vì nó thể hiện cách mà thị trường thể hiện (dù có thể không chính xác, như cụ ước tính là khoảng 10%).

Em vẫn thi thoảng vào trang của cụ taao để xem nhưng chủ yếu xem khoảng giá dài hạn và ngắn hạn để biết tính thanh khoản của thị trường, loại căn nào đang được quan tâm ở thời điểm hiện tại. Còn vụ nhận biết xu hướng tăng giảm thì xem cho vui chứ nói thẳng là em không tin vì quan điểm trên. Một khi mà mình đã ưng khu nào thì dù giá có dự báo tăng hay giảm cũng không quan trọng nữa.
Chuẩn rồi cụ
Cần tiền thì thiệt thòi cũng bán.
Ưng rồi mấy tỉ một nhành Lan. :))
 

Wilson07

Xe hơi
Biển số
OF-308405
Ngày cấp bằng
19/2/14
Số km
181
Động cơ
301,740 Mã lực
Nơi ở
Hà Nội
Em có theo 4 vị trí ở Nam 32, Lideco, The Zei và Goldmark thì thấy bid data này số liệu về giá sai so với giá thực tế trên thị trường đấy ạ, sai nhiều ấy :D
 

taaovn

Xe hơi
Biển số
OF-749912
Ngày cấp bằng
14/11/20
Số km
122
Động cơ
55,083 Mã lực
Tuổi
42
Cụ ko đọc kỹ đoạn tôi viết rồi. Giờ tôi viết thêm ví dụ cho cụ dễ hiểu. Giả sử từ data có đc là tháng 1 giá nhà cc quận CG tăng 0.5%. Tiếp theo tương tự, tháng 2 tăng 0.3%, tháng 3 tăng 0.5%, tháng 4-5-6-7-8 tăng lần lượt là 0.6%, 0.4%, 0.5%, 0.6%, 0.6%. Hệ thống sẽ vẽ đồ thị và tự động ngoại suy là xu hướng giá đang tăng và tiếp tục tăng trong ngắn hạn. Kết luận đó là ko đúng dựa trên data ban đau sai. Do thông tin thu đc sai và ko đầy đủ, những con số ở trên là sai hết, ko phải tăng 0.5% mà lúc là giảm 0.3%, lúc tăng 0.2%. Vai trò accurate data quan trọng hơn AI. AI chỉ giúp ko phải can thiệp thủ công, vẽ đồ thị và phân tích, dự báo xu hướng. Nhưng data sai nên vứt đi hết.
Cụ quả là có nghề IT, đúng là bên em có accurate data chứ ko thô thiển trung bình cộng để mất thời gian tham khảo của các cụ, hơn nữa ngoài loại bỏ thông tin rác thì thuật toán cũng loại bỏ trường hợp bị làm giá khi niêm yết liên tiếp, liên tục 1 mức giá sai lệch. Phần public các cụ theo dõi hiện bên em chỉ hiện thị đơn giản cho dễ hình dung xu hướng còn tool nội bộ và phục vụ đối tác thì có đủ các loại hình căn hộ dự án, các loại nhà tuy chưa thật đầy đủ toàn quốc. Hóng phân tích góp ý quý của cụ!
 

taaovn

Xe hơi
Biển số
OF-749912
Ngày cấp bằng
14/11/20
Số km
122
Động cơ
55,083 Mã lực
Tuổi
42
Em có theo 4 vị trí ở Nam 32, Lideco, The Zei và Goldmark thì thấy bid data này số liệu về giá sai so với giá thực tế trên thị trường đấy ạ, sai nhiều ấy :D
Giá dự án chung cư thì chỉ phản ánh xu hướng và loại hình căn hộ của dự án đó đang thanh khoản thôi cụ nên giá cảm giác sai lệch nhiều, em sẽ có demo tool riêng loại hình căn hộ thì sẽ chuẩn hơn
 

taaovn

Xe hơi
Biển số
OF-749912
Ngày cấp bằng
14/11/20
Số km
122
Động cơ
55,083 Mã lực
Tuổi
42
Update dự án mua để ở mới nhất taao.vn

1616466805168.png
 

taaovn

Xe hơi
Biển số
OF-749912
Ngày cấp bằng
14/11/20
Số km
122
Động cơ
55,083 Mã lực
Tuổi
42
Taao.vn mới cập nhật thêm khoảng giá tin chính chủ (đám mây màu xanh), mời các cụ tham khảo
1617178373229.png
 

ntvinh1602

Xe buýt
Biển số
OF-79148
Ngày cấp bằng
29/11/10
Số km
643
Động cơ
424,530 Mã lực
Ở Mỹ thì có data giá từng căn nhà khi mua bán, lịch sử mua bán căn nhà đó trong 1 thời gian dài, và vì đều là khu quy hoạch ô bàn cờ tương tự nhau, nên giá trong từng ô tương đồng, chỉ khác nhau giá trị nội thất căn nhà. DATA đúng và đầy đủ. "Machine learning" được huấn luyện trên tập hợp DATA đúng để ra được bộ chỉ số tốt để suy diễn về biến động tương lai.
Ở VN vì DATA có sai số cao, tôi ước tính sai 10%, nên khi huấn luyện "máy học" (machine learning) nó sẽ cho ra bộ chỉ số "kém tin cậy" và dùng bộ chỉ số đó để phân tích dự đoán biến động tương lai thì càng kém tin cậy.
Tôi hiểu về giải thuật, machine learning, deep learning, processing big data, programming, vv nên dù không biết nhóm của Taao, nhưng tôi hiểu và hình dung được khó khăn của tất cả những nhóm đang và muốn làm các dự án tương tự.
Tóm lại khó khăn vẫn là "garbage in, garbage out".

Mà kể cả giả định là data đầu vào accurate 100% thì cái việc dự phóng cũng là 1 chuyện siêu nan giải. Không cần nhìn đâu xa, nhìn ngay sang bên tài chính chứng khoán, machine learning vẫn không chiến thắng được thị trường mặc dù data là cực nhiều và chính xác. ML cứ gặp mấy cái time series như giá ck, giá nhà đất thế này thì overfit hết :D

Dừng lại ở mức độ tổng hợp được thông tin rồi cung cấp dữ liệu như bloomberg của tây hay fiinpro của Việt Nam là ok rồi. Còn interprete dữ liệu thế nào là việc của user. Có dữ liệu chuẩn để đọc ở mảng bds này là đã ngon rồi, dự đoán cứ để robot chạy bằng cơm lo :D
 

taaovn

Xe hơi
Biển số
OF-749912
Ngày cấp bằng
14/11/20
Số km
122
Động cơ
55,083 Mã lực
Tuổi
42
Tóm lại khó khăn vẫn là "garbage in, garbage out".

Mà kể cả giả định là data đầu vào accurate 100% thì cái việc dự phóng cũng là 1 chuyện siêu nan giải. Không cần nhìn đâu xa, nhìn ngay sang bên tài chính chứng khoán, machine learning vẫn không chiến thắng được thị trường mặc dù data là cực nhiều và chính xác. ML cứ gặp mấy cái time series như giá ck, giá nhà đất thế này thì overfit hết :D

Dừng lại ở mức độ tổng hợp được thông tin rồi cung cấp dữ liệu như bloomberg của tây hay fiinpro của Việt Nam là ok rồi. Còn interprete dữ liệu thế nào là việc của user. Có dữ liệu chuẩn để đọc ở mảng bds này là đã ngon rồi, dự đoán cứ để robot chạy bằng cơm lo :D
Chuẩn cụ ạ, máy chỉ xử lý phần thô còn nhà đầu tư ra quyết định với đồng tiền của mình mới luôn đúng, ko ai quyết thay đc ạ
 

toanlsvn

Xe máy
Biển số
OF-168672
Ngày cấp bằng
27/11/12
Số km
99
Động cơ
344,941 Mã lực
Nơi ở
Hanoi
Tool hữu ích quá cụ ạ, có cái biểu đồ là có thêm thông tin lịch sử giá cả rồi. Chúc cụ mạnh khỏe nhé
 

Oops nothing

Xe đạp
Biển số
OF-739563
Ngày cấp bằng
16/8/20
Số km
34
Động cơ
63,187 Mã lực
Tuổi
37
cụ có dự án nào ở bên long biên ạ. khoản giá 25, 60m2
 

phihanhgia

Xe container
Biển số
OF-296491
Ngày cấp bằng
24/10/13
Số km
5,331
Động cơ
382,636 Mã lực
Tóm lại khó khăn vẫn là "garbage in, garbage out".

Mà kể cả giả định là data đầu vào accurate 100% thì cái việc dự phóng cũng là 1 chuyện siêu nan giải. Không cần nhìn đâu xa, nhìn ngay sang bên tài chính chứng khoán, machine learning vẫn không chiến thắng được thị trường mặc dù data là cực nhiều và chính xác. ML cứ gặp mấy cái time series như giá ck, giá nhà đất thế này thì overfit hết :D

Dừng lại ở mức độ tổng hợp được thông tin rồi cung cấp dữ liệu như bloomberg của tây hay fiinpro của Việt Nam là ok rồi. Còn interprete dữ liệu thế nào là việc của user. Có dữ liệu chuẩn để đọc ở mảng bds này là đã ngon rồi, dự đoán cứ để robot chạy bằng cơm lo :D
Vâng chỗ này có 2 vấn đề cần nói rõ hơn.
1. Vấn đề dự đoán và dự báo:
Với Time series luôn luôn có thể làm dự đoán (prediction) và dự báo (forecasting), cũng có thể làm nhiều phân tích, nhiều kỹ thuật và nhiều mô hình.
Kể cả có accurate time series thì mọi dự đoán, dự báo cũng chỉ có giá trị tham khảo, có đúng, có sai, (có thể ước lượng được xác suất đúng hay sai của dự đoán, dự báo) , tùy người dùng sẽ sử dụng nó ntn.
Thế còn, với inaccurate time series, vd quá thiếu data về giá trị giao dịch thực của BĐS ở VN, thì cũng có thể làm như trên , nhưng lúc này các dự báo, dự đoán của nó lúc đó sẽ KHÔNG đáng để tham khảo. Nó là những phân tích đúng về kỹ thuật nhưng lại ko liên quan đến thực tế, vì input data chỉ có tính chất demo.

2. Kênh thông tin sai, cung cấp thông tin sai cho cả người mua và người bán. Không phải ai cũng cần dự báo, dự đoán trong tương lai; nhưng tất cả đều muốn có thông tín đúng (giá hiện tại hoặc gần thời điểm hiện tại nhất) để khớp lệnh. Thông tin kém chính xác càng làm bên mua - bên bán khó gặp được nhau.
 
Chỉnh sửa cuối:

Vuong B. Tru

Đi bộ
Biển số
OF-710779
Ngày cấp bằng
18/12/19
Số km
9
Động cơ
86,990 Mã lực
Vâng chỗ này có 2 vấn đề cần nói rõ hơn.
1. Vấn đề dự đoán và dự báo:
Với Time series luôn luôn có thể làm dự đoán (prediction) và dự báo (forecasting), cũng có thể làm nhiều phân tích, nhiều kỹ thuật và nhiều mô hình.
Kể cả có accurate time series thì mọi dự đoán, dự báo cũng chỉ có giá trị tham khảo, có đúng, có sai, (có thể ước lượng được xác suất đúng hay sai của dự đoán, dự báo) , tùy người dùng sẽ sử dụng nó ntn.
Thế còn, với inaccurate time series, vd quá thiếu data về giá trị giao dịch thực của BĐS ở VN, thì cũng có thể làm như trên , nhưng lúc này các dự báo, dự đoán của nó lúc đó sẽ KHÔNG đáng để tham khảo. Nó là những phân tích đúng về kỹ thuật nhưng lại ko liên quan đến thực tế, vì input data chỉ có tính chất demo.

2. Kênh thông tin sai, cung cấp thông tin sai cho cả người mua và người bán. Không phải ai cũng cần dự báo, dự đoán trong tương lai; nhưng tất cả đều muốn có thông tín đúng (giá hiện tại hoặc gần thời điểm hiện tại nhất) để khớp lệnh. Thông tin kém chính xác càng làm bên mua - bên bán khó gặp được nhau.
Ý của cụ rất hay. Ý thứ 2 nhắm đúng vào cái mà người mua cần. Chỉ cần có 1 nơi mà thông tin mua bán rõ ràng, giá cả chuẩn chỉ đã là điều đáng mừng rồi, nếu miễn được trung gian thì càng tốt. Nhưng khổ nỗi là giờ tin rao nhan nhản khắp nơi, phải chấp nhận sống chung với tin đểu thôi.
 

taaovn

Xe hơi
Biển số
OF-749912
Ngày cấp bằng
14/11/20
Số km
122
Động cơ
55,083 Mã lực
Tuổi
42
Vâng chỗ này có 2 vấn đề cần nói rõ hơn.
1. Vấn đề dự đoán và dự báo:
Với Time series luôn luôn có thể làm dự đoán (prediction) và dự báo (forecasting), cũng có thể làm nhiều phân tích, nhiều kỹ thuật và nhiều mô hình.
Kể cả có accurate time series thì mọi dự đoán, dự báo cũng chỉ có giá trị tham khảo, có đúng, có sai, (có thể ước lượng được xác suất đúng hay sai của dự đoán, dự báo) , tùy người dùng sẽ sử dụng nó ntn.
Thế còn, với inaccurate time series, vd quá thiếu data về giá trị giao dịch thực của BĐS ở VN, thì cũng có thể làm như trên , nhưng lúc này các dự báo, dự đoán của nó lúc đó sẽ KHÔNG đáng để tham khảo. Nó là những phân tích đúng về kỹ thuật nhưng lại ko liên quan đến thực tế, vì input data chỉ có tính chất demo.

2. Kênh thông tin sai, cung cấp thông tin sai cho cả người mua và người bán. Không phải ai cũng cần dự báo, dự đoán trong tương lai; nhưng tất cả đều muốn có thông tín đúng (giá hiện tại hoặc gần thời điểm hiện tại nhất) để khớp lệnh. Thông tin kém chính xác càng làm bên mua - bên bán khó gặp được nhau.
Cảm ơn cụ góp ý chuẩn! Hiện giờ bên em đang làm việc với các cộng tác viên môi giới, sàn bất động sản để update giao dịch thực tế bổ sung cho dữ liệu, cụ có thể làm cộng tác viên cho bên em đc ko?
 

Oops nothing

Xe đạp
Biển số
OF-739563
Ngày cấp bằng
16/8/20
Số km
34
Động cơ
63,187 Mã lực
Tuổi
37
Cảm ơn cụ góp ý chuẩn! Hiện giờ bên em đang làm việc với các cộng tác viên môi giới, sàn bất động sản để update giao dịch thực tế bổ sung cho dữ liệu, cụ có thể làm cộng tác viên cho bên em đc ko?
Bro có việc ko cho tui làm cũng với. Tui tài chính kế toán của dự án xây dựng. Hihi
 

Oops nothing

Xe đạp
Biển số
OF-739563
Ngày cấp bằng
16/8/20
Số km
34
Động cơ
63,187 Mã lực
Tuổi
37
Vâng chỗ này có 2 vấn đề cần nói rõ hơn.
1. Vấn đề dự đoán và dự báo:
Với Time series luôn luôn có thể làm dự đoán (prediction) và dự báo (forecasting), cũng có thể làm nhiều phân tích, nhiều kỹ thuật và nhiều mô hình.
Kể cả có accurate time series thì mọi dự đoán, dự báo cũng chỉ có giá trị tham khảo, có đúng, có sai, (có thể ước lượng được xác suất đúng hay sai của dự đoán, dự báo) , tùy người dùng sẽ sử dụng nó ntn.
Thế còn, với inaccurate time series, vd quá thiếu data về giá trị giao dịch thực của BĐS ở VN, thì cũng có thể làm như trên , nhưng lúc này các dự báo, dự đoán của nó lúc đó sẽ KHÔNG đáng để tham khảo. Nó là những phân tích đúng về kỹ thuật nhưng lại ko liên quan đến thực tế, vì input data chỉ có tính chất demo.

2. Kênh thông tin sai, cung cấp thông tin sai cho cả người mua và người bán. Không phải ai cũng cần dự báo, dự đoán trong tương lai; nhưng tất cả đều muốn có thông tín đúng (giá hiện tại hoặc gần thời điểm hiện tại nhất) để khớp lệnh. Thông tin kém chính xác càng làm bên mua - bên bán khó gặp được nhau.
Bro học data analysis ah. Mìn mới chỉ biết qua vì cfa có nói đến chứ chưa làm chuyên sâu phân tích. Có cuốn nào hay cho newer như mình ko. Thanks.
 

nguyendang2006

Đi bộ
Biển số
OF-773103
Ngày cấp bằng
2/4/21
Số km
4
Động cơ
39,840 Mã lực
Tuổi
25
các cụ có cụ nào ở Golden palm lê văn lương k ạ. E tài chình 3,6-3,7 thì mua đc căn bn m2 ở đó nhỉ
 

vio999

Xe hơi
Biển số
OF-314161
Ngày cấp bằng
1/4/14
Số km
130
Động cơ
296,803 Mã lực
Nơi ở
hanoi
Website
pinata.vn
ủn đít cho cụ
 

taaovn

Xe hơi
Biển số
OF-749912
Ngày cấp bằng
14/11/20
Số km
122
Động cơ
55,083 Mã lực
Tuổi
42

DVHNTV

[Tịch thu bằng lái]
Biển số
OF-774609
Ngày cấp bằng
16/4/21
Số km
296
Động cơ
41,741 Mã lực
Tuổi
45
Không thấy các dự án giá rẻ của Mường Thanh (HH Linh Đàm, Xa La, Kim Văn Kim Lũ,b Thanh Hà, .. ). Có nhiều người muốn quan tâm đến phân khúc này.
 
Thông tin thớt
Đang tải

Bài viết mới

Top