Thống kê bigdata các dự án mua để ở

chinhpham7983 · 19:22 04/03/2021

taaovn nói:
Nếu em có được thông tin đầy đủ diện tích toàn bộ dự án cả nước thì dạy máy được cụ ạ

Nó có tỉ lệ chung rồi. Cụ hỏi mấy ông kiến trúc sư ấy

chinhpham7983 · 19:27 04/03/2021

taaovn nói:
Các cụ thấy thế nào nếu em sẽ tổng hợp báo cáo xu hướng và phát hiện điểm nóng thường xuyên. Có cụ nào đặt hàng báo cáo ko?

Cụ bán em báo cáo lấy tiền đấy thuê em viết bài quảng cáo cho AI của cụ nhé

taaovn · 19:39 04/03/2021

tantran2020 nói:
À mà em hỏi chút là data nhà riêng cụ có normalize dữ liệu không? Nhà riêng thì không có quy chuẩn, nhà thì 3 tầng, nhà thì 5 tầng... Giá nhà riêng cụ chỉ tính trên m2 đất hay sao?

bản chất là có dữ liệu tầng nhưng nếu xét trong 1 khu vực địa lý thì thông thường mặt bằng điều kiện nhà cửa ko chênh lệch nhau là mấy nên khi cần định giá chi tiết sẽ có 1 công đoạn khảo sát nhanh thực tế bằng bản đồ vệ tinh, thực địa hoặc flycam cụ ạ

taaovn · 19:40 04/03/2021

chinhpham7983 nói:
Nó có tỉ lệ chung rồi. Cụ hỏi mấy ông kiến trúc sư ấy

Quan trọng là thu thập tự động đc mới làm cụ ạ, chứ bảo chạy bằng cơm bao nhiêu người cho đủ cả nước

taaovn · 19:42 04/03/2021

chinhpham7983 nói:
Cụ bán em báo cáo lấy tiền đấy thuê em viết bài quảng cáo cho AI của cụ nhé

Cụ ko phải lo, phần lớn bọn em cung cấp free cho người dùng cuối, gái có công chồng chẳng phụ phải không cụ

chinhpham7983 · 19:47 04/03/2021

taaovn nói:
Quan trọng là thu thập tự động đc mới làm cụ ạ, chứ bảo chạy bằng cơm bao nhiêu người cho đủ cả nước

Cụ lấy dữ liệu với tỉ lệ chung rồi nhúng vào phần mềm để nó tự chuyển đổi giữa các diện tích.
Em rất thích ý tưởng dữ liệu của cụ và muốn hợp tác.

taaovn · 19:52 04/03/2021

chinhpham7983 nói:
Cụ lấy dữ liệu với tỉ lệ chung rồi nhúng vào phần mềm để nó tự chuyển đổi giữa các diện tích.
Em rất thích ý tưởng dữ liệu của cụ và muốn hợp tác.

Em đùa vậy thôi chứ theo em tim tường với thông thủy ko quá quan trọng cụ ạ, quan trọng loại hình nhà và căn hộ cá thể mới khó. Cụ nhắn vụ hợp tác vào chỗ kín giúp em, welcome cụ

chinhpham7983 · 19:53 04/03/2021

taaovn nói:
Em đùa vậy thôi chứ theo em tim tường với thông thủy ko quá quan trọng cụ ạ, quan trọng loại hình nhà và căn hộ cá thể mới khó. Cụ nhắn vụ hợp tác vào chỗ kín giúp em, welcome cụ

Em đã thư riêng cho cụ nhé

taaovn · 19:57 04/03/2021

chinhpham7983 nói:
Em đã thư riêng cho cụ nhé

Đã giao thông với cụ rồi nhé, cafe thui

haiha.73 · 20:01 04/03/2021

Giá có modul 2 tỷ/ 3 tỷ lọc đc nhà thì ngon

taaovn · 20:02 04/03/2021

haiha.73 nói:
Giá có modul 2 tỷ/ 3 tỷ lọc đc nhà thì ngon

căm minh sun cụ nhé! hiện nay mới cho tìm theo giá m2

AMATAX · 20:03 04/03/2021

Kể ra có bigdata vietlott thì tốt quá :o)

taaovn · 20:06 04/03/2021

AMATAX nói:
Kể ra có bigdata vietlott thì tốt quá

Có cả cụ ạ, bên em đang thu thập dữ liệu những người vô gia cư với member cái bang, cụ chờ vài năm nhé

phihanhgia · 5/3/21

Trá Hình nói:
AI của cụ có lọc đc giá thông thủy và giá tim tường ko?

Vuong B. Tru nói:
Trừ hao đi cụ ơi, chủ yếu có cái nền tham khảo. Em cũng hay xem của cụ taao nhưng nói thật là em chả tin tưởng hệ thống nào tuyệt đối cả. Tập data chắc chắn không thể chuẩn 100% được, nguồn public thì bị các anh môi giới làm giá, nguồn khác thì em không rõ.

Hahaha, nhóm cụ ấy tự động thu thập thông tin free trên mạng là chính, cả thông tin thật lẫn thông tin giả, rồi dùng thuật toán đơn giản lọc bớt những thông tin quá bất thường (đó chính là các thông tin giả), chẳng hạn thông tin đó khác quá nhiều với trung bình của nhóm, nhưng vẫn còn lại rất nhiều thông tin giả và những thông tin vớ vẩn ko chính xác. Sai số cứ xác định là cỡ 10% nên tim tường với thông thủy thì ko phân biệt được. Chẳng hạn có 2 tin bán căn hộ ở cùng dự án CC, một tin rao bán 30T/m2, một tin rao bán 33T/m2, cả hai tin đều đúng nhưng khác nhau chỉ vì môi giới 1 ng đưa giá bán theo tim tường cho nó rẻ, 1 người đưa tin chính xác theo giá thông thủy. Hệ thống ghi nhận cả 2 giá và lấy TB là 31.5T/m2.

Muốn dùng AI thì phải có ACCURATE BIG DATA thì mới phân tích, suy luận và huấn luyện "học máy" hay "học sâu" được.

Kiểu làm thô sơ như hiện có thì chỉ có thể làm tốt cho các dự án KĐT mới, các dự án chung cư mới; còn mảng nhà đất thổ cư, nhà CC cũ thứ cấp, các dự án KĐT đã cũ (mua bán thứ cấp, hoặc ít mua bán) thì vì độ chính xác kém, sai số cao, nên suy luận xu hướng cũng sai bét. Chẳng hạn sai số dữ liệu 10% thì làm sao đánh giá phân tích là xu hướng tăng hay giảm 0.5% hay 1% được.

Ngay căn hộ CC ở cùng 1 tòa nhà, giá cũng có thể khác nhau 25% hoặc hơn, có căn 35T/m2 nhưng có căn 45T/m2. Hệ thống ghi nhận tất, nhưng vì hệ thống "còn ngu" nên ko phân biệt tại sao lại như vậy. Đến tháng X khu đó có 5 căn loại 33-35T/m2 giao dịch, 3 tháng sau 2 căn loại 43-46T/m2 giao dịch. Và nó phân tích báo là giá CC khu đó tăng. Đây là kết luận sai. Tương tự với kết luận giá giảm hay đứng yên.

Tương tự cho LK, BT trong 1 dự án cũng vậy. Cùng dự án, có căn nhà 100T/m2 nhưng có căn 150T/m2. Vị trí nó khác nhau. Hệ thống không phân biệt được.

Đối với nhà đất thổ cư thì còn phức tạp hơn rất nhiều nữa. Cùng 1 phường nhưng 2 ngõ khác nhau rất khác nhau, mà ngay trong 1 ngõ, cách nhau 1 đoạn hay thêm 1 khúc cua là giá đã khác. Tham khảo cho vui thì được, chứ đầu tư cần nhiều chất xám hơn rất nhiều.

tantran2020 · 02:33 05/03/2021

phihanhgia nói:
Hahaha, nhóm cụ ấy tự động thu thập thông tin free trên mạng là chính, cả thông tin thật lẫn thông tin giả, rồi dùng thuật toán đơn giản lọc bớt những thông tin quá bất thường (đó chính là các thông tin giả), chẳng hạn thông tin đó khác quá nhiều với trung bình của nhóm, nhưng vẫn còn lại rất nhiều thông tin giả và những thông tin vớ vẩn ko chính xác. Sai số cứ xác định là cỡ 10% nên tim tường với thông thủy thì ko phân biệt được. Chẳng hạn có 2 tin bán căn hộ ở cùng dự án CC, một tin rao bán 30T/m2, một tin rao bán 33T/m2, cả hai tin đều đúng nhưng khác nhau chỉ vì môi giới 1 ng đưa giá bán theo tim tường cho nó rẻ, 1 người đưa tin chính xác theo giá thông thủy. Hệ thống ghi nhận cả 2 giá và lấy TB là 31.5T/m2.

Muốn dùng AI thì phải có ACCURATE BIG DATA thì mới phân tích, suy luận và huấn luyện "học máy" hay "học sâu" được.

Kiểu làm thô sơ như hiện có thì chỉ có thể làm tốt cho các dự án KĐT mới, các dự án chung cư mới; còn mảng nhà đất thổ cư, nhà CC cũ thứ cấp, các dự án KĐT đã cũ (mua bán thứ cấp, hoặc ít mua bán) thì vì độ chính xác kém, sai số cao, nên suy luận xu hướng cũng sai bét. Chẳng hạn sai số dữ liệu 10% thì làm sao đánh giá phân tích là xu hướng tăng hay giảm 0.5% hay 1% được.

Ngay căn hộ CC ở cùng 1 tòa nhà, giá cũng có thể khác nhau 25% hoặc hơn, có căn 35T/m2 nhưng có căn 45T/m2. Hệ thống ghi nhận tất, nhưng vì hệ thống "còn ngu" nên ko phân biệt tại sao lại như vậy. Đến tháng X khu đó có 5 căn loại 33-35T/m2 giao dịch, 3 tháng sau 2 căn loại 43-46T/m2 giao dịch. Và nó phân tích báo là giá CC khu đó tăng. Đây là kết luận sai. Tương tự với kết luận giá giảm hay đứng yên.

Tương tự cho LK, BT trong 1 dự án cũng vậy. Cùng dự án, có căn nhà 100T/m2 nhưng có căn 150T/m2. Vị trí nó khác nhau. Hệ thống không phân biệt được.

Đối với nhà đất thổ cư thì còn phức tạp hơn rất nhiều nữa. Cùng 1 phường nhưng 2 ngõ khác nhau rất khác nhau, mà ngay trong 1 ngõ, cách nhau 1 đoạn hay thêm 1 khúc cua là giá đã khác. Tham khảo cho vui thì được, chứ đầu tư cần nhiều chất xám hơn rất nhiều.

Cụ ơi, thuật toán nó thông minh hơn cụ nói đó. Cụ nói thô sơ là vì cụ chỉ biết có từng đó, nên suy ra máy làm được có từng đó. Ví dụ như cái bôi đậm của cụ, ai chả biết, và vì vậy mới có giá trung hạn, dài hạn để xác định xu hướng. Chứ ai nhìn vào giá 1 tháng rồi kết luận giá lên xuống đâu.

phihanhgia · 06:56 05/03/2021

tantran2020 nói:
Cụ ơi, thuật toán nó thông minh hơn cụ nói đó. Cụ nói thô sơ là vì cụ chỉ biết có từng đó, nên suy ra máy làm được có từng đó. Ví dụ như cái bôi đậm của cụ, ai chả biết, và vì vậy mới có giá trung hạn, dài hạn để xác định xu hướng. Chứ ai nhìn vào giá 1 tháng rồi kết luận giá lên xuống đâu.

Cụ ko đọc kỹ đoạn tôi viết rồi. Giờ tôi viết thêm ví dụ cho cụ dễ hiểu. Giả sử từ data có đc là tháng 1 giá nhà cc quận CG tăng 0.5%. Tiếp theo tương tự, tháng 2 tăng 0.3%, tháng 3 tăng 0.5%, tháng 4-5-6-7-8 tăng lần lượt là 0.6%, 0.4%, 0.5%, 0.6%, 0.6%. Hệ thống sẽ vẽ đồ thị và tự động ngoại suy là xu hướng giá đang tăng và tiếp tục tăng trong ngắn hạn. Kết luận đó là ko đúng dựa trên data ban đau sai. Do thông tin thu đc sai và ko đầy đủ, những con số ở trên là sai hết, ko phải tăng 0.5% mà lúc là giảm 0.3%, lúc tăng 0.2%. Vai trò accurate data quan trọng hơn AI. AI chỉ giúp ko phải can thiệp thủ công, vẽ đồ thị và phân tích, dự báo xu hướng. Nhưng data sai nên vứt đi hết.

chinhpham7983 · 12:52 05/03/2021

Cái validation cho dư

phihanhgia nói:
Cụ ko đọc kỹ đoạn tôi viết rồi. Giờ tôi viết thêm ví dụ cho cụ dễ hiểu. Giả sử từ data có đc là tháng 1 giá nhà cc quận CG tăng 0.5%. Tiếp theo tương tự, tháng 2 tăng 0.3%, tháng 3 tăng 0.5%, tháng 4-5-6-7-8 tăng lần lượt là 0.6%, 0.4%, 0.5%, 0.6%, 0.6%. Hệ thống sẽ vẽ đồ thị và tự động ngoại suy là xu hướng giá đang tăng và tiếp tục tăng trong ngắn hạn. Kết luận đó là ko đúng dựa trên data ban đau sai. Do thông tin thu đc sai và ko đầy đủ, những con số ở trên là sai hết, ko phải tăng 0.5% mà lúc là giảm 0.3%, lúc tăng 0.2%. Vai trò accurate data quan trọng hơn AI. AI chỉ giúp ko phải can thiệp thủ công, vẽ đồ thị và phân tích, dự báo xu hướng. Nhưng data sai nên vứt đi hết.

Cái "validation" cho dữ liệu rất quan trọng. Nhưng có cách để AI nó học và làm công việc này. Em thấy nhiều trang của nước ngoài nó đã làm được, tất nhiên là cho bộ dữ liệu khác

phihanhgia · 13:13 05/03/2021

chinhpham7983 nói:
Cái validation cho dư
Cái "validation" cho dữ liệu rất quan trọng. Nhưng có cách để AI nó học và làm công việc này. Em thấy nhiều trang của nước ngoài nó đã làm được, tất nhiên là cho bộ dữ liệu khác

Ở Mỹ thì có data giá từng căn nhà khi mua bán, lịch sử mua bán căn nhà đó trong 1 thời gian dài, và vì đều là khu quy hoạch ô bàn cờ tương tự nhau, nên giá trong từng ô tương đồng, chỉ khác nhau giá trị nội thất căn nhà. DATA đúng và đầy đủ. "Machine learning" được huấn luyện trên tập hợp DATA đúng để ra được bộ chỉ số tốt để suy diễn về biến động tương lai.
Ở VN vì DATA có sai số cao, tôi ước tính sai 10%, nên khi huấn luyện "máy học" (machine learning) nó sẽ cho ra bộ chỉ số "kém tin cậy" và dùng bộ chỉ số đó để phân tích dự đoán biến động tương lai thì càng kém tin cậy.
Tôi hiểu về giải thuật, machine learning, deep learning, processing big data, programming, vv nên dù không biết nhóm của Taao, nhưng tôi hiểu và hình dung được khó khăn của tất cả những nhóm đang và muốn làm các dự án tương tự.

chinhpham7983 · 13:45 05/03/2021

phihanhgia nói:
Ở Mỹ thì có data giá từng căn nhà khi mua bán, lịch sử mua bán căn nhà đó trong 1 thời gian dài, và vì đều là khu quy hoạch ô bàn cờ tương tự nhau, nên giá trong từng ô tương đồng, chỉ khác nhau giá trị nội thất căn nhà. DATA đúng và đầy đủ. "Machine learning" được huấn luyện trên tập hợp DATA đúng để ra được bộ chỉ số tốt để suy diễn về biến động tương lai.
Ở VN vì DATA có sai số cao, tôi ước tính sai 10%, nên khi huấn luyện "máy học" (machine learning) nó sẽ cho ra bộ chỉ số "kém tin cậy" và dùng bộ chỉ số đó để phân tích dự đoán biến động tương lai thì càng kém tin cậy.
Tôi hiểu về giải thuật, machine learning, deep learning, processing big data, programming, vv nên dù không biết nhóm của Taao, nhưng tôi hiểu và hình dung được khó khăn của tất cả những nhóm đang và muốn làm các dự án tương tự.

Ở một số nước phát triển, việc cụ thay vị trí cái ổ cắm điện trong phòng, chặt 1 cái cây trong vườn đều phải được thực hiện bởi người có chứng chỉ hành nghề và được ghi lại, nói gì đến lịch sử mua bán. Những thông tin ấy cũng dễ dàng tiếp cận và người mua thông tin có thể yên tâm tin tưởng. Ở Việt Nam hay các nước đang phát triển thì CCCM vẫn phải sống vào niềm tin của bản thân thôi. Nhưng theo em thì toán học Thống kê nó cũng có cách để khử được nhiễu chứ, CCCM có niềm tin cũng phải dựa trên 1 dự cảm nào đó mà, chỉ là chưa biết cách làm rõ các yếu tố tham chiếu thôi.

Vuong B. Tru · 13:49 05/03/2021

phihanhgia nói:
Ở Mỹ thì có data giá từng căn nhà khi mua bán, lịch sử mua bán căn nhà đó trong 1 thời gian dài, và vì đều là khu quy hoạch ô bàn cờ tương tự nhau, nên giá trong từng ô tương đồng, chỉ khác nhau giá trị nội thất căn nhà. DATA đúng và đầy đủ. "Machine learning" được huấn luyện trên tập hợp DATA đúng để ra được bộ chỉ số tốt để suy diễn về biến động tương lai.
Ở VN vì DATA có sai số cao, tôi ước tính sai 10%, nên khi huấn luyện "máy học" (machine learning) nó sẽ cho ra bộ chỉ số "kém tin cậy" và dùng bộ chỉ số đó để phân tích dự đoán biến động tương lai thì càng kém tin cậy.
Tôi hiểu về giải thuật, machine learning, deep learning, processing big data, programming, vv nên dù không biết nhóm của Taao, nhưng tôi hiểu và hình dung được khó khăn của tất cả những nhóm đang và muốn làm các dự án tương tự.

Cụ phân tích hay quá. Em cũng tin những con số cụa cụ taao đưa ra chỉ mang tính tham khảo vì dữ liệu public mà môi giới đăng lên có sự làm giá (kiểm chứng khá dễ dàng bằng cách gọi thử cho chính người đăng tin). Còn nguồn nào nữa mà cụ taao có thể lấy được hay không thì em không dám nói. Nhưng xét trên tập mẫu lớn thì có thể tham khảo được vì nó thể hiện cách mà thị trường thể hiện (dù có thể không chính xác, như cụ ước tính là khoảng 10%).

Em vẫn thi thoảng vào trang của cụ taao để xem nhưng chủ yếu xem khoảng giá dài hạn và ngắn hạn để biết tính thanh khoản của thị trường, loại căn nào đang được quan tâm ở thời điểm hiện tại. Còn vụ nhận biết xu hướng tăng giảm thì xem cho vui chứ nói thẳng là em không tin vì quan điểm trên. Một khi mà mình đã ưng khu nào thì dù giá có dự báo tăng hay giảm cũng không quan trọng nữa.

Thống kê bigdata các dự án mua để ở

Xe buýt

Xe buýt

Xe hơi

Xe hơi

Xe hơi

Xe buýt

Xe hơi

Xe buýt

Xe hơi

Xe tải

Xe hơi

Xe điện

Xe hơi

Xe container

[Tịch thu bằng lái]

Xe container

Xe buýt

Xe container

Xe buýt

Đi bộ

Thông tin thớt