Định giá BĐS bằng học máy tương đối dễ thực hiện, nhóm sinh viên năm 3-4 có thể làm các tiểu dự án như vậy, khó khăn chính là làm sao có được tệp dữ liệu tốt để huấn luyện hệ thống (supervised learning). Dữ liệu không chính xác kéo theo việc định giá (thực chất là tính bộ tham số) từ hệ thống trở nên càng kém chính xác.
Dữ liệu này là tài sản nên nói chung không xin được, nhưng có thể mua rẻ được một CSDL chứa thông tin với độ chính xác nhất định. Và từ CSDL này có thể bắt đầu huấn luyện máy học. Nếu đặt yêu cầu định gía chính xác đến 85% thì dự án hoàn toàn khả thi.
Trước đây có dự án Tao (quảng cáo trên otf) hướng đến dự báo tương lai, từng được một số người tham khảo khi đầu tư .
Cenland có dữ liệu giá BDS và họ dùng lợi thế đó cung cấp cả dịch vụ định giá truyền thống và định giá dựa trên học máy.
Có rất nhiều CSDL nhỏ không đầy đủ do các cá nhân nắm giữ, vd môi giới BĐS, vp công chứng, sàn bđs hoặc các công ty bđs, hội nhóm MXH, vv.