Giờ nó cứ quét nhưng mồm bẩu cóp thủ công thì biết đấy là đâu???
Chừng nào mà trang web muasamcong còn online thì thiếu gì cách để chạy lệnh tự động lấy thông tin nếu bên lấy thông tin muốn làm. Có nhiều cách để làm:
1. Lập chỉ mục bằng tay, vài ngày review một lần.
+ Ví dụ:
Index thủ công để lấy danh sách:
luachonnhathau_WAR_bidportlet&p_p_lifecycle=
1&p_p_state=
normal&p_p_mode=view&p_p_col_id=column-1&p_p_col_count=2&_luachonnhathau_WAR_bidportlet_currentPage=1&_luachonnhathau_WAR_bidportlet_currentPage1=1&_luachonnhathau_WAR_bidportlet_currentPage2=1&_luachonnhathau_WAR_bidportlet_javax.portlet.action=list
... chừng nào chưa đổi mã nguồn trang web thì các tham số khai báo chuẩn là có thông tin ợ!
+ Lấy danh sách
theo trang cho đến hết
+ Đọc từng
kết quả trả về rồi đưa vào cơ sở dữ liệu.
Thông tin từng gói thầu dư nài đơi, từ kết quả mà biết cách tải cái gì về
weJjl6IE&p_p_id=luachonnhathau_WAR_bidportlet&p_p_lifecycle=1&p_p_state=normal&p_p_mode=view&p_p_col_id=column-1&p_p_col_count=2&_luachonnhathau_WAR_bidportlet_id=320749&_luachonnhathau_WAR_bidportlet_name=8&_luachonnhathau_WAR_bidportlet_javax.portlet.action=detail
Riêng cái tôi bôi đậm
weJjl6IE, nếu bị can thiệp thì dần các khách quét dạng bot, crawler (tần suất quét quá nhanh) sẽ cấm không cho thực hiện. Google hiện cũng có cách như vậy đối với dững ai dùng tính năng dịch online mà có tốc độ truy vấn quá cao, không phải người thường có thể làm được>> 100 yêu cầu/ giây từ 1 địa chỉ chả hạn.
Về phần tải file đính kèm thì phải có trình cao hơn tí... giả lập IE, rồi rà đến link và cách cấu tạo link mà xử
.....
2. Tìm cách thông minh để chui sâu hơn: cái này phải có sự cho phép của bên MPI.
thực tế thì bên các tờ báo nhiều tin tức của Mỹ cũng áp dụng chiến lược này để tránh các máy quét, nên bên cần thông tin đều phải thuê người thường xuyên làm Code quét mới bằng tay như kiểu tôi làm ở trên, mỗi lần mất chục đô là cả ngàn thằng rỗi việc như tôi vào làm ngay (10 phút làm xong).
Ở đầy có 2 khía cạnh
* Bên dauthau.infor thì
tham, lười, muốn có thông tin
nhiều, ngay, dễ mà không vận động xoay xở, bỏ tiển ra, cứ kêu la trước đã. Chừng nào bên web của bộ còn đưa thông tin ra thì chừng đó còn có cách lấy thông tin về. Bộ mà nó cố tình đập thì dauthau.infor chắc sẽ tèo!
* Bên bộ lo nguy cơ mất gói thầu về tay nhân dân nên dọn chỗ trước để đưa ra các giải pháp ngặt nghèo hơn >> bỏ công khai với tỷ lý do.
Cụ Chính mà không vào vụ này thì chắc chắn Bộ nó sẽ làm được (bài này em cho là do mấy ông Thứ khôn, lại biết công nghệ xì ra thoai) - haiz.
Em đồ rằng sẽ có 2 võ được triển trong thời gian tới:
1. Đập thằng đấu thầu cho đến chết: có khả năng cao, thu hết công cụ (domain, giấy phép kinh doanh...) thì nó tèo; >> hình thành các anh quét nhưng ngầm chứ không còn công khai;
2. Tìm cách chặn dần sự công khai: khó dưng có thể mần được, bắt phải đăng ký và lại thêm việc chỉ hiển thị một ít ra ngoài còn lại giấu tiệt: cái này cũng có vẻ không quá khó vì chưa biết cụ Hùng 4T có kịp ra chuẩn công khai thông tin không (cái gì phải công khai). May là có luật đấu thầu nó chưa kịp sửa không dám làm trái, nếu không ối anh tèo?
Còn về chuyện thầu tặc.... thì haiz, có thiếu gì cách làm khó nhà thầu chân chính, ờ mài chúng thầu, ngon nhảy vào đề (giá thấp >> chuẩn), mài xin giấy tao éo cho >>> xì tiền >> cách nài chỉ thầu tây nó bỏ thôi chứ nhà thầu ngon nhà ta vào thì cũng thành hư mà thiệt đơn thiệt kép, chưa kể bị thằng nhào bột thỉnh thoảng nó vào nó dằn cái mẹt!
Nhìn sâu hơn nữa, có vẻ trang muasamcong là lấy trọn mã nguồn của mấy ông Hàn cấp cho (
http://www.g2b.go.kr/index.jsp - trang đấu thầu công của Hàn đơi ạ)
JavaScript:
window.open("http://muasamcong.mpi.gov.vn:8081/servlet/TC/EP_COV_TCQ302?gonggo_num="+gongo_no+"&gubun="+gubun+"&docType="+docType,"goAppGongDongSu","left=50, top=50, width=840, height=600, toolbar=no, scrollbars=yes, menubar=no, resizable=yes");
//window.open("[B]http://www.g2b.go.kr:8081/servlet/TC/EP_COV_TCQ302[/B]?gonggo_num="+gongo_no+"&gubun="+gubun+"&docType="+docType,"goAppGongDongSu","left=50, top=50, width=840, height=600, toolbar=no, scrollbars=yes, menubar=no, resizable=yes");
Đã thế còn lười, không thèm sửa thông điệp nguồn...
Vừa mới cập nhập thông điệp cảnh báo hơi vô nghĩa nài ợ (bấm vào đường link tra cứu thì nó ra dư nài)
Mở bằng chrome thì không cho down tài liệu về, bảo quay lại IE... túm lại là bài kỹ thuật lòng vòng! Nhưng vì trang gốc của bên Hàn không có mấy thứ yêu cầu lởm này nên nếu bên dauthau.infor thực sự muốn họ vẫn có thể lấy được nhiều thứ họ cần về!
Chắc sẽ lại nhờ nâng cấp thoai! Chúc dauthau.infor và các cụ may mắn lần sau!