[Funland] Về công nghệ show tài liệu dạng html trên 123doc.vn

solomo

Đi bộ
Biển số
OF-297004
Ngày cấp bằng
29/10/13
Số km
2
Động cơ
311,020 Mã lực
Trên thị trường sách số và tài liệu online gần đây mình thấy nổi lên mấy thằng như doc.edu, doko, 123doc trong đó thấy 123doc có công nghệ cho xem tài liệu pdf up lên chuyển thành html mà mình thấy các trang khác không có .
Bác nào trên diễn đàn mình am hiểu vấn đề này có thể chia sẻ với anh em chút được không ạ
 

Blah

Xe đạp
Biển số
OF-114271
Ngày cấp bằng
26/9/11
Số km
18
Động cơ
387,680 Mã lực
Em thì không am hiểu lắm nhưng theo em để hiển thị pdf trên web dưới dạng html thì nó có thể làm như sau:
Cách nông dân: ^^
1. Sử dụng tool convert pdf -> .doc (MS WORD)
2. Từ doc thì chuyển thành html có vẻ đơn giản rồi (MSWORD hỗ trợ)

Ngoài ra có thể nó sử dụng thư viện convert trực tiếp pdf --> html luôn.
 

solomo

Đi bộ
Biển số
OF-297004
Ngày cấp bằng
29/10/13
Số km
2
Động cơ
311,020 Mã lực
Với những file pdf có ảnh bác có ý tưởng gì không ? vì nếu chuyển sang word kiểu file này thì không ổn
 

chuotdong

Xe container
Biển số
OF-24462
Ngày cấp bằng
20/11/08
Số km
5,137
Động cơ
580,400 Mã lực
Nơi ở
Hà Nội
File có nhiều ảnh mà dùng html5 có ổn không ?
 

s0s82

Xe tải
Biển số
OF-154807
Ngày cấp bằng
30/8/12
Số km
391
Động cơ
356,828 Mã lực
Chưa hiểu cụ định làm gì nhưng về công nghê thì em nghĩ giải pháp là như thế này:
- Sử dụng PDF parser để bóc tách các thành phần trong file PDF rồi chuyển sang dạng HTML. Cái này hỏi thằng Google có rất nhiều luôn. Ví dụ http://www.pdfparser.org/
- Sử dụng tool PDF2HTML. Ví dụ cái này http://pdftohtml.sourceforge.net/ chạy trên Linux command.

Cụ Chuột Đồng có hỏi về cái vụ file nhiều ảnh mà dùng HTML5 có ổn không ấy thì bản chất file nhiều ảnh thì mình vẫn phải hiển thị ảnh. HTML 5 hay 6, 7, 8 đi nữa thì mình phải có giải pháp hiển thị các ảnh cần hiển thị cho người dùng xem chứ không thể bắt người dùng load hết ảnh về được.
 

tuanhvt

[Tịch thu bằng lái]
Biển số
OF-118080
Ngày cấp bằng
25/10/11
Số km
6,649
Động cơ
379,343 Mã lực
Em thì không am hiểu lắm nhưng theo em để hiển thị pdf trên web dưới dạng html thì nó có thể làm như sau:
Cách nông dân: ^^
1. Sử dụng tool convert pdf -> .doc (MS WORD)
2. Từ doc thì chuyển thành html có vẻ đơn giản rồi (MSWORD hỗ trợ)

Ngoài ra có thể nó sử dụng thư viện convert trực tiếp pdf --> html luôn.
Từ doc chuyển sang html trong Word như nào vậy anh ?
 

vuhoang1985

Xe hơi
Biển số
OF-299495
Ngày cấp bằng
23/11/13
Số km
102
Động cơ
309,420 Mã lực
trên word : save as -> rồi chọn html thôi bác ^^
 
Thông tin thớt
Đang tải

Bài viết mới

Top