Khi chạm chán một website bao gồm giao diện rất đẹp thì biết được cách lấy hình ảnh của website để về tham khảo là một việc hết sức cần thiết. Nhưng không phải ai cũng biết cách lấy hình ảnh của website một cách hối hả và không hề thiếu nội dung. Trong nội dung bài viết này,tanduy.vn sẽ viết nội dung bài viết Hướng dẫn giải pháp lấy giao diện của website tiên tiến nhất 2020.

Bạn đang xem: Cách lấy giao diện của website

*
*

Cấu trúc dữ liệu tải về

Các file cài về được giữ có cấu tạo theo địa URL. Ví dụ : sinh hoạt ví dụ trên httrack tải add http://demo.hoangweb.com/thevistaanphu, đấy là website thực hiện mã nguồn wordpress, vào trang web này tất cả họ thấy có ảnh logo, với các ảnh được kéo ra ở vào theme .

http://demo.hoangweb.com/thevistaanphu/wp-content/photography_uploads/1-logo1<1>.jpghttp://demo.hoangweb.com/thevistaanphu/wp-content/themes/elegant-photography/images/progress.gif...Như vậy hình ảnh 1-logo1<1>.jpg này sẽ tiến hành lưu trên folder:c:/tmp/thevistaanphu/demo.hoangweb.com/thevistaanphu/wp-content/photography_uploads/Ảnh progress.gif nằm tại vị trí folder:c:/tmp/thevistaanphu/demo.hoangweb.com/thevistaanphu/wp-content/themes/elegant-photography/images/

.Nếu bao gồm external liên kết ngoài domain name hoangweb.com thì tài nguyên tới từ domain này vẫn được mang dữ liệu.

Sử dụng trợ giúp về lệnh, nếu khách hàng không chắc chắn rằng về cách sử dụng lệnh đó, hãy gõ: httrack --help để tra.

Cú pháp

httrack www.all.net/bob/lệnh này khá đối chọi giản, các options được thực hiện mặc định. Gõ: httrack --help bạn vẫn thấy cực hiếm mặc định của những tham số như sau:

w *mirror website sites %f *use proxy for ftp (f0 don"t use) cn number of multiple connections (*c8) RN number of retries, in case of timeout or non-fatal errors (*R1) %P *extended parsing, attempt to lớn parse all links, even in unknown tags or Javascript (%P0 don"t use) NN name conversion type (0 *original structure, 1+: see below) LN long names (L1 *long names / L0 8-3 conversion) KN keep original link (e.g. Http://www.adr/link) (K0 *relative link) o *generate đầu ra html tệp tin in case of error (404..) (o0 don"t generate) X *purge old files after update (X0 keep delete) bN accept cookies in cookies.txt (0=do not accept,* 1=accept) u kiểm tra document type if unknown (cgi,asp..) (u0 don"t check, * u1 kiểm tra but /, u2 kiểm tra always) j *parse Java Classes (j0 don"t parse) sN follow robots.txt & meta robots tags (0=never,1=sometimes,* 2=always) C create/use a cache for updates & retries (C0 no cache,C1 cache is prioritary,* C2 thử nghiệm update before) f *log tệp tin mode I *make an index (I0 don"t make) pN priority mode: (* p3) *3 save all files D *can only go down into subdirs a *stay on the same address --mirror *make a mirror of site(s) (default)Giải thích:

Lọc những link cài đặt vềCho phép chỉ tải những link gồm chứa domain, subdomain hoặc URL đựng một chuỗi nào đó có cung ứng widcat.

httrack www.hoangweb.com/lien-he/ "+*.hoangweb.com/*" -vPrint DebugĐể hiển thị thông tin tiến trình tải tài liệu sử dụng thêm tham số -v (verbose).

httrack www.hoangweb.com/lien-he/ -vTham số -BCho phép cài đặt URL làm việc sub-level. Ví dụ:

httrack www.all.net/bob/ -BTrương trình không chỉ có tải đa số URL con tất cả chứa con đường dẫn www.all.net/bob/ mà sẽ tải cả URL như: www.all.net/joe/, www.all.net/bob/deeper/

w *mirror website sitestải dữ liệu của URL hiện tại và tự động quét những link bao gồm trong nội dung của URL đó và thường xuyên download dữ liệu của các link đó.

%f *use proxy for ftp (f0 don’t use)nếu có links ftp (ie: ftp://) thì sử dụng ftp proxy server để download về.

cN number of multiple connections (*c8)cho phép 8 URL được tải về cùng một lúc. Ví dụ như sau được cho phép hoạt đụng 4 URLs và một lúc, thay bởi vì mặc định là 8.

httrack www.all.net/bob/ -c4 -BRN number of retries, in case of timeout or non-fatal errors (*R1)Cố gắng download URL một đợt nữa nếu URL kia bị lỗi.

%P *extended parsing, attempt lớn parse all links, even in unknown tags or Javascript (%P0 don’t use)quyét toàn thể URLs thậm trí tra cứu thấy cả vào javascript,java và những nơi còn lại mà phần mềm rất có thể tìm thấy.

Xem thêm: Review Phim Chiếu Rạp Bạn Gái Tôi Là Sếp : Cười Không Ngớt, Bạn Gái Tôi Là Sếp

http://localhost/hoangweb/wp-content/themes/abc/images/loading.gifảnh này sẽ được lưu về có cấu trúc folder theo cấu tạo URL đến ảnh đó là: hoangweb/wp-content/themes/abc/images/loading.gifTham số mặc định của httrack là N0, chúng ta có thể viết thêm tham số này tuy vậy nếu áp dụng giá trị mang định thì không đề xuất chỉ định.

httrack http://localhost/hoangweb/wp-content/themes/abc/images/loading.gif -N0 -g -O /tmp/imagesTuy nhiên, toàn diện files tài nguyên bạn có nhu cầu tải về phổ biến một thư mục thì chỉ số 0 bởi 1

httrack http://localhost/hoangweb/wp-content/themes/abc/images/loading.gif -N1 -g -O /tmp/proj1Lệnh trên sẽ cài file loading.gif vào folder “ / tmp / proj1 / website / images ”. Nếu khách hàng phân phối địa chỉ cửa hàng website hoặc URL cho tới một file cơ mà nội dung bao gồm chứa các link của các files tài nguyên khác. Toàn bộ những files tìm kiếm thấy sẽ đầy đủ lưu vào folder này. Bạn sẽ dễ quản ngại trị hơn, giữa những trường thích hợp rip giao diện của website. Đây cũng là phương pháp để bạn lấy toàn thể các file tài nguyên bao gồm trong tệp tin css .

LN long names (L1 *long names / L0 8-3 conversion)mặc định lưu file với tên sử dụng trên website.

o *generate output đầu ra html file in case of error (404..) (o0 don’t generate)nếu tất cả xẩy ra lỗi trong những lúc tải URL, trương trình sẽ tạo một file thay thế với nội dung thông tin URL đó đã trở nên lỗi (404 not found).

bN accept cookies in cookies.txt (0=do not accept,* 1=accept)cho phép tất cả các cookies vận động nếu được yêu cầu, một số trong những site cần bảo trì cookie để sử dụng cho những trang nó sẽ chuyển động như trên trình duyệt bình thường nên bạn chưa hẳn lo lắng.

u check document type if unknown (cgi,asp..) (u0 don’t check, * u1 check but /, u2 check always)Phân tích đa số kiểu file không hẳn là html,image type như asp, php,…những tệp tin này hoàn toàn có thể được cài về.

j *parse Java Classes (j0 don’t parse)Cho phép phân tích với tìm URL ở java class file.

sN follow robots.txt và meta robots tags (0=never,1=sometimes,* 2=always)có sử dụng robots.txt để chặn các URL ko được phép tầm nã cập.

C create/use a cache for updates và retries (C0 no cache,C1 cache is prioritary,* C2 chạy thử update before)nếu nhiều người đang tải một website mà đã sở hữu trước đó rồi, thì các URL cũ sẽ ảnh hưởng bỏ qua còn chỉ tải số đông URL bắt đầu “If-Modified-Since“.

f *log file modelưu tại vào tệp tin log những chuyển động quan trọng ra mắt trong quy trình download.

I *make an index (I0 don’t make)tạo tệp tin index.html là file thiết yếu của URL từ file này còn có liên kết tới các URL khác đã có được download.