Tin tổng hợp

Deep Learning – Bài 2: Tạo Dataset image

  • 14/11/2021
  • Dataset là tập các dữ liệu là ảnh phục vụ cho việc học sâu. Chúng ta không thể thu thập ảnh thủ công trong thời gian ngắn được. Với cách hướng dẫn sau đây hỗ trợ bạn thu thập Dataset trong thời gian ngắn dễ dàng hơn.

    Cách tạo tập dữ liệu học sâu sử dụng Google image. Áp dụng cho trình duyệt Chrome: Chúng ta viết chương trình java script thu thập link download ảnh lưu vào file text. Sau đó tiến hành download và kiểm tra ảnh bằng chương trình viết bằng python.

    Bước 1 : mở Chrome , tìm kiếm hình ảnh, gõ nội dung tìm kiếm , kéo chuột tới phía dưới hết trang, bấm vào nút hiển thị thêm kết quả:

    cho tới khi không còn kết quả tìm kiếm:

    Bước 2: Tiếp theo mở tab trong Chrome : view –> Developer –>JavaScript Console

    nhập 5 đoạn code java script, nhâp lần lượt vào java script sau:

    Đoạn 1 : Mô phỏng bấm chuột phải , nhấc nhả chuột, giữ cho không điều hướng truy cập trang khác

    đoạn 2: Viết hàm trích xuất đường dẫn link ảnh và lưu trữ

    đoạn 3: Lưu các url ảnh vào file text, sau đó phát sinh file text download tưj động về máy tính

    đoạn 4: Tập hợp và sử dụng các hàm trên

    đoạn 5: Gọi hàm chính , lấy các url và bắt đầu tải file text xuống

    sau khi download file urls.txt tiến hành copy file text vào project python của bạn, sau đó tạo cây thư mục trong project như sau :

     

    Bước 3 : Viết chương trình python tiến hành download ảnh.

    Chạy file python và hưởng thụ thành quả, thay đổi đường dẫn với các đối tượng bạn muốn download về. Chúc các bạn thành công.