Selenium không khó
| |

Selenium không khó: Cài đặt môi trường Selenium với Python

This entry is part 1 of 3 in the series Selenium không khó

Xin chào tất cả các bạn độc giả, đây là bài hướng dẫn đầu tiên trong series hướng dẫn mang tên: Selenium không khó được hướng dẫn bởi Lập trình không khó. Đây là series hướng dẫn Selenium dưới góc nhìn của một data engineer, lập trình viên, giúp các bạn có thể sử dụng thuần thục Selenium phục vụ một số công việc chính sau:

  1. Xây dựng các phần mềm tự động trên trình duyệt
  2. Thu thập dữ liệu từ các website phục vụ cho công việc

Tuy nhiên, bất kỳ ai có mong muốn học và sử dụng được Selenium đều có thể bắt đầu với series Selenium không khó này. Bởi mục đích của loạt bài hướng dẫn này là giúp bạn biết cách dùng Selenium mà.

Ở bài viết đầu tiên này, mình sẽ giúp các bạn cài đặt môi trường để bắt đầu làm việc với Selenium nhé. Để giúp cho việc học trở nên đơn giản và hiệu quả nhất. Mình sẽ quyết định sử dụng ngôn ngữ Python để viết code trong series này. Selenium hỗ trợ đa ngôn ngữ và có cú pháp các hàm giống nhau(mình đã thử cả với java và python nên có kết luận này). Do đó, nếu bạn có sử dụng ngôn ngữ khác thì những ý tưởng thực hiện, hay thậm chí là các hàm của Selenium là tương tự nhau ở mọi ngôn ngữ.

Như vậy, các công việc mà chúng ta cần làm trong bài này bao gồm:

  • Cài đặt môi trường lập trình Python
  • Cài đặt môi trường sử dụng Selenium
  • Chạy thử chương trình đầu tiên

1. Cài đặt môi trường lập trình Python

Trong phần này, mình sẽ hướng dẫn cài đặt môi trường Python cho cả hệ điều hành Linux lẫn Windows. Do đó, bạn chỉ cần thực hiện phần công việc của hệ điều hành mà bạn đang sử dụng.

Sau khi cài đặt môi trường tương ứng với từng hệ điều hành xong, các bạn hãy tải và cài đặt PyCharm IDE. Đây là IDE chạy được cả trên Linux lẫn Windows.

Cài đặt Python trên Windows

Việc cài đặt Python trên windows rất đơn giản. Bạn hãy vào trang https://www.python.org/downloads/ để download phiên bản Python mà bạn muốn cài. Mình khuyên các bạn sử dụng Python phiên bản mới nhất(đang là 3.7.3 khi mình viết bài). Đặc biệt lưu ý không cài Python 2 nhé

Sau khi tải file cài đặt về thì bạn cài bình thường như các phần mềm khác. Nhưng hãy nhớ tick vào ô “Add python 3.x to PATH” như hình dưới đây.

Lưu ý khi cài đặt python trên windows

Lưu ý khi cài đặt python trên windowsSau khi cài đặt xong, hãy chắc chắn bạn cài đặt thành công bằng cách kiểm tra cài đặt ở mục phía dưới.

Cài đặt Python trên Linux

Mặc định hệ điều hành Linux chỉ có Python 2(phiên bản đã ngừng phát triển). Do đó, bạn nên cài Python 3 để sử dụng. Cách cài như sau:

Mở Terminal(Phím tắt Ctrl + Alt + T) và chạy các command sau:

Như vậy là hoàn thành. Hãy kiếm tra cài đặt đã thành công chưa ở phía dưới đây.

Hãy chắc chắn bạn đã cài thành công Python

Sau khi cài đặt xong, hãy kiểm tra chắc chắn bạn đã cài đặt Python thành công. Bạn hãy mở CMD trên windows(Nhấn tổ hợp Windows + R => Gõ cmd => Enter). Hoặc Terminal trên Linux và gõ 2 lệnh như hình dưới đây:

Nếu không có lỗi gì và có thông tin phiên bản Python bản vừa cài thì thành công rồi nhé. Giờ bạn có thể chuyển sang mục 2.

Cài đặt PyCharm IDE

Để phục vụ cho việc code Python được thuận lợi, chúng ta sẽ sử dụng PyCharm IDE. Các bạn chỉ cần vào trang chủ của họ để tải bản cài đặt tương ứng với hệ điều hành của bạn.

PyCharm IDE Community là phiên bản miễn phí cho mọi người dùng. Việc cài đặt cực kỳ đơn giản nên mình sẽ không hướng dẫn nữa.

Link tới trang download: https://www.jetbrains.com/pycharm/download/

2. Cài đặt môi trường sử dụng Selenium

Selenium là một trình duyệt cho phép bạn thực hiện các công việc tự động hóa ở trên đó. Hầu hết các thao tác trên trình duyệt mà bạn làm được thì Selenium đều có thể làm được và cho phép bạn dùng code để điều khiển trình duyệt này.

Đây là trang chủ của Selenium: https://www.seleniumhq.org/

Cài đặt Selenium với Python

Việc cài đặt Selenium với ngôn ngữ Python cực kỳ đơn giản, bạn chỉ cần chạy command sau:

Nếu bạn sử dụng PyCharm thì bạn nên chạy command này ở Terminal trong Project của bạn nhé. Vì có thể bạn dùng Python virtualenv.

Cài đặt Selenium trên PyCharm IDE
Cài đặt Selenium trên PyCharm IDE

Tải Selenium WebDriver

Các bạn nên dùng WebDriver FireFox hoặc Chrome. Trong series này mình sẽ dùng FireFox driver(geckodriver) nhé.

Bạn chỉ cần tải một trong 2 driver nói trên. Khi tải nhớ chọn đúng phiên bản ứng với hệ điều hành bạn đang sử dụng nhé:

  • FireFox Driver: https://github.com/mozilla/geckodriver/releases
  • Chrome Driver: http://chromedriver.chromium.org/downloads

Sau khi tải về, các bạn giải nén ra sẽ được 1 file duy nhất. Bây giờ việc thiết lập sẽ có đôi chút khác với từng hệ điều hành:

Với Linux:

Bạn cần copy file đó vào trong /usr/local/bin. Bạn làm như sau:

Với Windows:

Cách đơn giản nhất là bạn copy file này vào cùng thư mục với code python của bạn. Kiểu như này:

Ở đây geckodriver là tên của FireFox Driver, với Chrome driver cũng làm tương tự.

3. Chương trình đầu tiên sử dụng Selenium

Để đảm bảo bạn đã làm chính xác 2 bước phía trên. Bây giờ các bạn giúp mình tạo một file hello_world.py và copy đoạn code sau vào chạy thử nhé.

Sau khi chạy xong, trên console output sẽ in ra thông tin: website url và website title như sau:

Đồng thời, thư mục chứa code sẽ có một file ảnh chụp màn hình website có tên là screen_shot.png

Như vậy, mình sẽ kết thúc bài hướng dẫn đầu tiên ở đây. Xin chào và hẹn gặp lại các bạn!

Similar Posts

Subscribe
Notify of
guest
3 Bình luận
Inline Feedbacks
View all comments