Seleniumってご存知でしょうか?
簡単に、Seleniumを説明するとWeb操作を自動化してくれる仕組みです。なんと、あの面倒くさい、ブラウザ上での操作が自動化出来るんです。クリックや検索などをpythonで制御できるなんて夢のようです。
学んだことのアウトプットとして、Googleで特定企業の口コミの評価数と件数を取得する処理を作成してみました。
Seleniumを利用したブラウザ処理自動化のサンプルコード
処理の流れ
- テキストに記載されれている検索ワード情報を読み取る
- 読み取った検索ワードをリストに入れる
- リストの中の情報を取り出して、Googleで検索する
- 口コミ情報を取得する
- Googleで口コミ情報が表示されない企業はスキップ
- 結果をテキストファイルに保存
<strong>from selenium import webdriver
import time
out =""
with open("list.txt", "r",encoding="UTF-8") as tf:
lists = tf.read().split('\n')
driver = webdriver.Chrome()
for list in lists:
driver.get('https://www.google.com/')
kensaku_word = list
search = driver.find_element_by_name('q')
search.send_keys(kensaku_word)
search.submit()
time.sleep(2)
try :
element1 = driver.find_element_by_css_selector(".qrShPb.kno-ecr-pt.PZPZlf.mfMhoc")
print(element1.text) #debug
element2 = driver.find_element_by_class_name("Ob2kfd")
print(element2.text.replace('\n', ',')) #debug
out = out + element1.text + element2.text + "\n" + "=====================" + "\n"
except :
continue
with open("result.txt", "w",encoding="UTF-8") as f:
f.write(out)
driver.quit()
</strong>
Code language: PHP (php)
ほんと適当な処理ですが、
気になる企業の口コミ評価を一覧で取得出来ました。
Pythonすげぇなぁ