docker-compose.yml
version: "3.7"
services:
  chrome:
    image: selenium/standalone-chrome
    shm_size: 256m
  backend:
    build:
      context: ./backend
    working_dir: /app
    volumes:
      - ./backend:/app
    command: ash -c "tail -f README.md"
rails c doit seulement être possible, donc command est tail -f pour que le backend ne se termine pas même si docker-compose up
Après cela, entrez avec une commande comme docker exec -it backend_1 ash.
models/concerns/chromeable.rb
require "selenium-webdriver"
require "capybara"
module Chromeable
  extend ActiveSupport::Concern
  DOCKER_CHROME_SELENIUM_HOST_NAME = "chrome"
  Capybara.register_driver :chrome do |app|
    args = %w[
      --headless
      --disable-gpu
      --window-size=1280,800
      --blink-settings=imagesEnabled=false
    ]
    caps =
      Selenium::WebDriver::Remote::Capabilities.chrome(
        "goog:chromeOptions" => {
          args: args,
          prefs: {
            credentials_enable_service: false,
            profile: { password_manager_enabled: false }
          }
        }
      )
    Capybara::Selenium::Driver.new(
      app,
      browser: :remote,
      desired_capabilities: caps,
      url: "http://#{DOCKER_CHROME_SELENIUM_HOST_NAME}:4444/wd/hub"
    )
  end
  included {}
  module ClassMethod; end
  def create_session
    session = Capybara::Session.new(:chrome)
    if block_given?
      begin
        yield session
      ensure
        session&.driver&.quit
      end
    else
      session
    end
  end
end
Créez un problème qui peut appeler le service chrome de docker-compose comme ceci, recherchez Jaran et prenez celui avec` / ([\ d,] +) yen / ʻ dans le nom du plan affiché. Et enregistrez-le dans la base de données.
Faites ceci jusqu'à la dernière page.
models/Jalan.rb
class Jalan < ApplicationRecord
  class Crawler
    include Chromeable
    def ensure_session
      @session = create_session
      session.visit "https://www.jalan.net/uw/uwp2011/uww2011init.do?keyword=%83N%83I%83J%81%5B%83h&distCd=06&rootCd=7701&screenId=FWPCTOP&image1.x=11&image1.y=13"
      session.select "1", from: "adultNum"
      session.click_on "recherche"
      yield
    ensure
      session&.driver&.quit
    end
    ...
  end 
end
Jalan.group(:value).count
=> {3000=>201, 4000=>15, 5000=>37, 6000=>3, 7000=>2, 7700=>2, 8000=>1, 10000=>3, 30000=>2}
Il y a du bruit, mais ...
Je ne sais pas ce que dit un hôtel de 50 000 yens avec une carte de 30 000 yens. La carte-cadeau JCB de 10000 yens semble être beaucoup plus facile à utiliser que la carte quo.
Recommended Posts