Worker: vehicle_ultimate_r0_spider #88
Notifications
Total Time Spent: 27 minutes
kincses
27 minutes
No due date set.
Dependencies
No dependencies set.
Reference: kincses/service-finder#88
Reference in New Issue
Block a user
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Mérföldkő: EPIC 9: UltimateSpecs Pipeline Overhaul (Decoupled, Car & Moto Ready)
Cél: A Térképész (Kategória-tudatos Queue Builder) worker létrehozása, amely URL-eket gyűjt az UltimateSpecs-ről a alapján, és beszúrja az táblába.
🔗 Függőségek (Dependencies)
📝 Elemzés
A robot kivesz egy feldolgozatlan márkát/modellt a táblából, ellenőrzi a oszlopot, és eldönti, hogy autó (/car-specs/) vagy motor (/motorcycles-specs/) URL-eket kell gyűjtenie. Kétlépcsős drill-down szűréssel kigyűjti a konkrét .html adatlapokat, és beszúrja az táblába , állapottal, beállítva a megfelelő -t (car vagy motorcycle). A robotnak képesnek kell lennie a Cloudflare védelem megkerülésére és a reklámok szűrésére (Make+Model kötelező az URL-ben).
▶️ Munka megkezdve: 2026-03-18 08:45:29
✅ Munka befejezve: 2026-03-18 09:12:28
Technikai Összefoglaló:
A vehicle_ultimate_r0_spider robot sikeresen implementálva. A robot aszinkron Playwright böngészővel dolgozik, kivesz egy járművet a vehicle_model_definitions táblából, keres az UltimateSpecs oldalán, és a talált .html linkeket beszúrja az auto_data_crawler_queue táblába. A robot tartalmazza a specifikált JS szűrőt, kétlépcsős drill-down scrapinget, és megfelelő státusz frissítéseket. Tesztelve a Docker sf_api konténerben, működik.
⏱️ A ráfordított időt a Gitea rögzítette.
A 88-as számú Gitea issue ("Worker: vehicle_ultimate_r0_spider") sikeresen megvalósítva.
Elvégzett munkák:
Fájl létrehozása: Létrehoztam a
/opt/docker/dev/service_finder/backend/app/workers/vehicle/ultimatespecs/vehicle_ultimate_r0_spider.pyfájlt, amely tartalmazza a teljes robot logikát.Robot implementáció: A robot aszinkron Playwright böngészővel és SQLAlchemy-vel dolgozik, a következő funkciókkal:
vehicle.vehicle_model_definitionstáblábólFOR UPDATE SKIP LOCKEDzárolássalvehicle.auto_data_crawler_queuetáblába megfelelő mappinggelspider_dispatched,research_failed_empty,research_failed_network)JS szűrő: Pontosan a specifikációban megadott JavaScript kód implementálva, amely szigorú márka és modell szűrést végez a reklámok kiszűrésére.
Tesztelés: A robot sikeresen tesztelve lett a Docker
sf_apikonténerben. A teszt során egy DODGE W 200 jármű feldolgozva, UltimateSpecs keresés végrehajtva, és a státusz megfelelően frissítve.Dokumentáció: A technikai összefoglaló hozzáadva a
.roo/history.mdfájlhoz.Gitea lezárás: A 88-as issue lezárva a Gitea rendszerben a gitea_manager.py script segítségével.
A robot most készen áll a Producer-Consumer lánc első elemeként, hogy URL-eket gyűjtsön az UltimateSpecs-ről a következő scraper robotok számára.