checkpoint: DB baseline reset (v10) with perfect column order for n8n.

Integrated catalog_robot.py logic for structured data ingestion.
Updated models and documentation for the Robot Ecosystem.
This commit is contained in:
2026-02-14 15:31:56 +00:00
parent f38a75a025
commit bb02d4ed59
65 changed files with 4213 additions and 686 deletions

View File

@@ -14,4 +14,16 @@ Ez a dokumentáció a rendszer "Egyetlen Igazságforrása" (Single Source of Tru
- **Infrastruktúra:** Profibot SW1 (80 Core) - ÉLES.
- **Frontend:** Vue3 + Tailwind (Port 3000).
- **Backend:** FastAPI v2 (Port 8000).
- **Adatbázis:** PostgreSQL 15 (55 tábla, Seed adatokkal).
- **Adatbázis:** PostgreSQL 15 (55 tábla, Seed adatokkal).
# Master Book - Automotive Intelligence Ecosystem
Ez a dokumentáció a projekt technikai és üzleti felépítését tartalmazza.
## Projekt Célkitűzés
Egy európai szintű, intelligens járműipari ökoszisztéma kiépítése, amely egyesíti a mély járműkatalógus-adatokat (Deep Asset Catalog) és a hitelesített szervizkeresőt (Service Finder).
## Főbb Komponensek
- **Data Core:** 21,000+ rekordos járműadatbázis (Holland, USA, EU forrásokból).
- **Service Hunter:** n8n alapú, automatizált szerviz-felderítő rendszer.
- **Trust Engine:** Pontszám alapú validációs algoritmus az adatok hitelességének biztosítására.
- **Robot Ökoszisztéma:** Python alapú adatgyűjtő és öngyógyító (Auto-Heal) ágensek.

View File

@@ -9,4 +9,15 @@
## 🛡️ Hálózati Határok
- **Internal Net (`shared_db_net`):** A Backend és az Adatbázis közötti dedikált, zárt csatorna.
- **Public Net:** Csak a 80/443 (NPM) nyitott a világ felé. A DB port (5432) és Admin portok (5050, 8888) csak VPN-en vagy localhoston érhetők el.
- **Public Net:** Csak a 80/443 (NPM) nyitott a világ felé. A DB port (5432) és Admin portok (5050, 8888) csak VPN-en vagy localhoston érhetők el.
# 02. Architecture & System Context
## Rendszerarchitektúra v2.0
A rendszer egy eseményvezérelt, mikroszolgáltatás-alapú architektúrára épül, ahol az **n8n** tölti be a központi idegrendszer (Orchestrator) szerepét.
### Adatáramlási Folyamat
1. **Discovery Layer:** n8n által vezérelt robotok (Robot A) pásztázzák a hálót (OSM, DDG, FB, e-Cégközlöny).
2. **Staging Layer:** A nyers adatok egy átmeneti (Stage) táblába kerülnek további elemzésre.
3. **Audit Layer:** A validátor robot (Robot B) ellenőrzi az adószámokat, TEAOR kódokat és a digitális lábnyomot.
4. **Core Database:** Csak a Trust Engine által hitelesített adatok kerülnek az éles jármű- és szervizkatalógusba.

View File

@@ -10,4 +10,18 @@
| **Redis** | `redis:alpine` | 6379 | - | - |
## Hardening Terv
A `Host Port` oszlopban lévő portokat éles üzemben le kell venni (kivéve 80/443), és csak a
A `Host Port` oszlopban lévő portokat éles üzemben le kell venni (kivéve 80/443), és csak a
# 04. Infrastructure & Docker Stack
## Hardver Erőforrás
- **Szerver:** 128 GB RAM (High-Performance Node).
- **Kihasználtság cél:** Moduláris konténerek futtatása alacsony (5-10%) alapterhelés mellett, magas skálázhatósági tartalékkal.
## Docker Ökoszisztéma (Bővített)
A stack a következő konténereket tartalmazza:
1. **n8n (Orchestrator):** Vizuális munkafolyamat-kezelő.
2. **PostgreSQL:** Központi adattár (Járművek + Szervizek).
3. **Browserless (Chrome):** "Fej nélküli" böngésző az n8n számára a komplex scraping feladatokhoz.
4. **Python Robots:** Konténerizált adatgyűjtő és dúsító ágensek (v1.9.2+).
5. **Proxy/VPN Node:** IP-rotációt biztosító modul a globális felderítéshez.

View File

@@ -50,4 +50,27 @@ A keresőmotor prioritási rendszere:
## 4.0 Trust Score Multipliers
- **Economic Stability:** 3+ év nyereséges működés (+20 pont).
- **Physical Validation:** Google Street View / Robot Photo Verification (+15 pont).
- **Verified Staff:** Ha a szerelőregisztrációk száma > 2 (+10 pont).
- **Verified Staff:** Ha a szerelőregisztrációk száma > 2 (+10 pont).
# 20. Service Finder & Trust Engine
## Pre-searching (Silent Service Hunter) Logika
A cél a szervizek felderítése API költségek nélkül, kereszt-ellenőrzött forrásokból.
### 1. Felderítési Fázis (Hunter A)
Többmotoros keresés (DuckDuckGo Lite, Bing, Yandex, OSM) segítségével:
- **Kulcsszó-dorking:** `site:facebook.com "Dunakeszi" "szerviz"`.
- **Informális adatok:** Fórumok, blogok és helyi közösségi posztok elemzése.
- **TEAOR Mátrix:** Az e-Cégközlöny napi frissítéseinek szűrése (4520, 4540, 2920 kódok).
### 2. Validációs Pontrendszer (Trust Engine)
Minden talált entitás pontszámot kap:
- **+40 pont:** Aktív adószám és megfelelő TEAOR (4520/4540).
- **+20 pont:** Friss digitális jelenlét (Facebook/Instagram poszt < 30 nap).
- **+20 pont:** Fizikailag validált cím (OSM vagy lakossági megerősítés).
- **+10 pont:** Hívható, formátum-helyes telefonszám.
### 3. Döntési Szintek
- **80+ pont:** Ellenőrzött (Verified) - Automatikus publikálás.
- **40-79 pont:** Moderációra vár - Manuális adminisztrátori jóváhagyás szükséges.
- **<40 pont:** Elutasítva/Inaktív - Marad a Stage táblában.

View File

@@ -99,4 +99,15 @@ A Robot 2 három fázisban dolgozik:
- **Phase 2 (Deep Enrichment):** Google Places, Web Scraping (Email, telefon, tulajdonos neve).
- **Phase 3 (Financial Audit):** Nyilvános cégadatok (Árbevétel, létszám, adózott eredmény) éves szinkronizálása.
# 22. ROBOT ÖKOSZISZTÉMA
## Robot v1.9.2 (Ghost Commander) & n8n
A robotok és az n8n szoros együttműködésben dolgoznak.
### Funkciók
- **Auto-Heal:** A járműkatalógus hiányos (null) adatainak automatikus pótlása Holland (RDW) és US (NHTSA) forrásokból.
- **Ban-Detection:** Automatikus "Circuit Breaker" logika. Ha a CarQuery vagy más forrás tilt, a robot átvált "Silent Mode"-ba.
- **Event Hunter:** n8n workflow figyeli a motoros/autós találkozókat és eseményeket, majd összeköti őket a helyi szervizpartnerekkel.
- **Gamification Link:** A robot regisztrálja a felhasználói validálásokat és kiosztja a pontokat/krediteket.

View File

@@ -271,4 +271,4 @@ A rendszer egy magas biztonságú, mikroszolgáltatás-jellegű monolit (Modular
könyvtárszerkezetét Bash tree -I "node_modules|vendor|.git|dist|build|storage" -L 3
adatbázis szerkezet Bash docker exec -it shared-postgres pg_dump -U kincses -s service_finder > schema_dump.sq