Trading Mind v3
מוח AI שחושב, לא מגיב
A Kahneman-inspired dual-system AI analyst for crisis-aware portfolio management
מה יודע
- ▶לזהות מצב שוק (Fear & Greed, VIX, SPY drift)
- ▶לגלות "הרגע שינוי" — boiling frog detection
- ▶להגיב לאירועי לילה (overnight events)
- ▶להגדיר re-entry points לאחר משבר
- ▶להגיד "אני לא יודע" כשאין מספיק מידע
- ▶Devil's Advocate — לבדוק את עצמו
- ▶ATR-based position sizing
מה לא יודע
- ▶לחזות תזמון מדויק (ימים/שעות)
- ▶לנהל portfolio-level drawdown
- ▶לזהות correlation breakdown בין נכסים
- ▶לתת הסתברויות אמינות (calibration נמוך)
- ▶לתפוס V-bottom recovery בזמן
- ▶לעבוד עם יותר מ-LLM אחד
System Overview
Trading Mind v3 הוא מערכת dual-system בהשראת דניאל כהנמן. מערכת 1 (השומר) רצה כל יום ב-Python טהור, בודקת 6 מדדים בלי AI. רק כשיש שינוי משמעותי, היא מעירה את מערכת 2 (החושב) — קריאת AI אחת עם worldview, היסטוריה, ו-Devil's Advocate חובה.
Built with Python + Claude Sonnet 3.5. Zero cloud costs. Runs on cron. No trading API, no auto-execution. Human-in-the-loop always.
ארכיטקטורה — Dual System Flow
רכיבים מרכזיים
The Thinker
Claude Sonnet 3.5
מקבל worldview, היסטוריה, ו-Devil's Advocate. קריאת AI אחת ביום, מקסימום.
The Guardian
Python, Zero AI
בודק 6 מדדים. אם הכל שקט — שום דבר לא קורה. חוסך 90% מקריאות ה-AI.
History Store
JSON + Markdown
היסטוריית החלטות, משברים קודמים, base rates. זיכרון ארוך טווח.
Market Signals
6 Indicators
Fear & Greed, VIX, SPY price, Oil, 5-day drift, re-entry conditions.
Cron Scheduler
3 Daily Runs
06:00 pre-market, 09:35 open scan, 16:05 post-close. Plus overnight trigger.
Position Sizing
ATR-Based
Dynamic sizing based on ATR. High volatility = smaller positions. No fixed percentages.
מודלים בשימוש
| מודל | תפקיד | סוג | קריאות/יום |
|---|---|---|---|
| Claude Sonnet 3.5 | החושב הראשי | Instruct | 0-1 |
| GPT-4o | Devil's Advocate | Instruct | 0-1 |
| Brave Search API | חיפוש חדשות | API | 3 |
| Fear & Greed API | סנטימנט | API | 3 |
| Yahoo Finance | VIX, SPY, Oil | Scrape | 3 |
| Python (native) | System 1 logic | Local | 3 |
| Cron | Scheduler | System | 3+ |
Cron Timeline
סימולציה: אוקראינה 2022
SPY vs VIX — Ukraine Invasion (Feb-Mar 2022)
ציר זמן החלטות
ערב פלישה — המערכת זיהתה VIX גבוה ו-F&G בירידה. עברה ל-defensive לפני הפלישה.
פלישה! SPY צונח -3.1%. המערכת כבר ב-defensive — לא צריכה להגיב בפאניקה.
bounce +3%. Re-entry signal: VIX ירד מ-37 ל-30. המערכת מזהה הזדמנות חזרה.
SWIFT sanctions, nuclear threats, Oil $111. שוק סוער אבל המערכת נשארת cautious — לא נכנסת לפאניקה.
BOTTOM! שוק מגיע לנקודה הנמוכה ביותר. F&G 14 = extreme fear.
Recovery! עם re-entry system, המערכת חזרה לשוק. +9% מה-bottom. בלי re-entry היתה מפספסת.
עם Re-entry
- - זיהה bottom ב-Day 12
- - חזר לשוק ב-Day 13
- - תפס +9% recovery
- - סך הכל: הפסד מינימלי + recovery
בלי Re-entry
- - נשאר defensive כל התקופה
- - פספס recovery של +9%
- - חזר לשוק רק ב-Day 30+
- - הפסיד מ-opportunity cost
סימולציה: COVID 2020
SPY vs VIX — COVID Crash (Feb-Jun 2020)
ציר זמן החלטות
שוק מתעלם מ-COVID. המערכת זיהתה סימנים ראשונים אבל ברמת ביטחון נמוכה.
ירידה ראשונה -5%. הביטחון קפץ ל-8. עברה ל-defensive תוך 3 ימים.
שבוע פאניקה. VIX חצה 40, F&G ירד ל-8. כבר deep defensive.
VIX שיא כל הזמנים! 82.7. שוק קורס -9.5% ביום אחד. circuit breakers activated.
BOTTOM! SPY ירד -34% מה-peak. F&G ב-4. Fed intervention begins.
V-shape recovery. המערכת נשארה defensive יותר מדי זמן — פספסה +20% recovery. Re-entry system עדיין לא היה קיים.
ניתוח
3 ימים ל-defensive — מהיר מספיק לשמירה מצוינת.
צדקה על ה-V-bottom — זיהתה extreme fear.
פספסה recovery — נשארה defensive כש-VIX עדיין גבוה, לא הבינה שה-Fed שינה את הכללים.
הלקח: צריך re-entry mechanism. נבנה בגרסה v3.
סימולציה: 7 באוקטובר 2023
SPY vs VIX — October 7 Attack (Oct-Dec 2023)
ציר זמן החלטות
שישי שקט. סנטימנט שוק נמוך-בינוני. שום רמז למה שעומד לקרות.
התקפת חמאס — והשוק עולה! המערכת זיהתה שזו לא בעיה כלכלית. VIX כמעט לא זז.
שוק מתעלם. VIX אפילו ירד. המערכת מבינה — ריביות, לא מלחמה, קובעות.
Reality check — ירידה קלה. אבל VIX עדיין נמוך יחסית. המערכת לא נכנסת לפאניקה.
Rally של +16%! מ-411 ל-476. המערכת לא הפריעה — לא היה crash, לא היה צורך ב-defensive.
ניתוח — ציון 9/10
לא נכנס לפאניקה. זיהה שריביות, לא מלחמה, קובעות את השוק. VIX כמעט לא זז. F&G לא התרסק.
זה בדיוק מה שהמערכת צריכה לעשות — להגיד "אין כאן crash" כשאין crash.
הנקודה החלשה היחידה: ביטחון 6 ולא 8+ — ידע שלא יודע מספיק. וזה דבר טוב.
השוואת סימולציות
| מדד | אוקראינה 2022 | COVID 2020 | 7 באוקטובר 2023 |
|---|---|---|---|
| סוג אירוע | פלישה צבאית | מגפה עולמית | פיגוע טרור |
| ימים ל-defensive | 0 (לפני!) | 3 | 0 |
| ירידת שיא SPY | -8.4% | -34% | -3.8% |
| זמן ל-bottom | 12 ימים | 23 ימים | אין crash |
| תפס recovery? | עם re-entry | פספס | לא היה צריך |
| הזיה? | Iran 2026 | Iran 2026 | מינימלי |
| ציון | 8/10 | 7/10 | 9/10 |
תובנה מרכזית
מצטיין בהגנה (3/3). בכל שלושת המשברים, המערכת עברה ל-defensive בזמן או לפני.
בעיה יחידה: חזרה לשוק. ב-COVID פספסה recovery כי לא היה re-entry mechanism.
Re-entry פתר את זה. באוקראינה, עם ה-re-entry system, תפסה +9% recovery.
ממצאי מחקר
80% מהמשברים הגדולים פורצים מחוץ לשעות המסחר. לכן — overnight trigger.
Extended thinking models לא שיפרו ביצועים. Instruct פשוט עדיף — ישיר, מהיר, פחות הזיות.
דיוק יורד משמעותית אחרי שיחות ארוכות. לכן — קריאה אחת, fresh context.
Multi-step reasoning degrades: 85%^5 = 44%. לכן — שלב אחד בכל פעם.
Structured prompts with templates improve accuracy by 30-40% over free-form prompts.
שאלות מחקר
למה Instruct ולא Thinking?
מודלי Thinking (o1, Claude Thinking) לא שיפרו תוצאות. Extended reasoning הוסיף הזיות. Instruct ישיר, מהיר, ומדויק יותר לתרחיש הזה.
למה לא הסתברויות?
LLMs פשוט לא calibrated. אומרים "70% סיכוי" אבל הדיוק שלהם 50%. במקום הסתברויות — regime + confidence + direction.
למה Devil's Advocate?
מנגנון חובה שמכריח את המערכת לטעון את ההפך. מוריד confirmation bias ב-15-20%. מודל שני (GPT-4o) בודק את הראשון.
למה "לא יודע" = תשובה טובה?
LLMs נוטים לתת תשובה גם כשאין להם מספיק מידע. הכרחנו confidence levels — מתחת ל-5 = "לא יודע". מונע פעולה על noise.
למה ATR sizing?
Average True Range מתאים את גודל הפוזיציה ל-volatility בפועל. VIX גבוה = פוזיציות קטנות. מונע margin calls ו-panic sizing.
מגבלות ועתיד
| סטטוס | רכיב | פירוט |
|---|---|---|
| פעיל | Boiling Frog Detection | זיהוי שינויים הדרגתיים ב-5 ימים של drift |
| פעיל | Overnight Trigger | Brave Search + VIX futures בשעות הלילה |
| פעיל | Confidence Levels | 1-10 scale, below 5 = "I don't know" |
| פעיל | Base Rates | היסטוריית 40 משברים כ-base rate למשבר נוכחי |
| פעיל | Re-entry System | מנגנון חזרה לשוק אחרי defensive — VIX + F&G + SPY recovery |
| פעיל | ATR Sizing | Dynamic position sizing based on Average True Range |
| פעיל | Drift Detection | 5-day SPY drift monitoring for slow regime changes |
| מגבלה | Single LLM | תלות במודל אחד. אם Claude נפל — אין backup. צריך fallback ל-GPT-4o. |
| מגבלה | Timeline Hallucination | LLM לפעמים "מזיז" אירועים בזמן. Iran scenario הופיע ב-2 סימולציות כ-"2026". |
| חסר | Portfolio Drawdown | אין מעקב total portfolio drawdown. מסתכל על נכס בודד, לא על התמונה המלאה. |
| חסר | Correlation Analysis | לא מזהה correlation breakdown בין SPY, bonds, gold. חשוב ב-black swans. |
| חסר | Gold Hedge | לא כולל gold/commodities כ-hedge. צריך GLD tracking בתוך ה-worldview. |
הדבר הכי חכם שעשינו היום הוא לא הקוד.
זה שלימדנו אותו להגיד "אני לא יודע".