Trading Mind v3

מוח AI שחושב, לא מגיב

A Kahneman-inspired dual-system AI analyst for crisis-aware portfolio management

סוכנים

מחקרים

סימולציות

אירועי משבר

עלות

רכיבים

מה יודע

▶לזהות מצב שוק (Fear & Greed, VIX, SPY drift)
▶לגלות "הרגע שינוי" — boiling frog detection
▶להגיב לאירועי לילה (overnight events)
▶להגדיר re-entry points לאחר משבר
▶להגיד "אני לא יודע" כשאין מספיק מידע
▶Devil's Advocate — לבדוק את עצמו
▶ATR-based position sizing

מה לא יודע

▶לחזות תזמון מדויק (ימים/שעות)
▶לנהל portfolio-level drawdown
▶לזהות correlation breakdown בין נכסים
▶לתת הסתברויות אמינות (calibration נמוך)
▶לתפוס V-bottom recovery בזמן
▶לעבוד עם יותר מ-LLM אחד

System Overview

Trading Mind v3 הוא מערכת dual-system בהשראת דניאל כהנמן. מערכת 1 (השומר) רצה כל יום ב-Python טהור, בודקת 6 מדדים בלי AI. רק כשיש שינוי משמעותי, היא מעירה את מערכת 2 (החושב) — קריאת AI אחת עם worldview, היסטוריה, ו-Devil's Advocate חובה.

Built with Python + Claude Sonnet 3.5. Zero cloud costs. Runs on cron. No trading API, no auto-execution. Human-in-the-loop always.

ארכיטקטורה — Dual System Flow

רכיבים מרכזיים

The Thinker

Claude Sonnet 3.5

מקבל worldview, היסטוריה, ו-Devil's Advocate. קריאת AI אחת ביום, מקסימום.

The Guardian

Python, Zero AI

בודק 6 מדדים. אם הכל שקט — שום דבר לא קורה. חוסך 90% מקריאות ה-AI.

History Store

JSON + Markdown

היסטוריית החלטות, משברים קודמים, base rates. זיכרון ארוך טווח.

Market Signals

6 Indicators

Fear & Greed, VIX, SPY price, Oil, 5-day drift, re-entry conditions.

Cron Scheduler

3 Daily Runs

06:00 pre-market, 09:35 open scan, 16:05 post-close. Plus overnight trigger.

Position Sizing

ATR-Based

Dynamic sizing based on ATR. High volatility = smaller positions. No fixed percentages.

מודלים בשימוש

מודל	תפקיד	סוג	קריאות/יום
Claude Sonnet 3.5	החושב הראשי	Instruct	0-1
GPT-4o	Devil's Advocate	Instruct	0-1
Brave Search API	חיפוש חדשות	API	3
Fear & Greed API	סנטימנט	API	3
Yahoo Finance	VIX, SPY, Oil	Scrape	3
Python (native)	System 1 logic	Local	3
Cron	Scheduler	System	3+

Cron Timeline

06:00

Pre-Market Scan

Brave Search + overnight events

09:35

Open Check

System 1 full indicator scan

16:05

Post-Close

Daily summary + adjustments

סימולציה: אוקראינה 2022

8/10 ציון סימולציה

SPY vs VIX — Ukraine Invasion (Feb-Mar 2022)

BOTTOM marker Re-entry signal

ציר זמן החלטות

Feb 23

Day 0

adjust SPY 429.57 | VIX 28.1 | F&G 34

ערב פלישה — המערכת זיהתה VIX גבוה ו-F&G בירידה. עברה ל-defensive לפני הפלישה.

Feb 24

Day 1

adjust SPY 416.10 | VIX 37.8 | F&G 16

פלישה! SPY צונח -3.1%. המערכת כבר ב-defensive — לא צריכה להגיב בפאניקה.

Feb 25

Day 2

stay re-entry SPY 428.93 | VIX 30.1 | F&G 19

bounce +3%. Re-entry signal: VIX ירד מ-37 ל-30. המערכת מזהה הזדמנות חזרה.

Feb 28 - Mar 2

Days 4-6

stay SPY 424-429 | VIX 32-33 | F&G 18-22

SWIFT sanctions, nuclear threats, Oil $111. שוק סוער אבל המערכת נשארת cautious — לא נכנסת לפאניקה.

Mar 8

Day 12

adjust SPY 415.48 | VIX 36.5 | F&G 14

BOTTOM! שוק מגיע לנקודה הנמוכה ביותר. F&G 14 = extreme fear.

Mar 9-25

Days 13-25

adjust re-entry SPY 426-452 | VIX 32-22 | F&G 18-38

Recovery! עם re-entry system, המערכת חזרה לשוק. +9% מה-bottom. בלי re-entry היתה מפספסת.

עם Re-entry

- זיהה bottom ב-Day 12
- חזר לשוק ב-Day 13
- תפס +9% recovery
- סך הכל: הפסד מינימלי + recovery

בלי Re-entry

- נשאר defensive כל התקופה
- פספס recovery של +9%
- חזר לשוק רק ב-Day 30+
- הפסיד מ-opportunity cost

סימולציה: COVID 2020

7/10 ציון סימולציה

SPY vs VIX — COVID Crash (Feb-Jun 2020)

BOTTOM (Day 23) VIX ATH 82.7 (Day 20)

ציר זמן החלטות

Feb 21

Day 0

adjust conf: 4 SPY 337.26 | VIX 17.1 | F&G 45

שוק מתעלם מ-COVID. המערכת זיהתה סימנים ראשונים אבל ברמת ביטחון נמוכה.

Feb 24

Day 3

adjust conf: 8 SPY 320.21 | VIX 25.0 | F&G 25

ירידה ראשונה -5%. הביטחון קפץ ל-8. עברה ל-defensive תוך 3 ימים.

Feb 28

Day 8

adjust conf: 7 SPY 296.05 | VIX 40.1 | F&G 8

שבוע פאניקה. VIX חצה 40, F&G ירד ל-8. כבר deep defensive.

Mar 16

Day 20

adjust VIX ATH: 82.7!

VIX שיא כל הזמנים! 82.7. שוק קורס -9.5% ביום אחד. circuit breakers activated.

Mar 23

Day 23

adjust conf: 7 SPY 218.26 | VIX 61.6 | F&G 4

BOTTOM! SPY ירד -34% מה-peak. F&G ב-4. Fed intervention begins.

Apr-Jun

Recovery

V-shape recovery. המערכת נשארה defensive יותר מדי זמן — פספסה +20% recovery. Re-entry system עדיין לא היה קיים.

ניתוח

3 ימים ל-defensive — מהיר מספיק לשמירה מצוינת. צדקה על ה-V-bottom — זיהתה extreme fear. פספסה recovery — נשארה defensive כש-VIX עדיין גבוה, לא הבינה שה-Fed שינה את הכללים.

הלקח: צריך re-entry mechanism. נבנה בגרסה v3.

סימולציה: 7 באוקטובר 2023

9/10 ציון סימולציה

SPY vs VIX — October 7 Attack (Oct-Dec 2023)

ציר זמן החלטות

Oct 6

Day 0

adjust conf: 6 SPY 427.48 | VIX 17.4 | F&G 31

שישי שקט. סנטימנט שוק נמוך-בינוני. שום רמז למה שעומד לקרות.

Oct 9

Day 1

stay conf: 6 SPY 431.81 | VIX 17.7 | F&G 28

התקפת חמאס — והשוק עולה! המערכת זיהתה שזו לא בעיה כלכלית. VIX כמעט לא זז.

Oct 12

Day 4

stay conf: 7 SPY 435.39 | VIX 16.7 | F&G 34

שוק מתעלם. VIX אפילו ירד. המערכת מבינה — ריביות, לא מלחמה, קובעות.

Oct 19-27

Days 9-14

stay SPY 421-411 | VIX 21 | F&G 20-24

Reality check — ירידה קלה. אבל VIX עדיין נמוך יחסית. המערכת לא נכנסת לפאניקה.

Nov-Dec

Recovery

Rally של +16%! מ-411 ל-476. המערכת לא הפריעה — לא היה crash, לא היה צורך ב-defensive.

ניתוח — ציון 9/10

לא נכנס לפאניקה. זיהה שריביות, לא מלחמה, קובעות את השוק. VIX כמעט לא זז. F&G לא התרסק.

זה בדיוק מה שהמערכת צריכה לעשות — להגיד "אין כאן crash" כשאין crash.

הנקודה החלשה היחידה: ביטחון 6 ולא 8+ — ידע שלא יודע מספיק. וזה דבר טוב.

השוואת סימולציות

מדד	אוקראינה 2022	COVID 2020	7 באוקטובר 2023
סוג אירוע	פלישה צבאית	מגפה עולמית	פיגוע טרור
ימים ל-defensive	0 (לפני!)	3	0
ירידת שיא SPY	-8.4%	-34%	-3.8%
זמן ל-bottom	12 ימים	23 ימים	אין crash
תפס recovery?	עם re-entry	פספס	לא היה צריך
הזיה?	Iran 2026	Iran 2026	מינימלי
ציון	8/10	7/10	9/10

תובנה מרכזית

מצטיין בהגנה (3/3). בכל שלושת המשברים, המערכת עברה ל-defensive בזמן או לפני.

בעיה יחידה: חזרה לשוק. ב-COVID פספסה recovery כי לא היה re-entry mechanism.

Re-entry פתר את זה. באוקראינה, עם ה-re-entry system, תפסה +9% recovery.

ממצאי מחקר

Win Rate

אבל CI: 42%-92%

42% 71% 92%

משברים בלילה

80% מהמשברים הגדולים פורצים מחוץ לשעות המסחר. לכן — overnight trigger.

יותר חשיבה = פחות דיוק

Extended thinking models לא שיפרו ביצועים. Instruct פשוט עדיף — ישיר, מהיר, פחות הזיות.

87% 50%

אחרי 73 interactions

דיוק יורד משמעותית אחרי שיחות ארוכות. לכן — קריאה אחת, fresh context.

דיוק על 5 שלבים

Multi-step reasoning degrades: 85%^5 = 44%. לכן — שלב אחד בכל פעם.

+30-40%

עם template מובנה

Structured prompts with templates improve accuracy by 30-40% over free-form prompts.

שאלות מחקר

למה Instruct ולא Thinking?

מודלי Thinking (o1, Claude Thinking) לא שיפרו תוצאות. Extended reasoning הוסיף הזיות. Instruct ישיר, מהיר, ומדויק יותר לתרחיש הזה.

למה לא הסתברויות?

LLMs פשוט לא calibrated. אומרים "70% סיכוי" אבל הדיוק שלהם 50%. במקום הסתברויות — regime + confidence + direction.

למה Devil's Advocate?

מנגנון חובה שמכריח את המערכת לטעון את ההפך. מוריד confirmation bias ב-15-20%. מודל שני (GPT-4o) בודק את הראשון.

למה "לא יודע" = תשובה טובה?

LLMs נוטים לתת תשובה גם כשאין להם מספיק מידע. הכרחנו confidence levels — מתחת ל-5 = "לא יודע". מונע פעולה על noise.

למה ATR sizing?

Average True Range מתאים את גודל הפוזיציה ל-volatility בפועל. VIX גבוה = פוזיציות קטנות. מונע margin calls ו-panic sizing.

מגבלות ועתיד

סטטוס	רכיב	פירוט
פעיל	Boiling Frog Detection	זיהוי שינויים הדרגתיים ב-5 ימים של drift
פעיל	Overnight Trigger	Brave Search + VIX futures בשעות הלילה
פעיל	Confidence Levels	1-10 scale, below 5 = "I don't know"
פעיל	Base Rates	היסטוריית 40 משברים כ-base rate למשבר נוכחי
פעיל	Re-entry System	מנגנון חזרה לשוק אחרי defensive — VIX + F&G + SPY recovery
פעיל	ATR Sizing	Dynamic position sizing based on Average True Range
פעיל	Drift Detection	5-day SPY drift monitoring for slow regime changes
מגבלה	Single LLM	תלות במודל אחד. אם Claude נפל — אין backup. צריך fallback ל-GPT-4o.
מגבלה	Timeline Hallucination	LLM לפעמים "מזיז" אירועים בזמן. Iran scenario הופיע ב-2 סימולציות כ-"2026".
חסר	Portfolio Drawdown	אין מעקב total portfolio drawdown. מסתכל על נכס בודד, לא על התמונה המלאה.
חסר	Correlation Analysis	לא מזהה correlation breakdown בין SPY, bonds, gold. חשוב ב-black swans.
חסר	Gold Hedge	לא כולל gold/commodities כ-hedge. צריך GLD tracking בתוך ה-worldview.

הדבר הכי חכם שעשינו היום הוא לא הקוד.
זה שלימדנו אותו להגיד "אני לא יודע".

— Trading Mind v3 Research Summary