Bartosz ręcznie piramidował pozycje z trendem (dokładał do wygrywającej pozycji, nie uśredniał w dół), używał stop-limitów i zarabiał na dużych ruchach. Pomysł: zsystematyzować to i połączyć z drugą strategią — siatką (grid) — pod jednym, zaprojektowanym matematycznie zarządzaniem pozycją i kapitałem.
Pytanie tej strony jest węższe i fundamentalne: czy te dwie rzeczy da się opisać jednym wzorem na wielkość pozycji? Bo jeśli tak — nie budujemy dwóch botów i przełącznika, tylko jeden regulator, a reżim rynku (trend vs bok) wpada do niego jako wejście.
Zanim je połączymy, trzeba zobaczyć, że mają przeciwne profile:
| Piramida „z trendem" | Siatka / DCA „pod prąd" | |
|---|---|---|
| Dokłada gdy… | cena idzie za pozycją (do wygrywającej) | cena idzie przeciw (uśrednia w dół) |
| Skośność* | dodatnia — małe straty, rzadkie duże wygrane | ujemna — częste małe zyski, rzadka ruina |
| Zarabia w… | trendzie (dużym ruchu) | boku (chop, mikro-oscylacje) |
| Ginie na… | boku (cięcia stopem zjadają) | trendzie (martyngał → likwidacja) |
* Skośność = asymetria wyników. „Dodatnia" znaczy: większość transakcji to drobne straty, a zarobek robi kilka wielkich wygranych (Twój ręczny track record ma ten podpis). „Ujemna" = odwrotnie: dużo drobnych zysków i rzadki, niszczący ogon strat. Wypukłość (convexity) to to samo widziane od strony wykresu zysku: zysk piramidy rośnie szybciej niż liniowo wraz z wielkością ruchu.
Wniosek: piramida i grid są lustrzanie komplementarne — jedna żyje z trendu, druga z boku. To jest matematyczne sedno pomysłu „połączyć": gdyby ich zyski były ujemnie skorelowane, razem dałyby gładszą krzywą kapitału niż każda osobno.
Wczoraj powiedziałem: „jedno gotowe prawo (Gârleanu–Pedersen) wchłania piramidę i grid jako przypadki szczególne". Sceptyk z researchu mnie złapał. To nadużycie. Trzy konkretne miejsca, gdzie chciałem, by prace mówiły więcej, niż mówią:
Wzór Gârleanu–Pedersen ma jeden sygnał z jakimś znakiem i tempem zaniku. Czy wychodzi gonienie trendu, czy powrót do średniej, zależy od znaku sygnału — nie od osobnego trybu „piramida" albo „grid". Mapowanie „trwały sygnał = piramida, wracający = grid" to moja nakładka, nie ich twierdzenie.
Gârleanu–Pedersen zakładają koszt kwadratowy (im większą transakcję pchasz naraz, tym drożej — model wpływu na rynek). To daje gładkie dosuwanie pozycji i brak pasma „nie handluj". Klasyczna siatka to z kolei dyskretne progi — czyli właśnie pasmo bez handlu — a to wymaga kosztu proporcjonalnego (spread / prowizja). Autorzy sami piszą o swojej strategii:
Czyli: jedno prawo G–P nie wchłania grida — bo grid mieszka w innym reżimie kosztu.
Wypukłość piramidy (duże ruchy zarabiają nieproporcjonalnie więcej) pochodzi z reguły wejścia/stopu — „tnij stratne szybko, jedź zyskowne" — a nie z wagi w gładkim wzorze na pozycję. Sam regulator wielkości pozycji tej wypukłości nie wytworzy. To inna matematyka, doklejana osobno.
Uczciwa, słabsza, ale wdrażalna forma. Pozycja docelowa plus pasmo histerezy:
| Symbol | Po ludzku |
|---|---|
| μ_net | przewidywany zysk po kosztach z transakcji w tym momencie (w punktach bazowych, ze znakiem). To wyjście naszego modelu [3], który czyta kształt książki zleceń. |
| σ² | zmienność (ryzyko) tego zysku na horyzoncie sygnału. Dzielimy przez nią, bo przy większym ryzyku bierzemy mniejszą pozycję. |
| κ (kappa) | ułamek Kelly'ego — jak agresywnie obstawiać. Start 0.1–0.25, nigdy 0.5: przy cienkiej i niepewnej przewadze przeszacowane μ = nadmiar dźwigni. |
| clip(…, ±π_max) | twardy limit pozycji — nigdy więcej niż π_max, choćby wzór kazał. |
| pasmo h | histereza: ruszamy pozycję dopiero, gdy korzyść przewyższa koszt prowizji. W środku pasma siedzimy bez ruchu. |
Krótko: im mocniejszy i pewniejszy sygnał (μ duże, σ małe), tym większa pozycja — ale tylko do limitu, i tylko gdy opłaca się ją zmienić mimo prowizji.
Sygnał trwały i tego samego znaku: μ_net trzyma znak przez wiele kroków → cel π* rośnie w jedną stronę → kolejne dosunięcia do krawędzi pasma = dokładanie z trendem.
Tu dorzucamy stop (regułę wejścia) — to on daje wypukłość; sam wzór jej nie da.
Sygnał wracający: μ_net zmienia znak wokół wartości godziwej → cel π* oscyluje wokół zera → handel do krawędzi pasma po obu stronach = siatka.
Tu bez stopu i bez dokładania w dół — pasmo samo ogranicza akumulację i chroni przed ruiną DCA.
To samo prawo, dwa zachowania. Reżim rynku nie jest zakodowany jako przełącznik — wpada jako wejście (przez to, co robi μ_net). To jest ta uczciwa, ugruntowana część „łączenia".
Przy koszcie transakcji nie skaczesz od razu na idealną pozycję — dosuwasz się do niej częściowo każdego kroku. Cel („aim") to nie chwilowy ideał, lecz ważona średnia dzisiejszego i przyszłych ideałów — bo skoro i tak dochodzisz powoli, opłaca się celować tam, gdzie sygnał będzie. Trwały sygnał dostaje większą wagę (warto go gonić długo), szybko gasnący — mniejszą (zniknie, zanim dojdziesz). Im wyższy koszt, tym wolniej się dosuwasz. Ważne: ten model zakłada koszt kwadratowy → gładko, bez pasma „nie rusz".
Gdy koszt jest proporcjonalny (spread/prowizja — nasz przypadek u makera), optymalnie jest zostawić strefę bez handlu wokół celu: nic nie rób w środku, a gdy cena z niej wyjdzie — handluj tylko do krawędzi, nie do środka. Szerokość pasma rośnie jak pierwiastek sześcienny z kosztu (koszt^⅓) — większy koszt, szersze pasmo, rzadziej ruszasz pozycję.
Optymalna wielkość = przewaga podzielona przez ryzyko (μ/σ²). Ale obstawiamy ułamek tego (κ = 0.1–0.5), bo wynik jest skrajnie wrażliwy na błąd w oszacowaniu przewagi: błąd w μ szkodzi ~20× bardziej niż błąd w zmienności. Obstawianie podwójnego Kelly'ego sprowadza wzrost kapitału do zera. Przy cienkiej przewadze — trzymaj κ nisko i limit wąsko, aż przewaga się udowodni.
Zysk strategii trendowej rośnie z kwadratem wielkości ruchu — stąd dodatnia skośność i „opcyjny" profil (małe straty, rzadkie duże zyski). Kluczowe: ta wypukłość bierze się z reguły tnij-stratne / jedź-zyskowne, a nie z samej wagi pozycji. Dlatego w naszym prawie stop jest osobnym, koniecznym składnikiem.
Cała ta matematyka jest na skali dni–miesięcy (akcje, kontrakty). Nasz przypadek — BTC, sekundy, koszt 3/9 punktów bazowych — jest poza nią. Kolejność testów na danych:
Oznaczam uczciwie status każdej pracy: czy otworzyłem ją u źródła, czy to recenzja, czy preprint.
| Praca | Co z niej bierzemy | Status |
|---|---|---|
| Gârleanu & Pedersen, „Dynamic Trading with Predictable Returns and Transaction Costs", Journal of Finance 2013 | dosuwanie do celu, ważenie sygnału trwałością, koszt kwadratowy → brak pasma | recenzowane tekst potwierdzony (wersja robocza NBER), cytat dosłowny |
| Guasoni & Muhle-Karbe, „Portfolio Choice with Transaction Costs: a User's Guide" (+ Davis–Norman, Constantinides) | pasmo „nie rusz", szerokość ~koszt^⅓, handel do krawędzi | preprint/klasyka wzór potwierdzony; pełne dowody z przeglądów |
| MacLean, Thorp & Ziemba, „Good and bad properties of the Kelly criterion" | ułamkowy Kelly, czemu nie pełny, wrażliwość na błąd μ (20:2:1) | źródło pierwotne przeczytane u źródła |
| Dao, …, Bouchaud i in., „Tail protection for long investors: Trend convexity at work" (2016) | wypukłość trendu rośnie z kwadratem ruchu; pochodzi z reguły stopu | preprint (arXiv) wzory potwierdzone w PDF, nie recenzowane |