>>>BETFAN - BONUS 200% do 400 ZŁ <<<<
>>> BETCLIC - ZAKŁAD BEZ RYZYKA DO 50 ZŁ + GRA BEZ PODATKU!<<<
>>> FUKSIARZ - 3 PROMOCJE NA START! ODBIERZ 1060 ZŁ<<<

Statystyczna analiza danych. Cel: znaleźć edge!

kosa248 456

kosa248

Użytkownik
Nastąpiły małe zmiany. W Belgii 2 brakuje minut przy żółtych kartkach, więc zmieniam ją na Turcję 2. Problem z kartkami jest także Tunezji, więc za nią wchodzi Katar.
Anglia 1
Anglia 2
Anglia 3 ..........................bryc123
Australia 1 ......................Jobdzik
Cypr 1
Egipt 1
Francja 1 ........................dominaspn
Francja 2 ........................dominaspn
Grecja 1 .........................PabloZet
Grecja 2 .........................kosa248
Hiszpania 1
Hiszpania 2
Izrael 1 ...........................kosa248
Katar ..............................kosa248
Maroko 1 .........................aislinnek
Meksyk 1 .........................PabloZet
Portugalia 1 ......................PabloZet
Portugalia 2 ......................kosa248
RPA 1 ..............................dominaspn
Szkocja 1 .........................bryc123
Szkocja 2..........................bryc123
Walia 1
Włochy 1 ..........................Jobdzik
Włochy 2 ..........................Jobdzik
15.01 Belgia 1 ...................Unleash
15.01 Chile 1
15.01 Holandia 1 ................Unleash
15.01 Holandia 2 ................Unleash
16.01 Boliwia 1
16.01 Turcja 1
16.01 Turcja 2
22.01 Niemcy 1
23.01 Paragwaj 1
30.01 Argentyna 2 ................rafaw1
31.01 Wenezuela 1
styczeń/luty Ekwador 1
styczeń/luty Kolumbia 1
05.02 Niemcy 2
06.02 Austria 1 ....................aislinnek
06.02 Szwajcaria 1
06.02 Urugwaj 1
07.02 Argentyna 1 ................rafaw1
12.02 Polska 1
13.02 Chorwacja 1 ...............aislinnek
13.02 Czechy 1
13.02 Rumunia 1
26.02 Dania 1
27.02 Bułgaria 1
27.02 Słowacja 1
27.02 Słowenia 1
01.03 Rosja 1
13.03 Norwegia 1 .................PabloZet
kwiecień Szwecja 1 ..............aislinnek
 
kosa248 456

kosa248

Użytkownik
Proponuję kolejnym chętnym, aby zgłaszając się wybrali od razu jeden z poniższych zestawów:
I. Anglia 1, Anglia 2, Walia 1 ...................LukaszBONQ
II. Hiszpania 1, Hiszpania 2, Boliwia 1
III. Chile 1, Paragwaj 1, Ekwador 1
IV. Argentyna 1, Argentyna 2 ....................rafaw1
V. Kolumbia 1, Urugwaj 1, Wenezuela 1
VI. Niemcy 1, Niemcy 2, Szwajcaria 1
VII. Polska 1, Czechy 1, Słowacja 1 ...........Maciekfansport
VIII. Turcja 1, Turcja 2, Cypr 1
IX. Bułgria 1, Rumunia 1, Słowenia 1
X. Rosja 1, Ukraina 1, Białoruś 1 ...............asza
 
kosa248 456

kosa248

Użytkownik
wybieram zestaw IV
Świetnie ???? Dopisałem cię. Bliżej rozpoczęcia rozgrywek spodziewaj się ode mnie wiadomości z kilkoma drobnymi szczegółami (m.in. gdzie należy wysyłać pliki z danymi). Póki co masz wolne ????
 
edi8 9,1K

edi8

Forum VIP
kosa248 456

kosa248

Użytkownik
Maciekfansport i LukaszBONQ, cieszę się, że jesteście z nami ???? Jakiekolwiek pytania ślijcie na priv. Służę pomocą.

Maciekfansport
, moja odpowiedź powyżej do rafaw1 tyczy się także ciebie.
LukaszBONQ, na priv wyślę ci adres do przesyłania statystyk oraz pliki z danymi z twoich lig z okresu 1-7 stycznia, które już sam uzupełniłem ????
Aktualizacja:
Anglia 1 .........................LukaszBONQ
Anglia 2 .........................LukaszBONQ
Anglia 3 ..........................bryc123
Australia 1 ......................Jobdzik
Cypr 1
Egipt 1 ...........................aislinnek
Francja 1 ........................dominaspn
Francja 2 ........................dominaspn
Grecja 1 .........................PabloZet
Grecja 2 .........................kosa248
Hiszpania 1
Hiszpania 2
Izrael 1 ...........................kosa248
Katar ..............................kosa248
Meksyk 1 .........................PabloZet
Portugalia 1 ......................PabloZet
Portugalia 2 ......................kosa248
RPA 1 ..............................dominaspn
Szkocja 1 .........................bryc123
Szkocja 2..........................bryc123
Walia 1 ............................LukaszBONQ
Włochy 1 ..........................Jobdzik
Włochy 2 ..........................Jobdzik
15.01 Belgia 1 ...................Unleash
15.01 Chile 1
15.01 Holandia 1 ................Unleash
15.01 Holandia 2 ................Unleash
16.01 Boliwia 1
16.01 Turcja 1
16.01 Turcja 2
22.01 Niemcy 1
23.01 Paragwaj 1
30.01 Argentyna 2 ................rafaw1
31.01 Wenezuela 1
styczeń/luty Ekwador 1
styczeń/luty Kolumbia 1
05.02 Niemcy 2
06.02 Austria 1 ....................aislinnek
06.02 Szwajcaria 1
06.02 Urugwaj 1
07.02 Argentyna 1 ................rafaw1
12.02 Polska 1 .....................Maciekfansport
13.02 Chorwacja 1 ...............aislinnek
13.02 Czechy 1 ....................Maciekfansport
13.02 Rumunia 1
26.02 Dania 1
27.02 Bułgaria 1
27.02 Słowacja 1 ..................Maciekfansport
27.02 Słowenia 1
01.03 Rosja 1 .......................asza
05.03 Ukraina 1 ....................asza
????? Białoruś 1 ....................asza
13.03 Norwegia 1 .................PabloZet
kwiecień Szwecja 1 ..............aislinnek
 
kosa248 456

kosa248

Użytkownik
W załączniku znajduje się plik przedstawiający obecną zawartość bazy danych. Każde dwie kolumny dotyczą osobnego dnia, począwszy od 1. styczna (kolumny A i B) do dnia dzisiejszego (ostatnie dwie kolumny). Liczby obok lig oznaczają ilość spotkań z danej ligi w danym dniu.
Kolor zielony oznacza, że dane zostały zebrane. Kremowy - oczekuję na zebranie danych, zaś liga jest przydzielona konkretnej osobie. Czerwony - dane nie są zebrane, a liga nie jest nikomu przydzielona. Szary oznacza ligi, które nie są obecnie przewidziane do analizy, ale istnieje możliwość analizy, bo dane są dostępne (na flashscore bądź soccerway).
 
kosa248 456

kosa248

Użytkownik
ja cypr zrobię dodatkowo do zestawu mojego
Dzięki! Dobra robota, LukaszBONQ ????

dominaspn, zrobiłeś swój zestaw w ekspresowym tempie, super ????

W załącznikach zaktualizowany plik za 1-10.01 (mamy już praktycznie wszystko) oraz harmonogram na 11-17.01
 
cock 756

cock

Użytkownik
Kosa jakieś dane już masz, czy możesz je już wykorzystać i przedstawić pierwsze efekty swoich poszukiwań?

Wróciłem do Twojego pierwszego posta w tym temacie i nie wiem co chcesz liczyć? (...) Kurs z przeszłości na u/o chcesz przekuć w profit w przyszłości? Jak? Wystarczą obserwacje.

Masz moje votum zaufania, choć baardzo sceptycznie podchodzę do tego projektu...
 
kosa248 456

kosa248

Użytkownik
Kosa jakieś dane już masz, czy możesz je już wykorzystać i przedstawić pierwsze efekty swoich poszukiwań?
W drugiej części miesiąca, ok. 20 stycznia, przedstawię tutaj część tego, co jestem w stanie uzyskać z tak zebranych danych, na podstawie danych z pierwszych dwóch tygodni tego roku. Nie będą one obejmować wszystkich tych rozgrywek, które chciałbym, aby zostały ujęte, ale wspólnymi siłami trochę tych danych zbierzemy i pokażę Wam taką &quot;wersję demo&quot;.
Wróciłem do Twojego pierwszego posta w tym temacie i nie wiem co chcesz liczyć?
Nie widziałem jeszcze kompletu danych na oczy, a nawet gdybym je teraz wszystkie zobaczył, to sam nie wiedziałbym od razu, co konkretnie policzyć od a do z. Na pewno rozumiesz, że statystyka to nie jest tylko badanie jakichś konkretnych, uprzednio obmyślonych hipotez, ale też poszukiwanie różnych zależności, powiązań. Mam na wstępie kilka hipotez (których niestety nie będę w stanie sprawdzić na podstawie danych z dwóch-trzech tygodni), ale wiele kolejnych pojawi się podczas pracy z danymi. Nie mogę na przykład z góry założyć, że chcę zbudować model liniowy czegoś w zależności od czegoś, jeżeli nie wiem, czy jakaś zależność w ogóle istnieje i czy jest liniowa. Najpierw trzeba znaleźć zależność, żeby potem budować model.

Mój konkretny plan jest taki:

1. Napisanie algorytmów &quot;wyłuskujących&quot; różne rzeczy z danych. Przykład: mając minuty, w których padły bramki, mogę dla każdego meczu policzyć ilość goli w konkretnych przedziałach czasu, mogę &quot;wyłuskać&quot; czas pierwszego gola, czas jaki upłynął między jedną bramką a drugą, ilość goli w ostatnim kwadransie w meczach, w których jedna z drużyn grała w tym czasie w osłabieniu itd. Na pewno wiele rzeczy da się wyłuskać.
2. Graficzna prezentacja danych - na przykład jak rozkłada się ilość goli w zależności od przedziału czasu. Ogólnie - różne wykresy, histogramy... Patrząc na same liczby, a raczej na bardzo długie ciągi liczb, dużo trudniej znaleźć coś ciekawego, niż patrząc na ich graficzne przedstawienie
3. Statystyka opisowa - średnie, wariancje, skośności i wiele innych.
4. Pogrupowanie danych na grupy, w których statystyki jakiejś zmiennej (na przykład czasu pierwszego gola, średniego kursu na gospodarzy...) są podobne, potem analiza odrębnie w każdej z grup, czyli znów wykresy, histogramy itd.,
5. Porównanie tych wykresów, histogramów - czy zmieniają się czy nie, a jeżeli tak, to w jaki sposób. Wstępne wykrycie zależności &quot;na oko&quot;.
6. Zbadanie zależnych zmiennych od strony matematycznej - korelacje, kowariancje...
7. Próba dopasowania odpowiedniego modelu
8. Jeżeli coś dobrze się modeluje, próba dopasowania strategii, symulacje...

Oczywiście tę samą rzecz można badać globalnie (w obrębie wszystkich danych), jak i lokalnie (w obrębie wybranych lig, czy też przypadków spełniających jakieś kryteria).
 
cock 756

cock

Użytkownik
Dzięki za konkretną odpowiedź.
Sporo z rzeczy, które chcesz wydłubać widziałem kiedyś chyba na soccerway.
Podpowiem, co mnie by interesowało:
1. Model zależności kursu na ilość bramek w meczu w zależności od czasu, który pozostał na ich strzelenie, czyli wpisujesz minutę, strzelone gole i dostajesz info: u/o 1,5 kurs taki i taki, u/o 2,5 taki itd.
2. Średni czas zdobycia pierwszej bramki i kurs na gola w tej minucie.
3. Najcześciej padający dokładny wynik i średni kurs na ten rezultat.
4. Procent meczów z golem w ostatnich 3 minutach i średni kurs na to zdarzenie.
Sort by league &amp; total overwier.
To moim zdaniem najlepsze ziarenka do wyłuskania z tego worka danych. Dane stanowić będą punkt odniesienia do ewentualnych momentów wejścia w rynki bf. Kurs na giełdzie będzie łatwiejszy do handlu. Doskonale wiemy, że most popular ani wszystkiego nie wygrywa, ani nie jest gwarantem over 5,5. Masz jakieś inne plany?
Plan masz ambitny i stanowić może grunt pod mocny serwis o tematyce... ;)
 
kosa248 456

kosa248

Użytkownik
Sporo z rzeczy, które chcesz wydłubać widziałem kiedyś chyba na soccerway.
Możliwe, jednak przepisanie każdej z nich zajęłoby dużo więcej czasu, niż spisanie minut, w których padły bramki, a z tych minut można uzyskać też inne rzeczy i nie musimy wówczas polegać na danych na przykład z takiego soccerway ;)
1. Model zależności kursu na ilość bramek w meczu w zależności od czasu, który pozostał na ich strzelenie, czyli wpisujesz minutę, strzelone gole i dostajesz info: u/o 1,5 kurs taki i taki, u/o 2,5 taki itd.
(...)
4. Procent meczów z golem w ostatnich 3 minutach i średni kurs na to zdarzenie.
Do zrobienia ???? Właściwie punkt 4. jest szczególnym przypadkiem punktu 1.
2. Średni czas zdobycia pierwszej bramki i kurs na gola w tej minucie.
To zagadnienie to jest akurat ciekawa sprawa, bo załóżmy jeżeli średnią dla pierwszego gola będzie 25. minuta to błędny byłby wniosek, że jest 50% szans na pierwszą bramkę przed 25. minutą i 50% szans na pierwszą bramkę po 25. minucie.
Znając czasy padania bramek, można, dysponując odpowiednią ilością danych, wyliczyć prawdopodobieństwo, że pierwszy gol padnie przed czasem t dla dowolnego t.
Sprawa dokładnych wyników byłaby chyba najtrudniejsza. Na pewno trzeba byłoby rozważać przypadki w zależności od średniego kursu na faworyta.
Masz jakieś inne plany?
I. Analiza przypadków 1. i 4. z rozbiciem na sytuacje: brak czerwonej kartki w meczu/pokazana czerwona kartka w meczu oraz sprawdzenie wpływu ilości żółtych kartek i ewentualnie obecnego wyniku, bo na przykład może tak być, że w sytuacji, gdy faworyt (kurs sprzed meczu powiedzmy &lt;1,5) przegrywa jedną bramką lub remisuje, w końcówce pada więcej goli niż w ogólnej sytuacji. A może wręcz odwrotnie, bo słabsza drużyna skupia się tylko na obronie i ciężej o klarowne sytuacje...
II. Jak zmienia się oczekiwana częstotliwość goli w przyszłej fazie meczu w zależności od tego, ile goli było dotychczas w meczu. Z jednej strony byłoby ciekawie, gdyby się zmieniała, ale z drugiej, gdyby się nie zmieniała, to o wiele łatwiej byłoby modelować te zagadnienia 1. i 4.
III. Jak często drużyna &quot;wraca do gry&quot; po tym, jak przegrywała 0-1 w zależności od kursu i fazy meczu
 
kosa248 456

kosa248

Użytkownik
Do wszystkich uczestników projektu poza Jobdzik:
Ci, którzy mają już co robić - wykonujecie dobrą robotę ???? Sumiennie podchodzicie do zbierania danych i z wszystkimi z Was mam dobry kontakt. Cóż mogę rzec, oby tak dalej!
Ci, którzy jeszcze czekają na rozpoczęcie ich lig, niech wiedzą, że wszystko dobrze się rozwija.
Jobdzik, co do ciebie, nie wiem, dlaczego urwała się nasza korespondencja. Wysłałem ci przykładowy plik, później kręciłeś nosem, że wszystko jest nieczytelne, pytałeś, czy masz wpisywać posiadanie piłki i rożne, tak jakby nigdzie nie było to określone. Odesłałem cię do posta z jasną instrukcją i na tym się skończyło. Jak ci nie zależy na tej analizie danych, to lepiej będzie jak od razu mi powiesz, żebym przydzielił komuś innemu twoje ligi.

Jeżeli chodzi o mnie, dziś dowiedziałem się, że w przyszłym tygodniu mam 2 kolejne kolosy (razem 4 w przeciągu trzech dni :;/: ). Mam szansę, żeby być zwolnionym z dwóch egzaminów, więc się do nich przyłożę. W związku z tym nie będę mógł poświęcić na pisanie algorytmów i prezentację analizy danych tyle czasu, ile zakładałem. Dlatego oficjalna data prezentacji wstępnej analizy zebranych danych w tym temacie to 25-27 stycznia, zaraz po tym jak otrzymam dane z weekendu 22-24 stycznia.
Poza tym, co zostało przydzielone Jobdzikowi, wszystko z okresu 1-10 stycznia zostało zebrane. Dzięki jeszcze raz!
Tyle informacji na dzień dzisiejszy ;)
 
cock 756

cock

Użytkownik
Mam szansę, żeby być zwolnionym z dwóch egzaminów, więc się do nich przyłożę.
Super. Co priorytet, to priorytet. Z niecierpliwością czekam na pierwsze owoce ze zbiorów. Jestem ciekawy, czy da się to ugryźć i przekuć w profity.
 
kosa248 456

kosa248

Użytkownik
Super. Co priorytet, to priorytet. Z niecierpliwością czekam na pierwsze owoce ze zbiorów. Jestem ciekawy, czy da się to ugryźć i przekuć w profity.
A może dobierzesz jakieś 3 ligi i dołożysz małą cegiełkę do tego przedsięwzięcia? Jeszcze kilka osób by się przydało. Wystarczy poświęcenie 1-1,5h tygodniowo.
 
Do góry Bottom