Witam użytkowników forum,
Zwracam się do was z prośbą o pomoc. Tak się złożyło, że piszę pracę magisterską dotyczącą F1, dokładniej chodzi o "Wykorzystanie algorytmów genetycznych do rozwiązanie problemu optymalizacji" na przykładzie wyników wyścigów F1. W związku z tym, aktualnie przeprowadzam analizę danych, a konkretnie czasów uzyskiwanych na poszczególnych okrążeniach. Stworzyłem sobie więc tabelę czasów z okrążeń dla każdego zawodnika z zaznaczeniem tego na jakiej mieszance jechał kierowca, kiedy zjechał na postój itp.
Mój problem pojawia się w trakcie analizy degradacji opon, mianowicie stworzyłem tabelę, w której sprawdzam różnice w czasach kolejnych okrążeń zapisując stratę w porównaniu do okrążenia poprzedniego. Początkowo próbowałem to porównywać do najlepszego okrążenia w danym stincie, czy też do średniego tempa. Później jednak wziąłem pod uwagę, że czasy kierowców, którzy jadą blisko innego, lub też mają blisko za sobą przeciwnika będą zdecydowanie zakłamane. W tym celu przestałem brać pod uwagę czasy takich okrążeń, w których kierowca na przed lub za sobą inny bolid w granicy 1,5 sekundy. Tutaj moje pierwsze pytanie, czy taka granica waszym zdaniem jest w miarę dobra, czy zbyt mała? Próbowałem także ustawić tą granicę na poziomie 2 lub 3 sekund, jednak wtedy omijam większość czasów i tak na prawdę nie mam czego analizować.
Drugi problem to wahania czasów na okrążeniach. Wiadomo, że kierowcy nie pojadą po sznureczku każde kolejne okrążenie wolniejsze o jedną stałą różnicę czasową, jednak podczas obliczania tych różnic można zauważyć (pomimo dokonania wykluczeń opisanych wcześniej) wahnięcia na poziomie nawet 1,5 sekundy. Tutaj dodałem kolejny warunek, jeżeli różnica czasów na dwóch kolejnych okrążeniach jest na poziomie 0,7 sekundy to także tych okrążeń nie biorę pod uwagę (liczę tylko różnice czasów na poszczególnych okrążeniach, więc jak przykładowo 10 kierowców na okrążeniu numer "X" ma różnice czasowe w granicy od -0,2 do 0,5, a jeden lub dwóch ma różnicę 1,5 to zdecydowanie zaburza to wyliczanie średniej). Tutaj drugie pytanie, jakie według was można przyjąć "widełki" różnic między okrążeniami, żeby wyniki były miarodajne?
W celu ostatecznego obliczenia degradacji uśredniam różnice ze wszystkich zebranych stintów odrzucając dwie skrajne wartości (największa różnica na plus i największa różnica na minus).
Przykład takich obliczeń przedstawię na przykładzie GP Malezji 2014:
Tabela czasów:
Tabela czasów od startu wyścigu:
Tabela czasów po wykluczeniu tych w których ktoś ma blisko kierowcę przed lub za sobą (oznaczone jako "xxx"):
Lista stintów branych pod uwagę (na oponach miękkich):
Lista różnic czasowych na kolejnych okrążeniach po wykluczeniu tych opisanych w drugim problemie (oznaczone jako "wyk."):
dane w kolumnach za podwójną linią to kolejno średnia, średnia po odrzuceniu 2 skrajnych wyników (największy + i -) i średnia po odrzuceniu czterech skrajnych wyników.
Dzięki za pomoc.