/ / Czy w TraMineR istnieje sugerowany format lub podejście dla sekwencji o długości ponad 300 zdarzeń? - sekwencja, traminer

Czy w TraMineR istnieje sugerowany format lub podejście do sekwencji o długości ponad 300 zdarzeń? - sekwencja, traminer

Mam do czynienia z sekwencjami zdarzeń ze znacznikami czasuktóre mają ponad 300 wydarzeń. Dane te są podobne do dzienników internetowych, w których użytkownicy trafiają na różne strony witryny internetowej w różnym czasie. Jedna sekwencja może być jedną sesją internetową, a każde zdarzenie jest działaniem użytkownika (strona odwiedzin, przycisk kliknięcia itp.).

Po raz pierwszy użyłem formatu TSE. Podczas próby znalezienia podsekwencji za pomocą seqefsub () TraMineR zawiesił się. Ustawiłem maxk = 5 i zadziałało (ogranicza to długość podsekwencji do wyszukania do 5 zdarzeń). Jednak zawiesza się również maks. 6 lub więcej. Nie wiem, dlaczego ten nagły spadek. Poza tym, gdy przyciąłem sekwencje wydarzeń tylko na 15 wydarzeń, wszystko zakończyło się dobrze. Tak więc długość sekwencji zdarzeń jest tutaj problemem.

Czy istnieje inny format, który jest bardziej odporny na długość sekwencji, np. STS? Czy są jakieś inne zalecenia dotyczące postępowania z sekwencjami o tej długości w TraMineR?

Odpowiedzi:

1 dla odpowiedzi № 1

Problem nie ma nic wspólnego z formatem używanym do wprowadzania sekwencji.

TraMineR ma tylko podstawowy algorytm wyszukiwania podsekwencji.

Proponuję, abyś przyjrzał się bardziej odpowiednim narzędziom do twojego problemu. Rozważmy na przykład pakiet R arulesSequences.