/ / Gibt es in TraMineR ein vorgeschlagenes Format oder einen Ansatz für Sequenzen mit mehr als 300 Ereignissen? - Sequenz, Traminer

Gibt es in TraMineR ein vorgeschlagenes Format oder eine Vorgehensweise für Sequenzen mit mehr als 300 Ereignissen? - Sequenz, Traminer

Ich habe es mit zeitgestempelten Ereignissequenzen zu tunDas sind mehr als 300 Events. Diese Daten ähneln Webprotokollen, bei denen Benutzer zu unterschiedlichen Zeiten auf verschiedene Seiten einer Website zugreifen. Eine Sequenz kann eine Websitzung sein und jedes Ereignis ist eine Benutzeraktion (Seite besuchen, Schaltfläche anklicken usw.).

Ich habe zuerst das TSE-Format verwendet. Beim Versuch, mit seqefsub () TraMineR Subsequenzen zu finden, hing. Ich habe maxk = 5 gesetzt und es hat funktioniert (dies begrenzt die Länge der zu suchenden Teilsequenzen auf 5 Ereignisse). Es hängt jedoch auch maxK 6 oder höher. Nicht sicher, warum dieser plötzliche Abfall. Auch wenn ich die Ereignissequenzen auf eine Länge von nur 15 Ereignissen beschnitten habe, ist alles in Ordnung. Daher ist die Länge der Ereignissequenz hier ein Problem.

Gibt es ein anderes Format, das für die Sequenzlänge robuster ist, z. STS? Gibt es andere Empfehlungen für den Umgang mit Sequenzen dieser Länge in TraMineR?

Antworten:

1 für die Antwort № 1

Das Problem hat nichts mit dem Format zu tun, mit dem die Sequenzen eingegeben werden.

TraMineR hat nur einen rudimentären Algorithmus für die Suche nach Teilsequenzen.

Ich würde vorschlagen, dass Sie sich geeignete Tools für Ihr Problem ansehen. Betrachten Sie zum Beispiel das R-Paket arulesSequences.